Müəllif: CB Garcia və WI Zangwill

Booth Business School İdarəetmə Elmləri Müəllimləri (hər ikisi təqaüdə çıxdı)

Avqust 18, 2018-dan düzəldilmişdir (Garcia və Zangwill [8, 9]).

Keywords: Oyun nəzəriyyəsi, məhbus dilemması, bayesian, subyektiv ehtimallar

mücərrəd: Fon Neumann və Morgenstern (VNM), gözlənilən faydalı fərziyyədən istifadə edərək oyun nəzəriyyəsi probleminin əsaslı şəkildə formalaşmasını təmin etdi. Bununla birlikdə bu fərziyyəni əlavə fərziyyələr etmədən həll etmək çətindi. Nash, oyunçuların bir hərəkət etməsi ehtimalının B oyunçusunun bir hərəkət etməsi ehtimalından asılı olmadığı üçün oyunçuların ayrıldığını düşünməli idi. Bu yazıda Nash'ın fərziyyələrini, o cümlədən oyunçuların strategiyalarının ümumi bilik olduğu bir fərziyyəni ortadan qaldırırıq və ümumi VNM probleminə tam uyğun bir model təqdim edirik. Bizim asanlıqla həll oluna bilən tərtibimiz, tez-tez ziddiyyətli və əks təsir göstərən nəticələr verən, məsələn, məhbusun dilemmasına, toyuq oyununa, Newcomb paradoksuna, dik ova və digər oyunlara səbəb olan Nash yanaşması ilə əlaqəli bəzi çətinlikləri aradan qaldırır. Məsələn, məhbus dilemmasında Nash-in qarşılıqlı müstəqillik fərziyyəsini atmaqla, modelimiz oyunçuların daha yaxşı ödəmələrə nail olduqlarını nümayiş etdirir və buna nail olmaq üçün birgə oynamaq və ya ünsiyyət qurmaq lazım deyil, sadəcə Bayes teoremini üslubda tətbiq etmək lazımdır. (Harsanyi [10]; Kadane və Larkey [11]). Bizim yanaşmamız, ehtimal olunan məkanı nisbi ölçüsü ödəmələrdən asılı olan iki yarım sahəyə və ya bölgəyə bölür. İndi ehtimalını dəqiq qiymətləndirməyiniz lazım deyil, yalnız hansı bölgədə olduğunu müəyyənləşdirin. Bu əhəmiyyətli üstünlüklər təmin edir, çünki bir bölgə digərindən xeyli böyükdürsə, bu dərhal oyunun necə qurulacağına dair əsaslı fikir verir. Korrelyasiya olunmayan ümumi həll yolumuz Aumann [1] mənasında xüsusi həll kimi Nash tarazlığını ehtiva edir. Təsviri Nash həllərindən fərqli olaraq, həll yolumuz oyun nəzəriyyəsi üçün yeni bir zəmin verən rasional gözləntilərin təmiz strategiyasıdır. Rok-kağız-qayçı oyununda və bar-sıxma problemində göstərdiyimiz kimi, ümumi M-Adam oyunlarına yanaşmamızı genişləndiririk.

Nəticələrin xülasəsi.

İndi aşağıda göstərilən detallara və açıq ödəmələrə əsaslanaraq bəzi nəticələri ümumiləşdiririk. İnanırıq ki, bu nəticələr tədris və tədqiqat üçün yanaşmamızın dəyərini göstərir, çünki nəticələr tez-tez yeni həllər təqdim edir.

Koordinasiya oyunuMüstəqillik Nash fərziyyəsi Bayesian'ın aldığımız üstünlüyü əldən verir. Aşağıda verilmiş ödəmələr üçün rəqibin ilk strategiyasını oynamaq ehtimalı ən az 1 / 3 olduğuna inanırsınızsa, ikinci strategiyanı oynayın. Nash, hansı strategiyanı tətbiq edəcəyi barədə heç bir məlumat vermir. Ayrıca, geri ödəmələr dəyişdirilərsə, yanaşmamız yenidən nəzərdən keçirilmiş ehtimalları təmin edir. Cinslərin döyüşü: İki tərəf getməli olduqları yerlərdə fərqlənirlər, lakin ünsiyyətə icazə verilmir. Hər iki tərəf eyni seçimə gedərsə yaxşı bir pay alır, çünki ən azı ikisi birlikdə olur. Hər ikisi də həmin partiyanın seçiminə gedərsə, verilmiş tərəf bonus qazanacaqdır. Fərqli yerlərə getdikləri təqdirdə də yaxşı bir pay almaz. Aşağıda təqdim olunan ödəmələri nəzərə alsaq, A oyunçu digər oyunçunun da ən az 33% ehtimalı ilə A-nın istədiyi seçimini seçəcəyinə inandığı təqdirdə istədiyi strategiyasını oynamalıdır. Bunun əksinə olaraq, Nash nə vaxt oynayacağını və ehtimalların analizini aparmadan üç tarazlıq təmin edir. Uyğun pul mükafatları: İki oyunçu, Hətta və Odd eyni vaxtda bir qəpik ortaya qoyur. Pennies uyğun gəlirsə, Hətta hər iki qəpiyi də saxlayır; əks halda Odd hər ikisini də saxlayır. Bu sıfır cəmi oyun üçün unikal Nash tarazlığı hər iki oyunçunun təsadüfi oynaması üçündür. Aşağıdakı ödəmələri nəzərə alsaq, Odd ən az 50% ehtimalı olan başları oynayacağına inandığı təqdirdə də başları oynamalıdır. Digər tərəfdən, Hdd ən çox 50% ehtimalı olan başları oynayacağına inandığı təqdirdə başları oynamalıdır. Toyuq oyunu: İki avtomobil bir-birinə tərəf sürətlənir və başlarında qəza olur. Nash, bir avtomobilin yerindən tərpənməsini, digərinin isə düz getməsini təklif edir, ancaq yerindən tərpənməli olan bir az fikir verir. Aşağıdakı ödəmələri nəzərə alsaq, yanaşmamızın, rəqibin ən çox 90% ehtimalı ilə yer alacağına inansanız, düz yola getməyinizi təklif edirik. Burada hər iki oyunçunun (ya da hər ikisinin düz getməsinin) bir Nash tarazlığı olmadığını, lakin hər iki oyunçunun rəqibin düz (və ya kənara) getməsini gözləyən bir tarazlıq ssenarisi olduğuna diqqət yetirin. Ayrıca, ödəmələr dəyişdirilərsə, yanaşmamız yenilənmiş ehtimalları təmin edir. Silah Yarışı: Hər bir ölkə əvvəlcə hücum edilməməsi üçün silah yığır. Ancaq aşağıda göstərildiyi kimi, silah ehtiyatlarının azalması azalması sülh müqaviləsi üçün bir fürsət açır. Nash sülh müqaviləsi üçün fürsəti müəyyənləşdirmir. Ov ovlamaq: Rəqibin ən az 50% ehtimal ilə ləkə ovladığına inansanız, ov lövhəsi, başqa bir ov dovşan. (Təmiz Nash tarazlığı hər ikisini ovlamaq və ya hər ikisini dovşan ovlamaq üçündür). Newcomb problemi: əgər Newcomb problemi bir məhkumun dilemması kimi ortaya qoyulursa, Newcomb probleminin həlli iki yolla əldə edilə bilər: üstünlük prinsipindən istifadə edərək kooperativ olmayan Nash tarazlığı və ya gözlənilən kommunal hipotezdən istifadə edərək kooperativ həll yolu. Qaya-kağız qayçı oyunu: 3 tərəfli təsadüfi olaraq ölmək üçün Nash tarazlığı. Rəqibinizin ən çox 33% və ən az 33% ehtimalı olan qayçı ilə kağız oynayacağına inansanız, bu qədim oyun üçün yeni bir strategiya olaraq görünən; rəqibinizin ən çox 33% və ən az 33% ehtimalı olan qaya oynayacağına inansanız, kağız oynamaq; başqa qayçı oynamaq. (Deyirsinizsə, yanaşmamız sizə kömək edə bilər. Rəqibinizin oyunun əvvəlki oyunları haqqında məlumatınız var.) Bar-dolma oyununda 3 dostun A, B və C var: Barda tək başına gedən hər kəs heç bir şey əldə etmir - evdə qalmaq daha yaxşı seçim. İki dost bara gedirsə, bu ən yaxşı seçimdir. Üçü gedərsə, bar hər üçü kənara atır. Nash tarazlığı hamının evdə qalması və ya hamının ilk strategiyasını 33% -ə bərabər olma ehtimalı ilə oynaması üçündür. Ancaq dostlarınıza dair hər hansı bir anlayışınız varsa və Bayesianın davranış ehtimallarını qiymətləndirə bilsəniz, strategiyamız kömək edə bilər.

M-şəxs oyununa yanaşmamızı da genişləndiririk və oxşar fikirlər əldə edirik. Məsələn, ümumi 2 nəfərlik oyunlar və ümumi 3 şəxslərin x 2 strategiya oyunları üçün tam həllini göstəririk.

Gözlənilən kommunal hipotez.

Bir 2-Şəxs oyununda A və B oyunçularına 2 strategiyaları verilsin: A oyunçu üçün A1 və ya A2, B oyunçusu üçün B1 və ya B2.

Gözlənilən kommunal nəzəriyyənin əsası von Neumann - Morgenstern kommunal teoremidir (von Neumann və Morgenstern [20]): qoy Aij və Bij, A oyunçusu Ai oynayırsa və B oyunçu Bj oynayırsa, müvafiq olaraq A və B oyunçulara verin. , j = 1 və ya 2. Gözlənilən kommunal fərziyyə A və B oyunçularının gözlənilən ödəmələrini maksimum dərəcədə artırması lazım olduğunu bildirir: 1:

burada pA (Ai və Bj) A oyunçusunun A'nın Ai və B'y oynayacağı ehtimalı və B oyunçusu üçün də olduğu kimi.

Şərti ehtimallar[1].

Bizim yanaşmamız üçün biz düşmək Nash, oyunçuların ehtimallarının qarşılıqlı müstəqil olduğuna dair fərziyyəsidir. Bu, problemimizin (1) daha ümumi olmasına və gözlənilən kommunal fərziyyəni təmin edən daha çox həll yolu tapmasına imkan verir.

EP (A | Ai) və EP (B | Bj) gözlənilən ödəmələr olsun[2],[3] A və B-nin A, A-nın B və Bj oynadıqlarını nəzərə alsaq, i, j = 1, 2 üçün:

Bir sübutla başlayaq elementar "Bayesian" oyun teoremi bu VNM formalaşdırılmasına yanaşmamızın bərabərliyini nümayiş etdirir:

Teorem 1[5]. Aşağıdakı problemlər (3) problemlərə (1) bərabərdir[6]:

Sübut. Bayes teoremi ilə,

Sonra,

Maksimum[7] Yuxarıdakı tənliyin PP (A1) = 1 (yəni EP (A | A1) ≥ EP (A | A1) və ya pA (A2) = 1 (yəni, strategiya A0) EP ( A | A2) EP (A | A2). Beləliklə, (3) oyunçu A üçün tutur. BQED oyunçusu üçün oxşar bir arqument var

VNM Bölgələri.

VNM A1 və A2 bölgələrini konveks politopları olaraq təyin edin:

Aşağıda göstərildiyi kimi, A B A1 bölgəsində olacağını gözləyirsə A1 strategiyasını oynamalıdır. Əks təqdirdə A A2 oynamalıdır. Tarazlıq xətti

ehtimal sahəsini iki bölgəyə ayırır və vəziyyəti təhlil etmək üçün vizual olaraq faydalı bir vasitə təmin edir[8].

Bölgələrin əhəmiyyəti: İki bölgə praktik olaraq əhəmiyyətlidir, çünki indi ehtimalını dəqiq qiymətləndirməyə ehtiyac yoxdur, yalnız iki bölgədən hansının olduğunu müəyyənləşdirmək lazımdır. Tez-tez, əvvəlcədən ehtimalın bir bölgədə olacağı görüləcəkdir , və bölgənin müəyyənləşdirilməsi oyunun müvafiq oyununu təklif etmək üçün kifayət qədər məlumatdır. Məsələn, A1 bölgəsinin digərindən xeyli böyük olduğunu düşünün, buna görə A1 bölgəsində olma ehtimalı olduqca yüksəkdir. Bu, A oyunçusunun çox güman ki A1 oynayacağı barədə cəlbedici məlumat verir.

B üçün analoji olaraq:

VNM bölgələri oyunçuların əvvəlcədən ehtimal paylanmalarından asılıdır, onlar adətən əvvəlcədən adlandırılanlar (Jaynes [13]; Harsanyi [10]; Kadane və Larkey [11]), bu oyunçuların ehtimal paylanmasına dair inamlarını ifadə edir. rəqibi. [9]

2 ölçülü. Verildiyi halda (3), A oyunçusunun VNM bölgəsində A1 olacağını gözlədiyi təqdirdə A1 strategiyası oynayır. Else, A strategiyası A2 oynayır. Eynilə, B, A oyunçusunun VNM bölgəsində B1 olacağını gözlədiyi təqdirdə B1 strategiyasını oynayır. Else, B B2 strategiyasını oynayır.

Sübut. EP (A | A1) ≥ EP (A | A2) və yalnız A1 olduqda1 pA (B1 | A1) + A12 pA (B2 | A1) ≥ A21 pA (B1 | A2) + A22 pA (B2 | A2) əgər və yalnız (A11 - A12) pA (B1 | A1) + (A21 - A22) pA (B2 | A2) + A12 - A21 ≥ 0.

Eynilə EP (B | B1) ≥ EP (B | B2) və yalnız B1 olarsa1 pB (A1 | B1) + B21 pB (A2 | B1) ≥ B12 pB (A1 | B2)

+ B22 pB (A2 | B2) əgər və yalnız (B11 - B21) pB (A1 | B1) + (B12 - B22) pB (A2 | B2) + B21 - B12 ≥ 0. QED

Teorem 1 və Corollary 2-dan bölgələrdəki nöqtələr üçün (5) və (7) gözlənilən faydalı fərziyyə tutur, yəni VNM bölgələri 2-Şəxs oyununun ümumi həllini təyin edir.[10].

Kirpik tarazlığı.

Oyunçuların ehtimalları bir-birindən müstəqildirsə, VNM bölgələri asanlaşdırılır:

Təklif 3. Tutaq ki, bir Nash tarazlığı (p (A1), p (B1)) bəzi i, j = 1, 2 üçün müvafiq olaraq VNM bölgəsində Ai və VNM bölgəsi Bj'dədir. Sonra A oyunçusu Ai strategiyasını, B oyunçu isə strategiya oynayacaq

Bj.

Sübut. Nash tarazlıq problemi problemdir (1), burada pA (Ai və Bj) = pB (Ai və Bj) = p (Ai) p (Bj) və ya problem (3), burada pA (Bj | Ai) = p (Bj) ) və i, j = 1, 2 üçün pB (Ai | Bj) = p (Ai). Beləliklə, PN (B2) = p (B8) və pB (A1) = p (A1) üçün VNM bölgələri (1) ilə müəyyənləşdirilən Xolum 1 saxlayır. QED

Xatırladaq ki, tarazlıq tənlikləri

VNM bölgələrini ayırın, bununla da hər hansı bir oyunun ümumi həllini tapın. Aşağıdakı cədvəldə göstərdiyimiz kimi pB (A1) = p (A1) və pA (B1) = p (B1) olan eyni tarazlıq tənlikləri verir.

Təklif 4. Hər hansı bir oyunu nəzərə alsaq A = [[A11, A12], [A21, A22]] və B = [[B11, B12], [B21, B22]], oyun üçün Nash tarazlığı Cədvəl 112 tətbiq olunan sıra hesablanır.

Sübut. (İ, j) sgn (2i - 1) * (A11 - A21)> 0 və sgn (2j - 1) * (B11 - B12)> 0, i, j halında təmiz Nash tarazlığının olmasına diqqət yetirin. = 0, 1. Bu həqiqəti istifadə edərək, Cədvəl 1-dakı hər bir sıra üçün, təmiz Nash tarazlığı olan bütün cütləri (i, j) sadalayırıq.

Nəhayət, (9) tərəfindən təyin olunan (a, b) cütlüyün qarışıq Nash tarazlığı olması üçün yalnız 0 <a <1 və 0 <b <1 'olduğunu göstərməliyik. Lakin 6, 7, 10 və 11 cədvəl 1, a, 1 - a, b və ya 1 - b ədədləri və məxrəcləri həm müsbət, həm də mənfi olduğunu; buna görə a, 1 - a, b, 1 - b hamısı 0-dan daha böyükdür. QED

İterated Dominance Misal[13].

A = [[2, 2], [3, 1]] və B = [[0, 1], [0, 2]] edək. "Play A1 & B2" Nash tarazlığıdır.

Təklif 5. A = [[2, 2], [3, 1]] və B = [[0, 1], [0, 2]] nəzərə alsaq, A oyunçu A1 oynayacaq, B oyunçu B2 oynayacaq.

Sübut. VNM bölgəsi A1: pA (B2 | A2) ≥ 1 / 2, VNM bölgəsi B2 isə: pB (A2 | B2) ≥ -1. Beləliklə, B oyunçusu B2 oynayacaq. A oyunçu da bunun belə olduğunu bilir, buna görə pA (B2 | A2) = 1. PA (B2 | A2) = 1 VNM bölgəsindəki A1 nöqtəsidir, A oyunçu A1 oynayır. QED

Koordinasiya nümunəsi.

A = B = [[2, 0], [0, 1]] edək. 3 Nash tarazlıq nöqtələri var: "A1 və B1 oynayın", "A2 və B2 oynayın" və "1 / 1 ehtimalı olan A1 (və ya B3) oynayın". VNM bölgəsi A1: 2pA (B1 | A1) ≥ pA (B2 | A2) və VNM bölgəsi B1: 2pB (A1 | B1) ≥ pB (A2 | B2). Bu VNM bölgələrini vizual olaraq analiz edərək, A və B, ehtimal ki, A1 və B1 strategiyalarını seçəcəkdir.

Təklif 6. A = B = [[2, 0], [0, 1]] nəzərə alsaq, oyunçuların ehtimalları qarşılıqlı müstəqildirsə, rəqibin ilk strategiyasını oynamaq ehtimalının ən azı 1 / olmasına inanırsınızsa, ilk strategiyanı oynayın. 3, başqa ikinci strategiyanı oynayın.

Sübut. VNM bölgəsi A1: pA (B1) ≥ 1 / 3 və VNM bölgəsi B1 belədir: pB (A1) ≥ 1 / 3. QED

Cinslər nümunəsi döyüşü.

A = [[3, 1], [1, 2]] və B = [[2, 1], [1, 3]] edək. 3 Nash tarazlıq nöqtələri var: "A1 və B1 oynayın", "A2 və B2 oynayın" və "1 / 2 ehtimalı ilə A3 oynayın, 1 / 1 ehtimalı ilə B3 oynayın". VNM bölgəsi A1: 2pA (B1 | A1) ≥ pA (B2 | A2) və VNM bölgəsi B1: pB (A1 | B1) ≥ 2pB (A2 | B2). A daha çox A1, B isə B2 seçərdi.

Təklif 7. A = [[3, 1], [1, 2]] və B = [[2, 1], [1, 3]] nəzərə alınmaqla, oyunçuların ehtimalları bir-birindən müstəqildirsə, onda: A1 ifa pA (B1) ) ≥ 1 / 3, başqa A2 oynayır; pB (A1) ≥ 1 / 2, B3 oynayırsa B2 oynayın.

Sübut. VNM bölgəsi A1: pA (B1) ≥ 1 / 3 və VNM bölgəsi B1: pB (A1) ≥ 2 / 3. QED

Uyğun Pennies Misalı.

A = [[1, -1], [-1, 1]] və B = [[-1, 1], [1, -1]] edək. Bu sıfır məbləğli oyunda qarışıq Nash tarazlığı var: "1 / 1 ehtimalı ilə A2 oynayın, 1 / 1 ehtimalı ilə B2 oynayın".

Təklif 8. A = [[1, -1], [-1, 1]] və B = [[-1, 1], [1, -1]] nəzərə alınaraq, oyunçuların ehtimalları bir-birindən müstəqildirsə, deməli: A1 oynayın əgər pA (B1) ≥ 1 / 2, başqa A2 oynayır; pB (A1) varsa B1 oynayın 1 / 2, başqa B2 oynayın[14].

Sübut. VNM bölgəsi A1: pA (B1) ≥ 1 / 2 və VNM bölgəsi B1 belədir: pB (A1) 1 / 2. QED

Toyuq Oyunu Nümunəsi (Sugden [19]).

A = [[0, -1], [1, -10]] və B = [[0, 1], [-1, -10]] edək. Nash tarazlığı "A1 (əymək) və B2 (düz getmək)", "A2 oynamaq (düz getmək) və B1 (kavrama)" və "1 ehtimalı olan A1 (B0.9) oynamaq" dir.

Təklif 9. Toyuq oyununda, oyunçuların ehtimalları bir-birindən müstəqildirsə, deməli: rəqibin ən çox 90% ehtimalı ilə yer alacağına inanırsınızsa, düz gedin.

Sübut. VNM bölgəsi A1: pA (B1) + 11pA (B2) ≥ 2, və ya pA (B1) ≤ 9 / 10. Eynilə, VNM bölgəsi B1 belədir: pB (A1) ≤ 9 / 10. QED

Rəqibinizin həddindən artıq həvəs göstərdiyinə diqqət yetirin (ən azı 90%), onda düz getməlisiniz.

Tercih edilən ssenari: Oyunçular düz getməkdən daha çox əyləşirlər.

Toyuq ssenarisi: Tutaq ki, pA (B1) = pB (A1) = 0. Hər iki oyunçu digər oyunçunun düz getməsini gözləyirlər. Hər ikisi yerindən tərpənəcək.

Fəlakət ssenarisi: Tutaq ki, pA (B1) = pB (A1) = 1. Hər iki oyunçu digər oyunçunun qol buraxacağını gözləyirlər. Hər ikisi düz gedəcək[15].

Nash tarazlığı ssenarisi: Tutaq ki, pA (B1) = 1 - pB (A1) və pB (A1) = 0 və ya 1. Digər oyunçunun düz getməsini gözləyən oyunçu gedəcək, digər oyunçunun da zərbə alacağını gözləyən oyunçu düz gedəcək.

Silah Yarışı Nümunəsi.

Təklif 9-də x, y ≥ 0 üçün A = [[1, -x], [10, -0x]], B = [[1, 10], [-y, -0y]] edək. Qoy A1 və ya B1 “sülh axtaraq” və A2 və ya B2 “nüvə hücumu” olsun. X və y dəyərləri müvafiq olaraq B və A silah ehtiyatlarını göstərir.

A ölkəsi, B ölkəsinin hücum ehtimalı 1 / (9x + 1) -dən çox olduqda sülh istəyir. əks halda bir hücum. Ehtimal əyri pA (B1) = 1 / (9x + 1) sürətlə aşağı düşür, məsələn, x = 1 / 1-də pA (B2) = 1 / 9, lakin tezliklə kəskin şəkildə düzəldilir: B əvvəlcədən sürətlə yığılmalıdır, lakin əyri kimi. yastı, silah yığmaq üçün B-yə çox az fayda verəcəkdir.

Eynilə B ölkəsi üçün də.

Xülasə, hər bir ölkə əvvəlcə hücuma məruz qalmamaq üçün silah yığır. Lakin sürətlə azalan silah ehtiyatlarının azalması sülh müqaviləsi istədiyi bir fürsət açır.

Bir nümunə olaraq, 2018 təxmin edilən qlobal nüvə anbarını nəzərdən keçirin[16] Cədvəl 2.

Yuxarıdakı ödəmələrə və 2 Cədvələ əsaslanaraq, rasional Şimali Koreya ABŞ və Rusiya ilə sülh müqaviləsi istəməlidir.

Skyrms [16]).

A = [[4, 1], [3, 2]] və B = [[4, 3], [1, 2]] edək. Nash tarazlığı "A1 (Stag) və B1 (Stag)", "A2 (Hare) və B2 (Hare) oynamaq" və "1 ehtimalı ilə A1 (B0.5) oynamaq" dir.

Təklif 10. Balıq ovunda, oyunçuların ehtimalları bir-birindən müstəqildirsə, onda: rəqibin ən az 50% ehtimalı olan ləkəni ovlayacağına inansanız, ov ov.

Sübut. VNM bölgəsi A1: 3pA (B1) + pA (B2) ≥ 2, ya da pA (B1) ≥ 1 / 2. Eynilə, VNM bölgəsi B1 belədir: pB (A1) ≥ 1 / 2. QED

Məhkum dilemması[17].

A12 <A22 <A11 <A21 və B'nin A nəqli bərabər olmasına icazə verin. A11 <A21 və A12 <A22 olduğundan, üstünlük prinsipinin istifadəsi Nash tarazlığına, yəni qeyri-kooperativ həll 'oynayır A2 (qüsur) və B2 (qüsur) ”. Lakin A22 <A11, A və B hər ikisi "A1 (səssiz) və B1 (səssiz) oynayın" kooperativ həllini oynasalar, daha yaxşıdır.

Təklif 11. Məhbus dilemmasında, oyunçuların ehtimalları bir-birindən müstəqildirsə, oyunçular kooperativsiz oynayırlar[18].

Sübut. VNM bölgəsinin A1 sol tərəfinə nəzər salın:

(A11 - A12 - A21 + A22) səhA(B1) + A12 - A22.

A11 - A12 - A21 + A22 ≤ 0, onda (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ A12 - A22 <0. Digər tərəfdən A11 - A12 - A21 + A22> 0, onda (A11 - A12 - A21 + A22) sA(B1) + A12 - A22 ≤ (A11 - A12 - A21 + A22) + A12 - A22 = A11 - A21 <0. Beləliklə, A oyunçusu üçün hər hansı bir əvvəlcədən, VNM bölgəsi A1 null dəstdir, buna görə 2 strategiyasını oynamalıdır.

Eynilə, B oyunçusu 2 strategiyasını oynamalıdır. QED

Təklif 11, müstəqillik fərziyyəsinin bizi kooperativ olmayan həll yolu məhdudlaşdıracağını açıq şəkildə göstərir.

Klassik məhkumun dilemması nümunəsi.

Klassik məhbus dilemmasında A = [[-1, -3], [0, -2]] və B = [[-1, 0], [-3, -2]].

Təklif 12. Klassik məhbus dilemmasında, oyunçuların üstünlükləri aşağıdakılardır: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2, pB (A1 | B1) + pB (A2 | B2) ≥ 3, then 2) oyunçular kooperativ həll19 oynayacaqlar.

Sübut. VNM bölgəsi A1: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2, VNM bölgəsi B1 belədir: pB (A1 | B1) + pB (A2 | 2 | XXUMX | Beləliklə, verilən üstünlüklər üçün A və B oyunçuları birgə həll yolunu oynamalıdırlar. QED

Təklif 12-da, kooperativ həllini oynamaq üçün tələb olunan yüksək çubuğu qeyd edin. Oyunçular kooperativ olmayan həll yolunu seçməyi üstün tuturlar.

Nash yanaşmasının kooperativ strategiyasını oynamağı düşünmədiyi bir məqam.

A11 - A12 = A21 - A22, A2 olduğu yerlərdə məhkumun dilemmasına baxın1 = A11 + m və A22 = A11 - M, burada m> 0 kiçikdir və M> 0 çox böyükdür. Məsələn, A = [[100, -3], [101, -2]]. Təklif 11-dan xatırladaq ki, oyunçuların ehtimalları bir-birindən müstəqildirsə, oyunçular kooperativsiz oynayacaqlar.

Göründüyü kimi, oyunçuların 1 strategiyasını oynamağı düşünməmələri ağılsızlıq olardı, çünki bir oyunçu 2 oynayırsa, digər oyunçunun da 2 oynadığı şans əhəmiyyətli bir itki verəcəkdir, buna görə nə üçün risk edir. Aydındır ki, Nash yanaşması oynamaq üçün açıq həll yolu olsa belə, kooperativ həll yolunu oynamağı düşünmür - sözdə çox vacib bir məqam, ümumi iqtisadi tarazlıq modellərindəki bazar bölgüsünün müzakirəsi.

Digər tərəfdən, növbəti təklifdə göstərildiyi kimi, müstəqillik fərziyyəsini atmaqla, yanaşmamız kooperativ olmayan həll yox, kooperativ həll rolunu oynayacaqdır.

Qara xətt klassik məhbus dilemması üçün laqeydlik xəttidir. Bir oyunçunun strategiya oynamaq üçün bölgədə olma ehtimalı çox olduğuna görə 2 strategiyasını oynamaq ehtimalı daha yüksəkdir

1.

Yaşıl xətt məhkum dilemmasının bu misalı üçün laqeydlik xətti: pA (B1 | A1) + pA (B2 | A2) = 1 + m / ((M + m). Budur, 1 strategiyası üçün ehtimal bölgəsinin ölçüsü 2 strategiyası üçün demək olar ki. Bizim yanaşmamız oyunçulara 1 oyun strategiyasını düşünməyi tövsiyə edir.

Təklif 13. A11 - A12 = A21 - A22, A2 olduğu bir məhkumun dilemması nəzərə alınmaqla1 = A11 + m və A22 = A11 - M, burada m> 0 kiçikdir və M> 0 çox böyükdür, A və B oyunçuları kooperativ həll 20 oynayacaqdır.

  • Buna görə oyunçular kooperativ olmayan həll yolu oynamayacaqlar.
  • Hal-hazırda kooperativ həll yoluna çatmaq üçün fərziyyələr əlavə olunur, məsələn, məhdudlaşdırılmış rasionallıq, natamam məlumatlar (Aumann və Maschler [2]; Acevedo və Krueger [4]; Daley Given A-nın gözlənilən birgə ehtimalları pA (Ai və Bj), A bu nəticəyə gəlmişdir pA (A1 və B1) 1-a yaxın olmalıdır.Buna görədir ki, A və B strategiyaları 1 oynayacaqlar, burada ödəmələri olduqca yüksəkdir və maksimumdan yalnız m ədəd azdır.

Buna görə pA (B1 | A1) = pA (A1 və B1) / pA (A1) 1-a yaxın olmalıdır.

A eyni zamanda pA (A2 və B2) qənaətinə gəlir pA (A2 və B1), B strategiyası 2 oynayırsa, 2 strategiyasını oynamaq ehtimalı daha yüksəkdir. Beləliklə pA (B2 | A2) = pA (A2 və B2) / (pA (A2 və B1) + pA (A2 və B2)) 1 / 2. Şəkil 1 istifadə edərək, B-nin VNM bölgəsi A1 içərisində kifayət qədər olduğu qənaətinə gəlir. Eynilə, B 1 strategiyasını oynayacaqdır. QED

Məhkumun dilemmasının bir versiyası kimi Newcomb'ın paradoksu.

Məşhur Newcomb'nın paradoksunda (Wolpert and Benford [21]) bir proqnozçu B, bir oyunçu A və bir qutu X var. A oyunçusuna X qutusunu və ya X qutusunu və 1,000 $ qutusunu götürmək seçimi verilir. A seçim etməzdən əvvəl B, A-nın nə edəcəyini proqnozlaşdırır və B-nin proqnozları demək olar ki, müəyyəndir. B, A'nın yalnız X qutusunu alacağını proqnozlaşdırırsa, B $ 1,000,000-ı X qutusuna qoyur. Bu vəziyyətdə qutuda 1,000,000 $ olduğu üçün A $ 1,000,000 və ya $ 1,001,000 alacaq. X plus 1,000 dollar. Digər tərəfdən, B, A qutusunun X və 1,000 $ alacağını proqnozlaşdırırsa, B, X qutusuna heç bir şey qoymur. Bu vəziyyətdə, seçimindən asılı olaraq, A ya 1,000 dollar alır və ya heç bir şey almır.

Newcomb'nın paradoksu, iki mükəmməl rasional təhlil A oyunçusunun optimallaşdırma probleminə ziddiyyətli cavablar verməsidir: gözlənilən faydalı fərziyyəyə əsasən, A oyunçu yalnız X qutusunu götürməlidir, çünki X almasının gözlənilən ödənişi daha yüksəkdir. Digər tərəfdən, üstünlük prinsipinə əsasən, A oyunçu X qutusundan əlavə 1,000 dollar almalıdır.

Paradoksu (Wolpert and Benford [21]) bir keçid yaxşı başa düşür: “... Newcomb yalnız X-ni alacağını söylədi; Tanrıya bənzər bir varlıqla niyə mübarizə aparırsan? Ancaq Nozick, 'Demək olar ki, hər kəs üçün, nə edilməli olduğu aydın və aydındır. Çətinlik odur ki, bu insanlar problem üzərində demək olar ki, bərabər şəkildə bölünür, əksinə, qarşı tərəfin sadəcə səfeh olduğunu düşünürlər. '... ".

Wolpert və Benford, Newcomb probleminin əslində fərqli ehtimal nəticələri ilə iki fərqli oyun olduğunu göstərərək paradoksu həll edir.

Bu hissədə, Newcomb problemini bir məhkumun dilemması kimi qələmə verərək paradoksu həll edəcəyik. Bununla da Newcomb probleminin həlli iki yolla əldə edilə bilər: üstünlük prinsipindən istifadə edərək qeyri-kooperativ həll (qutu X + 1,000 qutusunu götür) və ya gözləniləndən istifadə edərək kooperativ həll (yalnız X qutusunu götür) faydalı fərziyyə.

Aşağıdakı oyunu verərək proqnoz verən B üçün ödəmə matrisini maliyyələşdirməyi vəd edən bir zəngin köməkçi var deyək: A = [[$ 1,000,000, 0], [$ 1,001,000, $ 1,000]] və B = [[$ 1,000,000, $ 1,001,000 ], [0, $ 1,000]].

B düzgün proqnozlaşdırırsa, B A oyunçunun nə alacağını alır. Ancaq B səhv bir şəkildə proqnozlaşdırarsa, B, A əldə edən 1,001,000-ı çıxmadan 21 dollar alır.

Təklif 13-dan, A və B oyunçuları bu oyunda birgə oynayacaqlar.

Nash kimi varsa, oyunçu üstünlük prinsipindən istifadə edərək problemi həll edir, proqnoz verən də. Həm proqnozçu, həm də oyunçu kooperativ olmayan həll yolunda olacaq: X plus 1,000 dollar götürün. Oyunçu gözlənilən yardım fərziyyəsini istifadə edərək problemi həll edərsə, proqnozçu da, həm proqnozçu, həm də oyunçu kooperativ həll yolunda olacaq: yalnız X götür. Hər iki halda da proqnozçunun proqnozu

və Sadowski [6]) və ya yeni metodlar təsvir edilmişdir, məsələn, tit-tate, korrelyasiya edilmiş tarazlıq (Axelrod [3]; Aumann [1]).

21 Qeyd edək ki, Newcomb problemini PD problemi kimi təqdim edərək, proqnozçuya Newcomb problemində olmayan fərdi təşviq verilir.

müəyyən. Təklif 13-dan, oyunçuların kooperativ olmayan həll yolu oynamayacaqları üçün, Newcomb-un əməkdaşlığın aparılmasının açıq strategiyası olduğuna razıyıq.

Şəkil 1-da qeyd edin, lakin əməkdaşlıq üçün bölgə, qeyri-əməkdaşlıq üçün olduğundan daha kiçikdir. İnsanlar hansı strategiyanı bərabər şəkildə bölsələr, o zaman bizə təəccüblü deyil.

Məhkum Dilemma'nın M-Şəxslərə Bir Ümumiləşdirilməsi.

Nash həllinin ümumi iqtisadi tarazlıq modellərində necə pozulacağını daha yaxşı başa düşmək üçün, məhkumun M-Şəxslərə, 2 strategiyasına sahib olan hər bir oyunçunun M üçün dilemmasını ümumiləşdirək. 2.

M-Adam oyununu ikili ağaclar vasitəsilə təsvir edək.

Şəkil. 2, oyunçu A. Ağac üçün məhkum dilemma ödəməsidir (2, 1) valideyn olaraq B oyunçu (oyunçu 2) və uşaq kimi A (oyunçu 1) olan ikili ağacdır. B oyunçusunun geri ödəməsini əldə etmək üçün, valideyn və uşağın rollarını Ağac (1, 2) ilə dəyişdirin. Xatırladaq ki, məhbus dilemması üçün A12 <A22 <A11 <A21.

Sonrakı, Tree (M - 1, M - 2,…, 2, 1) oyunçu A-nın M (M - 1) -Person oyunu üçün ödəməsini ifadə edir. 3. Oyunçu A-nın ağacını (M - 1, M - 2,…, 1, 1) hər ikisinin alt ağac olmasına icazə verərək M-Adam oyunu üçün oyunçu A-nın ödəmə ağacını (M, M - 2,…, 2, 1) düzəldin. ana oyunçu M. filialları.

A12 <A22 <A11 <A21 münasibətləri ağacın hər yerində saxlanıldığı müddətdə sağ alt ağacdakı ödəmənin ədədi dəyərləri sol alt ağacdakılardan fərqli olaraq qəbul edilir.

Nəhayət, A oyunçu üçün verilən ağac (M, M - 1,…, 2, 1), 1-ı ən yüksək etməklə, B (oyunçu 1) üçün ağac (3, M, M - 2,…, 2, 1) yaradın valideyn; 1-ı ikinci ən yüksək valideyn halına gətirərək 2 oyunçusu üçün ağac (1, 4, M, M - 3,…, 3,… - 2,…, M - 1, M, M - 2) M - 3-ı ikinci ən aşağı uşağa çevirərək M - 2-ı üçüncü ən aşağı uşaq, Ağac (1, 1, 2,…, M - 1, M) etmək üçün.

Bu, hər bir oyunçunun 2 strategiyasına sahib olduğu M-Adam məhbus dilemma oyunu üçün oyunçuların ödəmələrinin təsvirini tamamlayır.

Teorem 14. M-Şəxsin məhbus dilemması üçün, M 2, üstünlük prinsipindən istifadə edərək, Nash həlli oyunçuların 2 strategiyasını oynamaları üçündür.

Sübut. Teoremin M = 2 üçün tutduğunu artıq bilirik. Teoremin M - 1, M üçün tutduğunu induksiya ilə fərz edin 3. Teoremin M üçün tutduğunu göstərək.

A oyunçusu üçün verilən ağac (M, M - 1,…, 2, 1), xatırladaq ki, tikinti ilə sol və sağ budaqdakı alt ağaclar ağac şəklidir (M - 1, M - 2,…, 2) 1, oyunçu üçün 1, ağac (M, M - 1,…, 2) 2, ağac (2, M, M - 1,…, 4, 3), 3,…, ağac (2,… , M - 2 oyunçu üçün M - 1, M, M - 1). Bu alt ağaclar valideynlərin qovşaqlarında etiketləmə istisna olmaqla 1, 2,…, M - 1 oyunçular üçün eynidır. Qeyd edək ki, hər bir oyunçunun strategiyası 2, istənilən şərtdə strategiyası 1-a üstünlük verir. İndüksiyon, üstünlük prinsipindən istifadə edərək 1-dan M - 1 oyunçuları 2 strategiyasını oynayacaqlar.

Buna görə M oyunçu üçün verilən ağac (1, 2,…, M - 1, M), əgər M 1 oynayırsa, M oyunçu üçün ödəmə b (b) (ağacın ikinci sağ ucu), halbuki M 2 oynayırsa, ödəmə oyunçu M üçün A22 (ağacın ən sağ qovşağı). Üstünlük prinsipi ilə, A12 <A22 olduğundan, M oyunçu 2 strategiyasını da oynayacaqdır. QED

İndi düşünək A11 tipli hər hansı bir ödəmə A22 tipli hər bir ödəmə nisbətindən daha böyükdür; və A21 = A11 + m, burada ödəmələr A11 və A21 bitişik qovşaqlarda yerləşir.

Aydındır ki, Nash yanaşması oynamaq üçün açıq həll yolu olsa belə "1 oyun strategiyası" kooperativ həllini oynamağı düşünmür.

Teorem 14-ın induktiv arqumentindən sonra, belə qənaətə gələ bilərik ki, sol və sağ budaqlarındakı alt ağaclar 1, ağac üçün (M - 2, M - 2,…, 1, 1) ağac şəklidir. M - 1, M - 2, ..., 2, M, - 2, M, 2, MN - 1, oyunçu üçün 4, Ağac (3, M, M - 3,…, 2, 2) M - 1) oyunçu üçün M - 1, induksiya ilə, gözlənilən faydalı fərziyyədən istifadə edərək, 1-dan M - 1 oyunçuları ödəmə A1 tipində olduğu 11 strategiyasını oynayacaqdır.

Buna görə M oyunçu üçün verilən ağac (1, 2,…, M - 1, M), əgər M 1 oynayırsa, M oyunçu üçün ödəmə M (2 oynayırsa) üçün ödəmə oyunçu M A21 = A11 + m (ağacın ikinci sol düyünü). A11 <A21 olduğundan, M oyunçusu 2 strategiyasını oynamağa aludə ola bilər. Bəs niyə A2 tipli bir ödənişin, A11-dan əhəmiyyətli dərəcədə daha az geri çəkilməsinə səbəb ola biləcəyi təqdirdə X ədədləri üçün A22-dan çox risk oyunu strategiyası?

Gözlənilən yardım fərziyyəsinə əsasən, M oyunçu 1 strategiyasını da oynamalıdır.

Ümumi M-şəxs Oyunları.

Nəhayət, ümumi M-şəxs oyunları üçün Teorem 1-ı ümumiləşdiririk.

Hər oyunçunun hər bir i = 1, 2, ..., M. üçün strategiyaları olan M oyunçuları olaq. Strategiya vektorunu (j1, j2,…, jM) nəzərə alsaq, Ai olacağamj1j2… jM. Xi i oyunçu üçün qarışıq bir strategiya olaq, yəni strategiya xi olduğu yerdə Σj xij = 1, xij 0, hamısı j, və x = (xi, xi) bütün oyunçuların strategiyalarını bildirək. Nash problemi:

burada EP (i | xi) verilmiş xi oyunçuya gözlənilən ödəmə və toplama bütün jk və bütün k üzərində olduğu yerlərdə.

Bir strategiya x *, xi * yuxarıda verilmiş oyunçu probleminə xi * verildiyi təqdirdə bir Nash tarazlığıdır.

Bizim yanaşmamız üçün, pi edəkj1, j2,…, jM oyunçu olmaq; k oyunçunun bütün jk və bütün k üçün jk oynayacağı ehtimalı. Von Neumann-Morgenstern-in gözlənilən kommunal nəzəriyyəsi, oyunçunun hədəfinin gözlənilən ödənişi artırmaq olduğunu söyləyir:

toplama bütün jk və bütün k üzərində olduğu yerdədir.

Müəyyənləşdirmək

burada -i j- oynayıri k oyunçusunun k jk oynadığını və toplamın bütün jk üzərində olduğu üçün, bütün k üçün deməkdir i.

Teorem 15. Aşağıdakı problemlər (13) problemlərə (11) bərabərdir:

Sübut.. Tərifinə görə

toplama bütün rk üzərində olduqda, hər k üçün i.

(14) denominatoru, ehtimal pi (i ji oynayır). Deməli,

Etibarən Σ pi (i ji oynayır) = 1 və pi (i ji oynayır) Bütün ji üçün 0, strategiyanın oynadığı oyunçu [arg maxji EP (i | i ji oynayır]) olduğunu göstərir. QED

Oyunçu i üçün ən yaxşı strategiyanı tapmaq üçün bir üsul aşağıdakı kimidir: I oyunçu üçün hər hansı bir strategiya üçün strategiya r və strategiya deyin, ya r və ya s oynayan oyunçuya görə gözlənilən ödəmə nisbətinin olduğu nöqtələrin yerini hesablayın. . Bu, şərti ehtimal məkanını 2 VNM bölgələrinə bölən bir laqeyd bir səth müəyyənləşdirir. Seçim strategiyası r olduğu üçün bir VNM bölgəsi r olaraq qeyd olunur, digər VNM bölgəsi isə s markasıdır, çünki seçim strategiyası s.

Yuxarıdakı hesablamalardan sonra hər bir VNM bölgəsi fərqli cüt strategiyalar olduğu üçün dəfələrlə etiketlənmiş olacaqdır. Verilmiş VNM bölgəsi üçün çoxlu etiketlərdən hər ikisini götürün və bu cüt etiketin yaratdığı laqeydlik səthinə əsaslanaraq onlardan birini aradan qaldırın. Hər VNM bölgəsində yalnız bir etiket olduqda proses başa çatır.

Ümumi 2 nəfərlik oyunlar.

A oyunçusunun Ai, i = 1, 2,… n1 və B oyunçusunun Bj, j = 1, 2,… n2 strategiyaları var. Oyunçuların ehtimallarının qarşılıqlı müstəqil olduğunu düşünün. Problem (13):

Beləliklə, VNM bölgələri konveks politopları ilə təyin olunur:

(16) -də müşahidə olunduğu kimi, ümumi bir 2 nəfərlik bir oyuna qoyulan həll yolu tapmaq asandır. Məsələn, Nash tarazlığının olduğu iki mindən çox yaşındakı Rok-Kağız-Qayçı oyununu nəzərdən keçirək: 33% ehtimalı ilə hər hansı bir strategiya oynayın:

A1 və ya B1 (qaya) strategiyası A2 və ya B2 (kağız) strategiyasını itirir A3 və ya B3 (qayçı) strategiyasını itirir.

A oyunçu üçün ümumiyyətlə 0 olduğu yer var pA (Bj) 1,

olan azalır

Eynilə B oyunçusu üçün də.

Bu qədim oyun üçün yeni bir strategiya kimi görünən budur: rəqibinizin ən çox 33% ehtimalı olan kağız və ən az 33% ehtimalı olan qayçı ilə oynayacağına inansanız, qaya çalın; rəqibinizin ən çox 33% və ən az 33% ehtimalı olan qaya oynayacağına inanırsınızsa kağız yazın; başqa qayçı 22 oynayır.

Hər bir şəxsin 3 strategiyaları olduğu 2 şəxsiyyət oyunları.

Hər bir A, B və C oyunçularının i = 15, 3 üçün 2 strategiyaları Ai, Bi, Ci olduğu 1 nəfərlik bir oyuna təyin edilmiş həlli tapmaq üçün Teorem 2-a müraciət edək.

Oyunçuların ehtimallarının qarşılıqlı müstəqil olduğunu düşünün. A oyunçusu üçün (13) tənlikdir

Eynilə B və C. oyunçuları üçün teorem 15 istifadə edərək həll aşağıdakılarla təyin olunur.

Yuxarıda göstərilənləri Bar-sıxma oyunu üçün istifadə edək[21]:

Oyunçu evdə olarsa, onun ödənişi 1; oyunçu barda təkdirsə, ödəməsi 0; oyunçu başqa bir şəxslə barda olduqda, onun ödənişi 2; başqa, onun ödənilməsi -1.

Bizdə var: A111 - A211 = -2, A112 - A212 = A121 - A221 = 1, A122 - A222 = -1, beləliklə VNM bölgəsi A1 bölgədir -3pA (BXNXXNNXXNXXNXXNXXNX) - (C1) - 1 ≥ 2 və ya bərabər şəkildə bölgə[22] pA (B1) ≥ (1 - 2pA (C1)) / (2 - 3pA (C1)). Eynilə, VNM bölgəsi B1 bölgə pB (A1) ≥ (1 - 2pB (C1)) / (2 - 3pB (C1)) və VNM bölgəsi C1 bölgə pC (B1) ≥ (1) - 2). / (1 - 2pC (A3)). Nash tarazlığı p (A) = p (B) = p (C) = 1 və p (A) = p (B) = p (C) = 1 / 1-dir.

Tanıma.

Al Roth və Todd Devies-ə bu sənədin hazırlanmasında verdiyi əvəzsiz məsləhət və rəhbərliyə görə təşəkkür edirik.

Dəyişikliklər

[1] Sadəlik üçün, yardımçılığın ödəmənin xətti funksiyası olduğuna dair ümumi fərziyyə veririk (Starmer [18]). Beləliklə, gözlənilən yardımçılığı artırmaq, gözlənilən ödənişi artırmaqla eynidır.

[2] Oyunlara Bayesian yanaşmamız Bayesianın əvvəlki işlərindən fərqlənir (məsələn, Acevedo və Krueger [4]; Aumann [1]; Daley and Sadowski [6]; McKelvey və Palfrey [12]; Quattrone və Tversky [15]) digər yanaşmalardan fərqli olaraq, yanaşmamız, həllimizi həmişə təmin etdiyi gözlənilən faydalı fərziyyələrə birmənalı olaraq şərti ehtimalları göstərir.

[3] Bir tənqidçi "rasional oyunçular şərti ehtimalları düşünmür və etməməlidirlər ... Yağış ehtimalının p olduğunu bilən bir agent təsəvvür edin. Sizin "həlliniz" görünür ki, agent yağış yağsa çətir götürsün və yağış yağmasa çətirini buraxsın ".
Teorem 1, keçmiş tənqidin əsassız olduğunu göstərir. Sonuncu tənqidlə əlaqədar olaraq, EP (agent | çətir gətir) = p, EP (agent | çətir gətirməyin) = 1 - s. Bundan sonra həll yolumuz olacaq: p ≥ 1 / 2; çətir gətirmək; ≤ 1 / 2 varsa çətir gətirməyin.

[4] (2) -nin şərti ehtimalları Spohn [17] -dakı prinsipi pozmur: "Hər hansı bir adekvat kəmiyyət qərarı modeli hər hansı bir subyektiv ehtimalını açıq və ya açıq şəkildə əhatə etməməlidir ..." Oyunçunun şərti ehtimalları rəqibin subyektiv ehtimallarıdır. öz strategiyaları üçün deyil, strategiyaları.

[5] Bu teorem M-person oyunları üçün ümumiləşdiriləcəkdir.

[6] Oyunçular arasında heç bir siqnal yoxdur.

[7] PA (B1 | A1) və pA (B2 | A2) dəyişənlər maksimallaşdırma problemində verilmişdir, sonsuz reqress problemindən qaçınan bir sadələşdirmə (pleyer üçün p (B1) verildiyi Nash fərziyyəsinə bənzər) Maksimallaşdırma probleminin formalaşmasında A).

[8] Bərabərsizlik (5), məsələn, (xNUMX) məsələnin dördüncü düsturu ümumi bir kvadrat tənliyə həll yolu olduğu üçün həll edilmiş bir həlldir.

[9] Oyunçunun üstünlükləri hava kimi qismən müşahidə olunan təsadüfi hadisələrdən asılı ola bilər. Bayesian oyunçularının oynadığı natamam məlumatları olan oyunlarda üstünlüklərin istifadəsi üçün (Harsanyi [10]) müraciət edin.

[10] Bu ümumi həll xüsusi həllər kimi Nash tarazlığını ehtiva edir. Təsviri Nash həllərindən fərqli olaraq, həll yolumuz düşüncə ilə gözlənilən saf strategiyalardır. Bundan əlavə, səhvən A oyunçusu VNM A1 bölgəsindədirsə və A2 oynayırsa, Corollary 2, A oyunçusunun daha az gözlənilən ödəmə alacağını bildirir.

[11] Maraqlıdır ki, bir Nash qarışıq tarazlıqda bir oyunçunun strategiyası digər oyunçunun ödəmə funksiyasını bilməkdən asılıdır.

[12] Sıfır əlamətləri cədvəldə nəzərə alınmır, çünki bu hallar pozulur: bir oyunçu iki strategiyası arasında seçim edə bilmir. Ayrıca, hər Nash tarazlığının tam dörd cərgədə göründüyü maraqlıdır.

[13] Növbəti 3 nümunələri (Davies [7]) oyun nəzəriyyəsində tələbələr üçün pedaqoji bir texnika olaraq xidmət edə biləcək bir şəkildə uyğunlaşdırılmışdır. Cədvəl 1, burada təsvir edilən bütün 2 nəfərlik oyun nümunələri üçün Nash tarazlığını tez bir zamanda tapmaq üçün istifadə edilə bilər.

[14] A-nın hərəkətləri B-nin hərəkət seçiminə təsir göstərmir. Bunun səbəbi A'nın inancının B inancı ilə əlaqələndirilməməsidir. Digər tərəfdən, inanclar əlaqəlidirsə, onda hər iki oyunçunun ehtimalları 50% -ə bərabər olmalıdır, əks halda oyunçuların ehtimalları hər ikisi> 50% olduğunu söyləyirsinizsə, A B 2 strategiyasını (quyruq) oynayacağını bilir, buna görə 1 strategiyası oynayır (başlar) A üçün düzgün bir resept ola bilməzsə, A-nın ehtimalı> 50% və B-nin ehtimalı <50%, B bilir ki, A başları oynayacaq, buna görə də oynayan başlar A. üçün düzgün bir resept ola bilməz. unikal həll Buna görə də Nash tarazlığıdır: hər ikisi üçün təsadüfi oynayın.

[15] Diqqət yetirin ki, pA (B1) = pB (A1) = 0 və ya 1 tarazlıq ssenarisidir: hər iki oyunçu digər oyunçunun düz (və ya əyri) getməsini gözləyirlərsə (ya da hər ikisi düz gedir). Bunun əksinə olaraq, p (A1) = p (B1) = 0 və ya 1 bir Nash tarazlığı ola bilməz: əgər B düz (və ya əyri) gedərsə, A əyiləcək (və ya düz gedər).

[16] Mənbələr: Silahlara Nəzarət Assosiasiyası, Amerika Alimləri Federasiyası, Parçalanan materiallar üzrə Beynəlxalq Panel, ABŞ Müdafiə Nazirliyi, ABŞ Dövlət Departamenti və Stokholm Beynəlxalq Sülh Araşdırma İnstitutu.

[17] Daşqın və Dreşerin orijinal kağızı olduğundan, bununla bağlı minlərlə məqalə dərc edilmişdir. Google Schoların "məhkum dilemması" üçün axtarış bu yazıya görə 104,000 nəticə verir. Zəhmət olmasa (Kuhn [14]) verin.

[18] Buna görə oyunçular kooperativ həlli oynamayacaqlar.

[19] Rəqibiniz təsadüfi deyil oynayırsa, rəqibinizin bu oyunun əvvəlki oyunları təsir edə bilər.

[20] Düstur M-3 üçün M-şəxslərə uzadıla bilər.

[21] Bu oyun El Farol bar probleminə əsaslanır (Arthur [5]).

[22] Laqeydliyin lokusu nöqtələrdən keçən bir kvadratik əyridir (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5).

References

[1] Aumann RJ (1974) Təsadüfi strategiyalarda subyektivlik və əlaqə. Riyazi İqtisadiyyat jurnalı 1: 67-96

[2] Aumann RJ, Maschler M (1995) Tamamlanmamış Məlumatlarla Təkrar Oyunlar. MIT Press, Kembric London

[3] Axelrod R (1984) Əməkdaşlıq Təkamülü. Əsas Kitablar

[4] Acevedo M, Krueger JI (2005) Məhkum dilemmasındakı sübutlu əsaslandırma. Amerikan Psixologiya Jurnalı 118: 431-457

[5] Artur WB (1994) İnduktiv əsaslandırıcı və məhdudlaşdırılmış rasionallıq. Amerika İqtisadi İcmalı 84: 406-411

[6] Daley B, Sadowski P (2017) Sehrli Düşüncə: Nümayəndəlik Nəticəsi. Nəzəri İqtisadiyyat 12: 909-956 24 Bu oyun El Farol bar probleminə əsaslanır (Arthur [5]). 25 Laqeydliyin lokusu nöqtələrdən keçən bir kvadratik əyridir (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5).

[7] Davies T (2004) Kommunal nəzəriyyə və oyun nəzəriyyəsi. Mühazirə qeydləri

[8] Garcia CB, Zangwill WI (2017) Müharibə və ya barışa yeni bir yanaşma. İş kağızı

[9] Garcia CB, Zangwill WI (2018) üstünlük, gözlənilən yardım proqramı və məhbus dilemması. İş kağızı

[10] Harsanyi J (1967) Tamamlanmamış Məlumatlarla "Bayesian" Oyunçuları I - III. J. İdarəetmə Elmi 14 (3): 159-182

[11] Kadane JB, Larkey PD (1982) Subyektiv Ehtimal və Oyunlar nəzəriyyəsi. İdarəetmə Elmi 28 (2): 113-120

[12] McKelvey RD, Palfrey TR (1995) Normal Forma Oyunları üçün Quantal Reaksiya Bərabərliyi. Oyunlar və iqtisadi davranış 10: 6-38

[13] Jaynes ET (1968) Əvvəlki ehtimallar. Sistemlər Elmi və Kibernetika 4 (3) üzrə IEEE əməliyyatları: 227-241

[14] Kuhn S (2017) Məhbus Dilemması. Fəlsəfənin Stenford Ensiklopediyası

[15] Quattrone GA, Tversky A (1984) Səbəbsiz Versus Diaqnostik Ehtimallar: Özünü Aldatma və Seçicinin Illüziyası haqqında. Şəxsiyyət və sosial psixologiya jurnalı 46: 237-248

[16] Skyrms B (2004) Stag ov və sosial quruluşun təkamülü. Cambridge University Press, Kembric

[17] Spohn W (1977) Luce və Krantz Savage qərar qərarını həqiqətən ümumiləşdirdikləri yerlərdə. Erkenntnis 11: 113-134

[18] Starmer C (2000) Gözlənilməyən kommunal nəzəriyyədəki inkişaflar: Risk altında seçim təsviri nəzəriyyəsi üçün ov. İqtisadi ədəbiyyat jurnalı 38: 332-382

[19] Sugden R (2005) Hüquqlar, Əməkdaşlıq və Rifah İqtisadiyyatı. Palgrave MacMillan, 2 nəşr: 132

[20] Von Neumann J, Morgenstern O (1953) Oyunlar nəzəriyyəsi və iqtisadi davranış. Princeton Universiteti Mətbuat, New Jersey

[21] Wolpert DH, Benford G (2011) Newcomb'ın Paradoksu Dərsi. Synthese 190: 1637-164