Аўтар: CB Garcia і WI Zangwill

Выкладчыкі менеджменту ў Буд-школе бізнесу (абодва пенсіянеры)

Перагледжаны ў жніўні 18, з 2018 (Гарсія і Зангвіл [8, 9]).

ключавыя словы: Тэорыя гульняў, дылема зняволенага, байесаўская, суб'ектыўная верагоднасць

абстрактны: Фон Нойман і Моргенштэрн (VNM), выкарыстоўваючы гіпотэзу чаканай карыснасці, забяспечылі фундаментальную пастаноўку праблемы тэорыі гульняў. Аднак да гэтага моманту фармулёўку было цяжка вырашыць без навязвання дадатковых здагадак. Неш павінен быў выказаць здагадку, што гульцы развязаны, так што верагоднасць таго, што гулец A прыняе меры, не залежыць ад верагоднасці гульца B прыняць меры. У гэтым артыкуле мы выключаем здагадкі Нэша, уключаючы здагадку, што стратэгіі гульцоў агульнавядомыя, і прапагандаваць мадэль, цалкам эквівалентную агульнай праблеме з VNM. Наша лёгка вырашальная фармулёўка ліквідуе некаторыя звязаныя з падыходам Нэша складанасці, якія часта прыводзяць да супярэчлівых і контрсуітыўных вынікаў, напрыклад, да дылемы зняволенага, курынай гульні, парадокса Ньюкомба, палявання на аленяў і мноства іншых гульняў. Напрыклад, адкінуўшы здагадку ўзаемнай незалежнасці Нэша ў дылеме зняволенага, наша мадэль дэманструе, што гульцы здольныя дамагчыся больш высокіх выплат, і каб дасягнуць гэтага, ім не трэба гуляць у кааператыў ці мець зносіны, а проста ўжываць тэарэму Байеса ў стылі (Харсаны [10]; Кадане і Ларэкі [11]). Наш падыход падзяляе імавернасную прастору на два паўпрасторы ці рэгіёны, адносная велічыня якіх залежыць ад выплат. Цяпер не трэба дакладна ацаніць верагоднасць, а толькі вызначыць, у якім рэгіёне ён знаходзіцца. Гэта дае значныя перавагі, паколькі, калі адзін рэгіён значна большы за іншы, гэта адразу дае істотнае разуменне таго, як гуляць у гэтую гульню. Наша агульнае рашэнне, якое не звязана, скажам, у сэнсе Амана [1], утрымлівае раўнавагу Нэша як прыватныя рашэнні. У адрозненне ад апісальных рашэнняў Нэша, наша рашэнне з'яўляецца рэцэптыўнай парай чыстых стратэгій рацыянальных чаканняў, што дае новую аснову для тэорыі гульняў. Мы распаўсюджваем свой падыход да агульных гульняў M-Person, як мы ілюструем у гульні "нажніцы-папера" і праблеме перапоўненасці штангі.

Вынік вынікаў.

Цяпер мы падводзім вынікі, абапіраючыся на дэталі і відавочныя выплаты, прыведзеныя ніжэй. Мы лічым, што гэтыя вынікі дэманструюць каштоўнасць нашага падыходу да навучання і даследаванняў, паколькі вынікі часта прадстаўляюць новыя рашэнні.

Каардынацыйная гульня: У здагадцы Нэша пра незалежнасць не хапае вышэйшага байесаўскага падыходу, які мы прымаем. Для прыбыткаў, прадстаўленых ніжэй, прайграйце першую стратэгію, калі вы лічыце, што верагоднасць апанента згуляць сваю першую стратэгію, па меншай меры, 1 / 3, інакш іграйце другую стратэгію. Нэш не дае ніякіх уяўленняў пра тое, калі ўжываць якую стратэгію. Акрамя таго, калі змяняюцца выплаты, наш падыход прадугледжвае перагледжаныя верагоднасці. Бітва падлог: Два бакі разыходзяцца ў тым, куды ім трэба ісці, але мець зносіны не дазваляюць. Абодва бакі атрымліваюць добрую выплату, калі яны абодва ідуць на адзін выбар, бо яны абодва разам. Дадзеная партыя атрымае бонус, калі абодва пойдуць на выбар гэтай партыі. Ні адзін з іх не атрымае добрага прыбытку, калі едзе ў розныя месцы. З улікам прыбыткаў, прадстаўленых ніжэй, гулец A павінен гуляць патрэбную стратэгію, калі лічыць, што іншы гулец таксама абярэ патрэбны выбар A з верагоднасцю не менш 33%. У адрозненне ад гэтага, Нэш забяспечвае тры раўнавагі без усялякага разумення таго, у што гуляць, калі і без аналізу верагоднасцей. Супадзенні капейкі: Два гульцы, цотныя і няцотныя, адначасова паказваюць капейкі. Калі капейкі супадаюць, Нават захоўвае абедзве капейкі; інакш няцотны захоўвае абедзве капейкі. Унікальная раўнавага Нэша для гэтай гульні з нулявой сумай дазваляе абодвум гульцам гуляць выпадкова. Улічваючы выплаты ніжэй, Нават павінен гуляць галоў, калі ён мяркуе, што няцотны будзе гуляць у галовы з верагоднасцю не менш 50%. З іншага боку, няцотныя павінны гуляць галовы, калі лічаць, што Even згуляе ў галовы з верагоднасцю максімум 50%. Гульня з курыцай: дзве машыны імкліва рухаюцца насустрач адзін аднаму і збіраюцца ўрэзацца. Нэш мяркуе, што адзін аўтамабіль павінен паварочвацца, а другі ехаць прама, але мала разумее, у які бок трэба паварочвацца. Улічваючы выплаты ніжэй, наш падыход прапануе вам пахіснуцца, калі вы верыце, што апанент будзе паварочвацца з верагоднасцю не больш за 90%, інакш ісці прама. Звярніце ўвагу, што абодва гульцы, якія круцяцца (або абодва ідуць прама), не з'яўляюцца раўнаважкай Нэша, але што абодва гульца круцяцца (або абодва ідуць прама) у чаканні, што апанент пойдзе прама (або паварочваецца) - гэта сцэна раўнавагі. Акрамя таго, калі выплаты будуць зменены, наш падыход забяспечвае абноўленыя верагоднасці. Гонка па зброі: кожная краіна першапачаткова складае зброю, каб яе не напалі. Як паказана ніжэй, зніжэнне прыбытку ад складання зброі ажыццяўляецца, адкрываючы магчымасць для мірнага дагавора. Нэш не вызначае магчымасці для мірнага дагавора. Паляванне на аленяў: палюйце на аленя, калі вы верыце, што праціўнік будзе паляваць на аленя з верагоднасцю не менш 50%, інакш паляваць на зайца. (Чыстыя раўнавагі Нэша для палявання на аленя альбо для палявання на зайца). Праблема Ньюкомба: калі праблема Ньюкома ставіцца як дылема зняволенага, да вырашэння праблемы Ньюкомба можна прыйсці двума спосабамі: як некамерцыйная раўнавага Нэша, выкарыстоўваючы прынцып панавання, альбо як сумеснае рашэнне, выкарыстоўваючы гіпотэзу чаканай карыснасці. Гульня Наклейкі-папера-нажніцы: Раўнавага Нэша для вас, каб гуляць у аднабаковы валокі 3. Новая стратэгія гэтай старажытнай гульні выглядае для вас, каб гуляць у рок, калі вы верыце, што ваш праціўнік будзе гуляць у паперу з верагоднасцю не больш за 33% і нажніцы з верагоднасцю не менш 33%; гуляць у паперу, калі вы верыце, што ваш праціўнік будзе гуляць нажніцы з верагоднасцю не больш за 33% і качацца з верагоднасцю не менш 33%; яшчэ гуляць нажніцамі. (Наш падыход можа дапамагчы вам, калі вы скажаце, у вас ёсць дадзеныя аб папярэдніх гульнях вашага апанента.) У гульні з пераборлівасцю бараў ёсць сябры 3 A, B і C: Кожны, хто ходзіць у бар сам, нічога не атрымлівае - заставацца дома - гэта лепшы выбар. Калі два бары ідуць у бар, гэта лепшы варыянт. Калі ўсе трое ідуць, бар выкідае ўсіх трох. Раўнавагі Неша - усе, каб застацца дома або для ўсіх, каб гуляць у сваю першую стратэгію з верагоднасцю, роўнай 33%. Але калі ў вас ёсць нейкае разуменне вашых сяброў і вы можаце ацаніць баэйскую верагоднасць іх паводзін, наша стратэгія можа дапамагчы.

Мы таксама пашырым падыход да гульні M-person і атрымаем падобную інфармацыю. Напрыклад, мы паказваем поўнае рашэнне для агульных гульняў 2-чалавека і агульных 3-асобаў x 2-стратэгій.

Гіпотэза чаканай карыснасці.

У гульні 2-Person хай гульцы A і B маюць стратэгіі 2: A1 або A2 для гульца A, а B1 або B2 для гульца B.

Падставай для тэорыі карыснай карысці служыць тэарэма аб карыснасці фон Ноймана - Моргенштэна (фон Нойман і Моргенштэрн [20]): няхай Айдж і Бідж будуць выплатамі гульцам A і B адпаведна, калі гулец A гуляе ў Ai, а гулец B гуляе ў Bj, , j = 1 або 2. Гіпотэза чаканай карыснасці абвяшчае, што гульцы А і В павінны максімальна павялічыць свае чаканыя выплаты1:

дзе pA (Ai і Bj) - верагоднасць гульца A, што A гуляе ў Ai, а B - гуляе ў Bj, і гэтак жа, як у гульца B.

Умоўныя верагоднасці[1].

Для нашага падыходу мы падзенне Меркаванне Нэша, што верагоднасць гульцоў узаемна незалежная. Гэта дазваляе нашай праблеме (1) стаць больш агульнай і атрымаць больш рашэнняў, якія задавальняюць чаканую гіпотэзу карыснасці.

Няхай EP (A | Ai) і EP (B | Bj) будуць чаканымі выплатамі[2],[3] A і B адпаведна, улічваючы, што A гуляе Ai і B гуляе Bj, для i, j = 1, 2:

Пачнем з доказу элементарная тэорэма гульняў «Баесаў» што дэманструе эквівалентнасць нашага падыходу да фармулявання VNM:

Тэарэма 1[5]. Праблемы (3) ніжэй раўназначныя праблемам (1)[6]:

Доказ. Па тэарэме Байеса,

Затым

Максімум[7] вышэйапісанага ўраўнення з'яўляецца pA (A1) = 1 (г.зн., стратэгія гульні A1), калі EP (A | A1) ≥ EP (A | A2), або pA (A1) = 0 (г.зн., стратэгія гульні A2), калі EP ( A | A1) EP (A | A2). Такім чынам, (3) мае месца для гульца А. Аналагічны аргумент важны для гульца BQED

VNM Regions.

Вызначце рэгіёны VNM A1 і A2 як выпуклыя політопы:

Як паказана ніжэй, A павінна гуляць стратэгію A1, калі яна чакае, што B апынецца ў рэгіёне A1. У адваротным выпадку, A павінен гуляць у A2. Лінія раўнавагі

раздзяляе імавернасную прастору на два рэгіёны і дае візуальна карысны сродак аналізу сітуацыі[8].

Важнасць рэгіёнаў: Два рэгіёны практычна важныя, бо зараз не трэба дакладна ацаніць верагоднасць, а толькі вызначыць, у якім з двух рэгіёнаў ён знаходзіцца. Часта бачна, што папярэдняя верагоднасць можа быць у адным рэгіёне , і ідэнтыфікацыя гэтага рэгіёну з'яўляецца дастатковай інфармацыяй, каб прапанаваць адпаведную гульню. Напрыклад, выкажам здагадку, што вобласць A1 значна большая, чым іншая, таму цалкам верагодная верагоднасць у гэтым рэгіёне A1. Гэта дае пераканаўчую інфармацыю пра тое, што гулец A, хутчэй за ўсё, будзе гуляць у A1.

Аналагічна для B:

Вобласці VNM залежаць ад папярэдняга размеркавання верагоднасці гульцоў, які часта называюць прыёрамі (Jaynes [13]; Harsanyi [10]; Kadane і Larkey [11]). іх апанент. [9]

Следства 2. Улічваючы (3), A гуляе стратэгію A1 тады і толькі тады, калі ён чакае, што гулец B апынецца ў рэгіёне VNM A1. Астатняе, А гуляе стратэгію A2. Сапраўды гэтак жа, B гуляе стратэгію B1, калі і толькі калі ён чакае, што гулец A апынецца ў рэгіёне VNM B1. У іншым выпадку, B гуляе стратэгію B2.

Доказ. EP (A | A1) ≥ EP (A | A2) тады і толькі тады, калі A11 pA (B1 | A1) + A12 pA (B2 | A1) ≥ A21 pA (B1 | A2) + A22 pA (B2 | A2) тады і толькі тады, калі (A11 - A12) pA (B1 | A1) + (A21 - A22) pA (B2 | A2) + A12 - A21 ≥ 0.

Аналагічным чынам, EP (B | B1) ≥ EP (B | B2) тады і толькі тады, калі B11 pB (A1 | B1) + B21 pB (A2 | B1) ≥ B12 pB (A1 | B2)

+ B22 pB (A2 | B2) тады і толькі тады, калі (B11 - B21) pB (A1 | B1) + (B12 - B22) pB (A2 | B2) + B21 - B12 ≥ 0. QED

З тэарэмы 1 і следства 2, для кропак у рэгіёнах (5) і (7) належыць чаканая гіпотэза карыснасці, г.зн. рэгіёны VNM вызначаюць агульнае рашэнне для гульні 2-Person.[10].

Раўнавара Наш.

Калі верагоднасць гульцоў узаемна незалежная, рэгіёны VNM спрашчаюць:

Прапанова 3. Дапусцім, раўнавагу Нэша (p (A1), p (B1)) знаходзіцца ў вобласці VNM Ai і VNM вобласці Bj адпаведна для некаторых i, j = 1, 2. Затым гулец A будзе гуляць у стратэгію Ai, а гулец B будзе гуляць у стратэгію

Bj.

Доказ. Праблема раўнавагі Неша - гэта задача (1), дзе pA (Ai і Bj) = pB (Ai і Bj) = p (Ai) p (Bj), альбо задача (3), дзе pA (Bj | Ai) = p (Bj ) і pB (Ai | Bj) = p (Ai), для i, j = 1, 2. Такім чынам, следства 2 выканана, дзе VNM вобласці вызначаюцца (8), для pA (B1) = p (B1) і pB (A1) = p (A1). QED

Нагадаем, што ўраўненні раўнавагі

аддзяляюць рэгіёны VNM, што дае агульнае рашэнне для любой гульні. Гэтыя ж раўнаважныя ўраўненні, дзе pB (A1) = p (A1) і pA (B1) = p (B1), атрымліваюць змешаную раўнавагу Нэша11, як мы паказваем у табліцы ніжэй.

Прапанова 4. Даецца любая гульня A = [[A11, A12], [A21, A22]] і B = [[B11, B12], [B21, B22]], раўнавагі Нэш для гульні разлічваюцца з прыдатнага радка табліцы 112.

Доказ. Звярніце ўвагу, што (i, j) - гэта чыстая раўнавага Нэша, калі і толькі тады, калі sgn (2i - 1) * (A11 - A21)> 0 і sgn (2j - 1) * (B11 - B12)> 0, для i, j = 0, 1. Карыстаючыся гэтым фактам, для кожнага радка ў табліцы 1 мы пералічым усе пары (i, j), якія з'яўляюцца чыстымі раўнаважкамі Нэша.

Нарэшце, для пары (a, b), вызначанай (9), змешанай раўнавагі Неша, нам трэба толькі паказаць, што 0 <a <1 і 0 <b <1. Але ўлічыце, што для радкоў 6, 7, 10 і 11 табліцы 1 лічнік і назоўнік a, 1 - a, b або 1 - b абодва станоўчыя або адмоўныя; адсюль a, 1 - a, b, 1 - b усе больш, чым 0. QED

Прыклад ітэраванага панавання[13].

Няхай A = [[2, 2], [3, 1]] і B = [[0, 1], [0, 2]]. "Гуляць A1 & B2" - гэта раўнавага Неша.

Прапанова 5. Улічваючы A = [[2, 2], [3, 1]] і B = [[0, 1], [0, 2]], тады гулец A будзе гуляць у A1, а гулец B будзе гуляць у B2.

Доказ. VNM вобласць A1 складае: pA (B2 | A2) ≥ 1 / 2, а VNM вобласць B2 складае: pB (A2 | B2) ≥ -1. Такім чынам, гулец B будзе гуляць у B2. Гулец A таксама ведае, што гэта так, таму pA (B2 | A2) = 1. Паколькі pA (B2 | A2) = 1 - гэта кропка ў рэгіёне VNM A1, гулец A гуляе ў A1. QED

Прыклад каардынацыі.

Няхай A = B = [[2, 0], [0, 1]]. Ёсць раўнаважныя пункты 3 Nash: "гуляць у A1 і B1", "гуляць у A2 і B2" і "гуляць у A1 (або B1) з верагоднасцю 1 / 3". VNM вобласць A1 складае: 2pA (B1 | A1) ≥ pA (B2 | A2), а VNM вобласць B1 складае: 2pB (A1 | B1) ≥ pB (A2 | B2). Аналізуючы гэтыя рэгіёны VNM візуальна, A і B, верагодна, будуць выбіраць стратэгіі A1 і B1 адпаведна.

Прапанова 6. З улікам A = B = [[2, 0], [0, 1]], калі верагоднасць гульцоў узаемна незалежная, тады прайграйце першую стратэгію, калі вы лічыце, што верагоднасць саперніка згуляць сваю першую стратэгію як мінімум 1 / 3, астатнія гуляюць другую стратэгію.

Доказ. VNM вобласць A1 складае: pA (B1) ≥ 1 / 3, а VNM вобласць B1 складае: pB (A1) ≥ 1 / 3. QED

Прыклад бітвы падлог.

Няхай A = [[3, 1], [1, 2]] і B = [[2, 1], [1, 3]]. Існуюць кропкі раўнавагі 3 Nash: "гуляць у A1 і B1", "гуляць у A2 і B2" і "гуляць у A1 з верагоднасцю 2 / 3, гуляць у B1 з верагоднасцю 1 / 3". VNM вобласць A1 складае: 2pA (B1 | A1) ≥ pA (B2 | A2), а VNM вобласць B1 складае: pB (A1 | B1) ≥ 2pB (A2 | B2). А лепш выбраць A1 і B, а лепш выбраць B2.

Прапанова 7. Улічваючы A = [[3, 1], [1, 2]] і B = [[2, 1], [1, 3]], калі верагоднасць гульцоў узаемна незалежная, тады: гуляй у A1, калі pA (B1 ) ≥ 1 / 3, інакш гуляць у A2; гуляць у B1, калі pB (A1) ≥ 2 / 3, інакш гуляйце ў B2.

Доказ. Вобласць VNM A1 складае: pA (B1) ≥ 1 / 3, а VNM вобласць B1 складае: pB (A1) ≥ 2 / 3. QED

Прыклад супадзення пенні.

Няхай A = [[1, -1], [-1, 1]] і B = [[-1, 1], [1, -1]]. Гэтая гульня з нулявой сумай мае змяшанае раўнавагу Нэш: "гуляць у A1 з верагоднасцю 1 / 2, гуляць у B1 з верагоднасцю 1 / 2".

Прапанова 8. Улічваючы A = [[1, -1], [-1, 1]] і B = [[-1, 1], [1, -1]], калі верагоднасць гульцоў узаемна незалежная, тады: гуляць у A1 калі pA (B1) ≥ 1 / 2, інакш гуляць у A2; гуляць у B1, калі pB (A1) 1 / 2, інакш гуляць у B2[14].

Доказ. Вобласць VNM A1 складае: pA (B1) ≥ 1 / 2, а VNM вобласць B1 складае: pB (A1) 1 / 2. QED

Прыклад гульні з курыцай (Sugden [19]).

Няхай A = [[0, -1], [1, -10]] і B = [[0, 1], [-1, -10]]. Раўнавагі Неша "гуляй у A1 (кручэнне) і B2 (ісці прама)", "гуляць у A2 (ісці прама) і B1 (паварот)" і "гуляць у A1 (B1) з верагоднасцю 0.9".

Прапанова 9. У гульні з курыцай, калі верагоднасць гульцоў узаемна незалежная, тады: павярніцеся, калі вы верыце, што супернік пагорнецца з верагоднасцю не больш за 90%, інакш ідзіце прама.

Доказ. Вобласць VNM A1 складае: pA (B1) + 11pA (B2) ≥ 2, або pA (B1) ≤ 9 / 10. Сапраўды гэтак жа, рэгіён VNM B1 складае: pB (A1) ≤ 9 / 10. QED

Звярніце ўвагу, што калі ваш апанент праяўляе занадта вялікі энтузіязм (па меншай меры, 90%), каб павярнуць, вы павінны ісці проста.

Пераважны сцэнар: У гульцоў больш шанцаў павярнуць, чым на прамую.

Курычны сцэнар: выкажам здагадку, pA (B1) = pB (A1) = 0. Абодва гульца чакаюць, што другі гулец пойдзе прама. Абодва будуць паварочвацца.

Сцэнар катастрофы: выкажам здагадку, pA (B1) = pB (A1) = 1. Абодва гульца чакаюць, што іншы гулец пацягнецца. Абодва пойдуць прама[15].

Сцэнар раўнавагі Неша: Няхай pA (B1) = 1 - pB (A1), і pB (A1) = 0 або 1. Гулец, які чакае, што другі гулец пойдзе прама, пагорнецца, а той, хто чакае, што іншы гулец пахіснецца, пойдзе прама.

Прыклад гонкі зброі.

У сказе 9, няхай A = [[0, -x], [1, -10x]], B = [[0, 1], [-y, -10y]], для x, y ≥ 0. Няхай A1 або B1 "шукаюць міру", а A2 або B2 - "ядзерная атака". Значэнні x і y абазначаюць запасы зброі B і A адпаведна.

Краіна А імкнецца да міру, калі верагоднасць нападу краіны B перавышае 1 / (9x + 1); у адваротным выпадку напады. Крывая верагоднасці pA (B1) = 1 / (9x + 1) хутка падае, напрыклад, pA (B1) = 1 / 2 пры x = 1 / 9, але неўзабаве рэзка згладжваецца: B павінна хутка запасіцца першапачаткова, але як крывая уплощается, B будзе мець невялікую карысць для складання зброі.

І аналагічна для краіны Б.

Такім чынам, кожная краіна першапачаткова складае зброю, каб не напасці. Але хутка памяншаецца рэнтабельнасць запасаў зброі, якія рэалізуюцца, адкрываюць магчымасць шукаць мірнага дагавора.

У якасці ілюстрацыі разгледзім разліковы сусветны ядзерны запас 2018[16] табліцы 2.

Грунтуючыся на выплатах вышэй і ў табліцы 2, рацыянальная Паўночная Карэя павінна шукаць мірнага дагавора са Злучанымі Штатамі і Расіяй.

Skyrms [16]).

Няхай A = [[4, 1], [3, 2]] і B = [[4, 3], [1, 2]]. Раўнавагі Неша - "гуляць у A1 (Stag) і B1 (Stag)", "гуляць у A2 (заяц) і B2 (заяц)" і "гуляць у A1 (B1) з верагоднасцю 0.5".

Прапанова 10. У паляванні на халяву, калі верагоднасць гульцоў узаемна незалежная, значыць: палюйце на стага, калі вы верыце, што праціўнік будзе паляваць на оленя з верагоднасцю не менш за 50%, інакш паляваць на зайца.

Доказ. Вобласць VNM A1 складае: 3pA (B1) + pA (B2) ≥ 2, або pA (B1) ≥ 1 / 2. Сапраўды гэтак жа ВНМ-вобласць B1 складае: pB (A1) ≥ 1 / 2. QED

Дылема зняволенага[17].

Хай A12 <A22 <A11 <A21, і B роўна транспазіраванню А. Паколькі A11 <A21 і A12 <A22, выкарыстанне прынцыпу дамінавання дае раўнавагу Неша, а менавіта кааператыўнае рашэнне "гуляць у A2 (дэфект) і B2 (дэфект) ”. Але так як A22 <A11, A і B лепш, калі яны абодва гуляюць сумеснае рашэнне "гуляць у A1 (маўчанне) і B1 (маўчанне)".

Прапанова 11. У дылеме зняволенага, калі верагоднасць гульцоў узаемна незалежная, гульцы гуляюць не ў кааперацыі[18].

Доказ. Разгледзім левую частку вобласці VNM A1:

(A11 - A12 - A21 + A22) сA(B1) + A12 - A22.

Калі A11 - A12 - A21 + A22 ≤ 0, то (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ A12 - A22 <0. З іншага боку, калі A11 - A12 - A21 + A22> 0, то (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ (A11 - A12 - A21 + A22) + A12 - A22 = A11 - A21 <0. Такім чынам, для любога папярэдняга гульца A, VNM вобласць A1 з'яўляецца нулявым наборам, таму ён павінен гуляць у стратэгію 2.

Сапраўды гэтак жа гулец B павінен гуляць у стратэгію 2. QED

Прапанова 11 выразна паказвае, што здагадка пра незалежнасць абмяжоўвае нас несвабодным рашэннем.

Класічны прыклад дылемы зняволенага.

У класічнай дылеме зняволенага A = [[-1, -3], [0, -2]] і B = [[-1, 0], [-3, -2]].

Прапанова 12. У дылеме класічнага зняволенага, калі прыёрамі гульцоў з'яўляюцца: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2, pB (A1 | B1) + pB (A2 | B2) /, то X X гульцы будуць гуляць у сумеснае рашэнне3.

Доказ. Рэгіён VNM A1 складае: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2, а вобласць VNM B1 складае: pB (A1 | B1) + pB (A2X | X2 | Такім чынам, для дадзеных прыёр, гульцы А і В павінны гуляць сумеснае рашэнне. QED

У Прапанаванні 12 звярніце ўвагу на высокую планку, неабходную для прапрацоўкі сумеснага рашэння. Гульцы палічылі за лепшае б выйграць не-кааператыўнае рашэнне.

У выпадку, калі Наш падыход не разглядае магчымасць рэалізацыі стратэгіі сумеснай працы.

Разгледзім дылему зняволенага, дзе A11 - A12 = A21 - A22, A21 = A11 + m і A22 = A11 - M, дзе m> 0 малы, а M> 0 вельмі вялікі. Напрыклад, A = [[100, -3], [101, -2]]. Нагадаем, з Proposition 11, што калі верагоднасць гульцоў узаемна незалежная, гульцы будуць гуляць без кааперацыі.

Відавочна, што было б недарэчна для гульцоў нават не разглядаць стратэгію гульні 1, бо калі гулец гуляе ў 2, верагоднасць таго, што іншы гулец таксама гуляе ў 2, прынесла б значную страту, таму навошта рызыкаваць. Зразумела, што падыход Нэша не разглядае магчымасць вырашэння сумесных рашэнняў, нават калі гэта відавочнае рашэнне - вельмі важны момант, скажам, абмеркаванне зрываў на рынку ў агульных мадэлях эканамічнага раўнавагі.

З іншага боку, як вынікае з наступнай прапановы, адкінуўшы здагадку пра незалежнасць, наш падыход будзе гуляць хутчэй як кааператыўнае рашэнне, а не кааператыўнае рашэнне.

Чорная лінія - гэта абыякавасць класічнай дылемы зняволенага. Гулец з большай верагоднасцю будзе гуляць у стратэгію 2 з-за малаверагоднай верагоднасці апынуцца ў рэгіёне для стратэгіі гульні

1.

Зялёная лінія - гэта лінія абыякавасці для гэтага выпадку дылемы зняволенага: pA (B1 | A1) + pA (B2 | A2) = 1 + m / (M + m). Тут памер вобласці верагоднасці для стратэгіі 1 амаль такі, што для стратэгіі 2. Наш падыход раіць гульцам разгледзець стратэгію гульні 1.

Прапанова 13. Улічваючы дылему зняволенага, дзе A11 - A12 = A21 - A22, A21 = A11 + m і A22 = A11 - M, дзе m> 0 малы, а M> 0 вельмі вялікі, гульцы A і B будуць гуляць у сумеснае рашэнне20.

  • Такім чынам, гульцы не будуць гуляць у кааператыўнае рашэнне.
  • У цяперашні час для дасягнення кааператыўнага рашэння дадаюцца здагадкі, напрыклад, абмежаваная рацыянальнасць, няпоўная інфармацыя (Аман і Машлер [2]; Асеведо і Крюгер [4]; Дэйлі Улічваючы чаканыя сумесныя імавернасці AA pA (Ai і Bj), A робіць выснову, што pA (A1 і B1) павінна знаходзіцца побач з 1. Гэта таму, што A і B, верагодна, гуляюць стратэгію 1, дзе іх выплаты даволі высокія і толькі m адзінак менш максімальных.

Такім чынам, pA (B1 | A1) = pA (A1 і B1) / pA (A1) таксама павінна знаходзіцца побач з 1.

A таксама робіць выснову, што pA (A2 і B2) pA (A2 і B1), так як B больш верагодна, каб гуляць у стратэгію 2, калі A гуляе ў стратэгію 2. Значыць, pA (B2 | A2) = pA (A2 і B2) / (pA (A2 і B1) + pA (A2 і B2)) 1 / 2. А, на малюнку 1, робіцца выснова, што B досыць у межах VNM-вобласці A1. Сапраўды гэтак жа B будзе гуляць у стратэгію 1. QED

Парадокс Ньюкома як версія дылемы зняволенага.

У знакамітым парадоксе Ньюкомба (Вулперт і Бенфард [21]) ёсць прадказальнік B, гулец A і поле X. Гульцу A даецца выбар узяць поле X або поле X плюс $ 1,000. Перад тым як A зрабіць выбар, B прадказвае, што будзе рабіць A, і прагнозы B амаль пэўныя. Калі B прадказвае, што A зойме толькі поле X, тады B кладзе $ 1,000,000 у поле X. У гэтым выпадку, паколькі ў ёй ёсць $ 1,000,000, A атрымае $ 1,000,000 або $ 1,001,000 у залежнасці ад таго, выбрае Ці поле X ці X плюс $ 1,000. З іншага боку, калі B прагназуе, што A возьме поле X плюс $ 1,000, то B не змяшчае нічога ў поле X. У гэтым выпадку, у залежнасці ад выбару, A альбо атрымлівае $ 1,000, альбо нічога.

Парадокс Ньюкомба заключаецца ў тым, што два ідэальна рацыянальных аналізу даюць супярэчлівыя адказы на праблему аптымізацыі гульца А: пры гіпотэзе чаканай карыснасці гулец A павінен прыняць толькі поле X, паколькі чаканая акупнасць X будзе значна большай. З іншага боку, па прынцыпе панавання, гулец A павінен узяць поле X плюс $ 1,000.

Парадокс лепш за ўсё можна зразумець з фрагмента (Уолперт і Бенфард [21]): "... Ньюком сказаў, што ён проста возьме Х; навошта змагацца з богападобнай істотай? Аднак Нозік сказаў: "Практычна ўсім зразумела і зразумела, што трэба рабіць." Цяжкасць заключаецца ў тым, што гэтыя людзі, здаецца, размяркоўваюць практычна раўнамерна па праблеме, і вялікая колькасць думае, што супрацьстаяльная палова проста дурная ".".

Вольперт і Бенфард вырашаюць парадокс, паказваючы, што праблема Ньюкомба на самай справе ўяўляе сабой дзве розныя гульні з рознымі імавернаснымі вынікамі.

У гэтым раздзеле мы вырашым парадокс, паставіўшы праблему Ньюкомба як дылему зняволенага. Пры гэтым да вырашэння праблемы Ньюкомба можна прыйсці двума спосабамі: як не кааператыўнае рашэнне (прыміце поле X плюс $ 1,000), выкарыстоўваючы прынцып дамінавання, альбо як сумеснае рашэнне (прыміце толькі поле X), выкарыстоўваючы чаканае гіпотэза карыснасці.

Дапусцім, ёсць багаты дабрадзей, які абяцае фінансаваць матрыцу выплат для прагназатара B, атрымліваючы наступную гульню: A = [[$ 1,000,000, 0], [$ 1,001,000, $ 1,000]] і B = [[$ 1,000,000, $ 1,001,000 ], [0, $ 1,000]].

Калі B правільна прагназуе, B атрымлівае тое, што атрымлівае гулец A. Але калі B спрагназуе няправільна, B атрымлівае $ 1,001,000 мінус тое, што A атрымлівае21.

З Proposition 13, гульцы A і B будуць гуляць сумесна ў гэтай гульні.

Калі падобны на Нэш, гулец вырашае праблему, выкарыстоўваючы прынцып дамінавання, як і прагназатар. І прагназатар, і гулец будуць мець рашэнне, якое не працуе ў супрацоўніцтве: вазьміце Х плюс $ 1,000. Калі гулец вырашыць праблему з дапамогай гіпотэзы чаканай карыснасці, гэта робіць і прагназатар, і прагназатар, і гулец будуць вырашаць сумеснае рашэнне: вазьміце толькі X. У любым выпадку прадказанне прагназатара будзе

і Садоўскі [6]) альбо апісаны новыя метады, напрыклад, сі-тын, карэляваныя раўнавагі (Axelrod [3]; Aumann [1]).

21 Звярніце ўвагу, што, прадстаўляючы праблему Newcomb як праблему PD, прадказальніку прадастаўляецца асабісты стымул, які адсутнічае ў праблеме Newcomb.

пэўны. Паколькі з Proposition 13, гульцы не будуць гуляць у кааператыўнае рашэнне, мы згодныя з Newcomb, што супрацоўніцтва - гэта відавочная стратэгія.

Звярніце ўвагу на мал. 1, аднак, рэгіён для супрацоўніцтва нязначна меншы, чым для не-супрацоўніцтва. Тады нам не дзіўна, калі людзі раўнамерна дзеляцца на якую стратэгію.

Абагульненне дылемы зняволенага на М-твары.

Для таго, каб лепш зразумець, як рашэнне Нэша можа разбурыць агульныя мадэлі эканамічнага раўнавагі, давайце абагульнім дылему зняволеных перад M-Persons, і кожны з гульцоў мае стратэгію 2 для M 2.

Апішам гульню M-Person з дапамогай бінарных дрэў.

Мал. 2 - гэта дылема паляпшэння зняволенага для гульца А. Дрэва (2, 1) - бінарнае дрэва, у якога гулец B (плэер 2) у якасці бацькоў, і гулец A (гулец 1) у якасці дзіцяці. Каб атрымаць выплату для гульца B, проста пераключыце ролі бацькоў і дзяцей на Дрэва (1, 2). Нагадаем, што для дылемы зняволенага A12 <A22 <A11 <A21.

Далей, выкажам здагадку, дрэва (M - 1, M - 2,…, 2, 1) пазначае выплату гульца A за гульню (M - 1) -Person, для M 3. Пабудуйце дрэва выплаты гульца A (M, M - 1,…, 2, 1) для гульні M-Person, дазволіўшы дрэву гульца A (M - 1, M - 2,…, 2, 1) быць пад дрэвамі на абодвух галіны бацькоўскага гульца М.

Лічбавыя значэнні пакупкі на правым падрэдаве лічацца рознымі ад значэнняў у левым пад дрэве, пакуль сувязь A12 <A22 <A11 <A21 захоўваецца паўсюдна ў дрэве.

Нарэшце, улічваючы дрэва (M, M - 1,…, 2, 1) для гульца A, стварыце дрэва (1, M, M - 1,…, 3, 2) для гульца B (плэер 2), зрабіўшы 1 самым высокім бацькоўскі; Дрэва (1, 2, M, M - 1,…, 4, 3) для гульца 3, зрабіўшы 2 другім вышэйшым бацькам,…, Дрэва (1, 2, 3,…, M - 2, M, M - 1 ) для гульца M - 1, зрабіўшы M - 2 трэцім самым нізкім дзіцем, дрэвам (1, 2, 3,…, M - 1, M) для гульца M, зрабіўшы M - 1 другім самым нізкім дзіцем.

На гэтым завяршаецца апісанне выплат гульцоў за дылему дылемы M-Person, прычым кожны гулец мае стратэгіі 2.

Тэарэма 14. Для дылемы зняволенага М-чалавека, М 2, выкарыстоўваючы прынцып дамінавання, рашэнне Nash для гульцоў, каб гуляць у стратэгію 2.

Доказ. Мы ўжо ведаем, што тэарэма выканана для M = 2. Дапусцім, паводле індукцыі, што тэарэма выканана для M - 1, для M 3. Пакажам, што тэарэма выканана для М.

Улічваючы дрэва (M, M - 1,…, 2, 1) для гульца A, нагадаем, што па будаўніцтве пад дрэвы злева і справа адгалінаванні маюць выгляд дрэва (M - 1, M - 2,…, 2 , 1) для плэера 1, дрэва (M, M - 1,…, 2) для гульца 2, дрэва (2, M, M - 1,…, 4, 3) для гульца 3,…, дрэва (2,… , M - 2, M, M - 1) для гульца M - 1. Гэтыя пад дрэвы ідэнтычныя для гульцоў 1, 2,…, M - 1, за выключэннем маркіроўкі на бацькоўскіх вузлах. Звярніце ўвагу, што стратэгія 2 кожнага гульца пераважае над яго стратэгіяй 1 пры любых умовах. Індукцыя, выкарыстоўваючы прынцып дамінавання, гульцы 1 да M - 1 будуць гуляць у стратэгію 2.

Такім чынам, улічваючы Дрэва (1, 2,…, M - 1, M) для гульца M, калі M гуляе ў 1, выплата для гульца M складае b (другі самы правы вузел дрэва), тады як калі M гуляе 2, выплата для гульца M гэта A22 (самы правы вузел дрэва). Па прынцыпе дамінавання, паколькі A12 <A22, гулец M таксама будзе гуляць у стратэгію 2. QED

Дапусцім, любая выплата тыпу A11 значна большая, чым любая выплата тыпу A22; і што A21 = A11 + m, дзе выплаты A11 і A21 знаходзяцца ў сумежных вузлах.

Зразумела, што падыход Нэша не разглядае магчымасць кааператыўнага рашэння "гуляць у стратэгію 1", нават калі гэта відавочнае рашэнне.

Вынікаючы індуктыўны аргумент тэарэмы 14, можна таксама зрабіць выснову, што, паколькі пад дрэвы на левай і правай галінах маюць выгляд дрэва (M - 1, M - 2,…, 2, 1) для гульца 1, Tree ( M - 1, M - 2,…, 2) для гульца 2, дрэва (2, M, M - 1,…, 4, 3) для гульца 3,…, дрэва (2,…, M - 2, M, M - 1) для плэера M - 1, з дапамогай індукцыі, выкарыстоўваючы чаканую гіпотэзу ўтыліты, гульцы 1 да M - 1 будуць гуляць у стратэгію 1, дзе выплата тыпу A11.

Такім чынам, улічваючы дрэва (1, 2,…, M - 1, M) для гульца M, калі M гуляе ў 1, разплата для гульца M з'яўляецца (самы крайні левы вузел дрэва), тады як, калі M гуляе 2, выплата за гулец M - гэта A21 = A11 + m (другі левы вузел дрэва). Паколькі A11 <A21, гулец M можа спакусіцца гуляць у стратэгію 2. Але чаму стратэгія гульні 2 рызыкі для м адзінак больш, чым A11, калі гэта можа прывесці да выплаты тыпу A22, выплаты значна менш, чым A11?

Па гіпотэзе чаканай карыснасці, гулец M таксама павінен гуляць у стратэгію 1.

Агульныя M-person Games.

Нарэшце, мы абагульняем тэарэму 1 для агульных гульняў M-person.

Няхай будуць M гульцы, у якіх кожны гулец мае ni магчымых стратэгій для кожнага i = 1, 2, ..., M. Улічваючы вектар стратэгіі (j1, j2, ..., jM), хай выкуп гульцу будзе Aij1j2… jM. Няхай xi - гэта змяшаная стратэгія для гульца, гэта значыць, стратэгія xi дзе Σj xij = 1, xij 0, усё j, і няхай x = (xi, xi) абазначае стратэгію ўсіх гульцоў. Праблема Нэша:

дзе EP (i | xi) - гэта чаканая выплата гульцу i дадзена xi, і калі сумаванне перавышае ўсе jk і ўсе k.

Стратэгія x * - гэта раўнавага Нэша, калі xi * - гэта рашэнне праблемы гульца i вышэй, улічваючы xi *.

Для нашага падыходу хай піj1, j2,…, jM быць чаканай верагоднасцю гульца i, калі гулец k гуляе jk, для ўсіх jk і ўсіх k. Тэорыя чаканай карыснасці фон Ноймана-Моргенштерна кажа, што мэтай гульца з'яўляецца максімальнае павелічэнне яго чаканай выплаты:

дзе сумаванне скончана ўсім jk і ўсім k.

вызначаць

дзе -i гуляе j-i азначае, што гулец k гуляе jk і дзе сумаванне перавышае jk, для ўсіх k i.

Тэарэма 15. Праблемы (13) ніжэй раўназначныя праблемам (11):

Доказ.. Па вызначэнні,

дзе сумаванне вышэй усіх rk, для любога k i.

Назоўнік (14) - гэта верагоднасць пі (i гуляе ў джы). Такім чынам,

З Σ pi (я гуляе ў ji) = 1 і pi (я гуляе ў ji) 0 для ўсіх ji, вынікае, што гулец i гуляе стратэгію [arg maxji EP (i | i igra ji)]. QED

Метад пошуку лепшай стратэгіі для гульца i наступны: Для любой пары стратэгій для гульца, скажам, стратэгія r і стратэгіі s, вылічыце локус балаў, у якіх чаканыя выплаты ўмоўныя для гульца, калі я гуляю альбо r альбо s роўныя . Гэта вызначае паверхню абыякавасці, якая падзяляе прастору ўмоўнай верагоднасці на зоны 2 VNM. Адна вобласць VNM пазначана r, таму што стратэгія выбару r, а іншая VNM вобласць мечана s, таму што стратэгія выбару s.

Пасля вылічэнняў, прыведзеных вышэй, кожны рэгіён VNM будзе пазначаны столькі разоў, колькі існуе розных пар стратэгій. Для любога дадзенага рэгіёну VNM вазьміце любыя два з некалькіх надпісаў і выдаліце ​​адзін з іх на аснове паверхні абыякавасці, створанай гэтай парай этыкетак. Працэс заканчваецца, калі ў кожнай вобласці VNM ёсць толькі адзін ярлык.

Агульныя гульні 2-чалавека.

Няхай у гульца A ёсць стратэгіі Ai, i = 1, 2, ... n1, а ў гульца B ёсць стратэгіі Bj, j = 1, 2, ... n2. Дапусцім, што верагоднасць гульцоў узаемна незалежная. Праблема (13) складаецца ў:

Такім чынам, рэгіёны VNM вызначаюцца выпуклымі шматграннікамі:

Як можна назіраць у (16), пошук рашэння, усталяванага для агульнай гульні 2-чалавека, проста. Напрыклад, разгледзім больш за дзве тысячы гадоў гульні Rock-Paper-Scissors, дзе раўнавагу Нэша: гуляць у любую стратэгію з верагоднасцю 33%:

Стратэгія A1 або B1 (рок) прайграе стратэгіі A2 альбо B2 (папера) прайграе стратэгіі A3 альбо B3 (нажніцы) прайграе качанню.

Для прайгравальніка A, увогуле, мы дзе, дзе 0 pA (Bj) 1,

які зводзіць да

І гэтак жа, як і для гульца Б.

Новая стратэгія гэтай старажытнай гульні выглядае так: гуляць у рок, калі вы верыце, што ваш праціўнік будзе гуляць у паперу з верагоднасцю не больш за 33% і нажніцы з верагоднасцю не менш за 33%; гуляць у паперу, калі вы верыце, што ваш праціўнік будзе гуляць нажніцы з верагоднасцю не больш за 33% і пампавацца з верагоднасцю не менш 33%; астатнія гуляюць нажніцамі22.

Гульні 3 для чалавека, дзе кожны чалавек мае стратэгіі 2.

Давайце ўжываем тэарэму 15 для пошуку рашэння, усталяванага ў гульні 3-чалавека, дзе кожны гулец A, B і C мае стратэгіі 2 Ai, Bi, Ci, для i = 1, 2 адпаведна.

Дапусцім, што верагоднасць гульцоў узаемна незалежная. Для гульца A раўнанне (13) ёсць

і гэтак жа, як для гульцоў B і C. Выкарыстоўваючы Theorem 15, рашэнне вызначаецца:

Давайце скарыстаемся вышэй для гульні ў Бар-цесна[21]:

Калі гулец знаходзіцца дома, яго выплата складае 1; калі гулец адзін у бары, яго разплата складае 0; калі гулец знаходзіцца ў бары з іншым чалавекам, яго выплата складае 2; інакш, яго выплата складае -1.

У нас ёсць: A111 - A211 = -2, A112 - A212 = A121 - A221 = 1, A122 - A222 = -1, адсюль VNM вобласць A1 - вобласць -3pA (BXXUMUM) (PXXUMUM) (C1) - 1 ≥ 2, альбо эквівалентна рэгіён[22] pA (B1) ≥ (1 - 2pA (C1)) / (2 - 3pA (C1)). Падобным чынам, VNM вобласць B1 - гэта вобласць pB (A1) ≥ (1 - 2pB (C1)) / (2 - 3pB (C1)), а VNM вобласць C1 - гэта вобласць pC (B1) ≥ (1X) - X (XNUMUMX) / (2 - 1pC (A2)). Раўнавагі Неша з'яўляюцца p (A) = p (B) = p (C) = 3 і p (A) = p (B) = p (C) = 1 / 1.

Пацвярджэнне.

Мы хацелі б падзякаваць Аль Роту і Тоду Дэвіс за неацэнныя парады і рэкамендацыі пры падрыхтоўцы гэтага дакумента.

зноскі

[1] Для прастаты мы робім агульную здагадку, што ўтыліта - гэта лінейная функцыя выплат (Starmer [18]). Такім чынам, максімізацыя чаканай карыснасці супадае з максімізацыяй чаканай выплаты.

[2] Наш байескі падыход да гульняў адрозніваецца ад папярэдніх баесаўскіх работ (напрыклад, Acevedo і Krueger [4]; Aumann [1]; Дейлі і Садоўскі [6]; McKelvey і Palfrey [12]; Quattrone і Tversky [15]) у тым, што, у адрозненне ад іншых падыходаў, умоўныя верагоднасці нашага падыходу адназначна адносна чаканай гіпотэзы карыснасці, якую наша рашэнне заўсёды задавальняе.

[3] Крытык сцвярджае: "Рацыянальныя гульцы не павінны і не павінны разглядаць умоўныя імавернасці ... Уявіце агента, які ведае, што верагоднасць дажджу роўная. Здаецца, ваша "рашэнне" заключаецца ў тым, што агент павінен узяць парасон з сабой, калі ідзе дождж, і пакінуць парасон, калі не будзе дажджу ".
Тэарэма 1 паказвае, што ранейшая крытыка з'яўляецца неабгрунтаванай. Што тычыцца апошняй крытыкі, няхай EP (агент | прыносіць парасон) = p, а EP (агент | не прыносіць парасон) = 1 - p. Наша рашэнне будзе: прынесці парасон, калі p ≥ 1 / 2; не прыносіце парасон, калі p ≤ 1 / 2.

[4] Умоўныя імавернасці (2) не парушаюць прынцыпу Спона [17]: "Любая адэкватная колькасная мадэль рашэння не павінна яўна альбо няяўна ўтрымліваць любыя суб'ектыўныя верагоднасці для дзеянняў ..." Умоўныя верагоднасці гульца з'яўляюцца суб'ектыўнымі верагоднасцямі для апанента стратэгіі, а не для ўласных стратэгій.

[5] Гэтая тэарэма будзе абагульнена да адной для гульняў M-чалавека.

[6] Няма сігналізацыі паміж прайгравальнікамі.

[7] Незалежныя зменныя pA (B1 | A1) і pA (B2 | A2) мяркуюцца прыведзенымі ў задачы максімізацыі, гэта спрашчэнне, якое дазваляе пазбегнуць праблемы бясконцага рэгрэсу (падобна здагадцы Нэша, што p (B1) дадзены гульцу А ў пастаноўцы праблемы максімізацыі).

[8] Няроўнасць (5) - гэта (выяўленае) рашэнне праблемы (1) тым самым спосабам, што квадратычная формула з'яўляецца рашэннем агульнага квадратнага раўнання.

[9] Прыярытэты гульца могуць залежаць ад часткова назіраных выпадковых падзей, напрыклад, ад надвор'я. Пра выкарыстанне іпрыёраў у гульнях з няпоўнай інфармацыяй пра байесаўскіх гульцоў, калі ласка, звярніцеся да (Harsanyi [10]).

[10] Гэта агульнае рашэнне змяшчае раўнавагу Неша як прыватныя рашэнні. У адрозненне ад апісальных рашэнняў Нэша, наша рашэнне ўяўляе сабой пару прадпісальных рацыянальных чаканняў стратэгій. Акрамя таго, калі памылкова, гулец A знаходзіцца ў рэгіёне VNM A1 і гуляе A2, следства 2 заяўляе, што гулец A атрымае меншы чаканы прыбытак.

[11] Цікава адзначыць, што пры змешанай раўнавазе Неша стратэгія гульца залежыць ад ведання функцыі выплат іншага гульца.

[12] Нулявыя знакі ігнаруюцца ў табліцы, бо гэтыя выпадкі перараджаюцца: гулец не ў стане выбіраць паміж двума сваімі стратэгіямі. Таксама цікава адзначыць, што кожная раўнавага Нэша з'яўляецца роўна ў чатыры шэрагі.

[13] Наступныя прыклады 3 адаптаваныя з (Дэвіс [7]) такім чынам, што можа служыць педагагічнай тэхнікай для студэнтаў у тэорыі гульняў. Табліца 1 можа быць выкарыстана для хуткага пошуку раўнавагі Неша для ўсіх прыкладаў гульняў 2 чалавека, апісаных тут.

[14] Дзеянні A не ўплываюць на выбар дзеянняў B. Гэта таму, што перакананні А непасрэдна звязаны з перакананнямі В. З іншага боку, калі вераванні карэлююць, верагоднасць абодвух гульцоў павінна быць роўнай 50%, у адваротным выпадку, калі скажам, верагоднасць гульцоў абедзве> 50%, A ведае, што B будзе гуляць у стратэгію 2 (хвасты), таму гульнявая стратэгія 1 (галоўкі) не можа быць правільным рэцэптам для А. Калі скажам, верагоднасць A складае> 50%, а верагоднасць B <50%, B ведае, што A будзе гуляць у галовы, а значыць, іграванне галоў не можа быць правільным рэцэптам для А. і г.д. Такім чынам, унікальным рашэннем з'яўляецца раўнавага Нэша: гуляць выпадкова для абодвух.

[15] Звярніце ўвагу, што pA (B1) = pB (A1) = 0 або 1 - гэта сцэна раўнавагі: абодва гульца круцяцца (або абодва ідуць прама), калі абодва гульца чакаюць, што другі гулец пойдзе прама (альбо павярнецца). У адрозненне ад гэтага, p (A1) = p (B1) = 0 або 1 не можа быць раўнавагі Нэша: калі B ідзе прама (або паварочваецца), A пагорнецца (або пойдзе прама).

[16] Крыніцы: Асацыяцыя кантролю над узбраеннем, Федэрацыя амерыканскіх навукоўцаў, Міжнародная група па падзельных матэрыялах, Міністэрства абароны ЗША, Дзярждэпартамент ЗША і Міжнародны інстытут даследаванняў міру ў Стакгольме.

[17] З арыгінальнай газеты Flood and Dresher было апублікавана тысячы артыкулаў пра яе. Пошук Google навукоўца на "дылему зняволенага" дае вынікі 104,000 з гэтага напісання. Калі ласка, дайце (Kuhn [14]).

[18] Такім чынам, гульцы не будуць гуляць у сумесныя рашэнні.

[19] Калі ваш праціўнік гуляе невыпадкова, на ваш папярэдні ўплыў могуць паўплываць папярэднія гульні вашага апанента.

[20] Формула можа быць распаўсюджана на M-асоб, для M> 3.

[21] Гэтая гульня заснавана на праблеме "Эль Фароль" (Артур [5]).

[22] Месцам абыякавасці з'яўляецца квадратычная крывая, якая праходзіць праз пункты (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5).

Спасылкі

[1] Aumann RJ (1974) Суб'ектыўнасць і карэляцыя ў выпадковых стратэгіях. Часопіс матэматычнай эканомікі 1: 67-96

[2] Aumann RJ, Maschler M (1995) Паўторныя гульні з няпоўнай інфармацыяй. MIT Press, Cambridge London

[3] Axelrod R (1984) Эвалюцыя супрацоўніцтва. Асноўныя кнігі

[4] Acevedo M, Krueger JI (2005) Доказная прычына ў дылеме зняволенага. Амерыканскі часопіс псіхалогіі 118: 431-457

[5] Артур WB (1994) Індуктыўная аргументацыя і абмежаваная рацыянальнасць. Амерыканскі эканамічны агляд 84: 406-411

[6] Дэйлі B, Садоўскі P (2017) Магічнае мысленне: Вынік прадстаўлення. Тэарэтычная эканоміка 12: 909-956 24 Дадзеная гульня заснавана на задачы "Эль Фароль" (Артур [5]). 25 Локусам абыякавасці з'яўляецца квадратычная крывая, якая праходзіць праз пункты (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5).

[7] Дэвіс Т (2004) Карысная тэорыя і тэорыя гульняў. Заўвагі да лекцыі

[8] Garcia CB, Zangwill WI (2017) Новы падыход да вайны ці міру. Рабочы дакумент

[9] Garcia CB, Zangwill WI (2018) Дамінанс, чаканая ўтыліта і дылема зняволенага. Рабочы дакумент

[10] Harsanyi J (1967) Гульні з няпоўнай інфармацыяй, згуляныя гульцамі "Bayesian" I - III. J. Навука аб кіраванні 14 (3): 159-182

[11] Kadane JB, Larkey PD (1982) Суб'ектыўная верагоднасць і тэорыя гульняў. Навука аб кіраванні 28 (2): 113-120

[12] McKelvey RD, Palfrey TR (1995) Квантальная раўнавага рэагавання для гульняў з звычайнай формай. Гульні і эканамічнае паводзіны 10: 6-38

[13] Jaynes ET (1968) Папярэдняя верагоднасць. Аперацыі IEEE на сістэмныя навукі і кібернетыку 4 (3): 227-241

[14] Дылема зняволенага Kuhn S (2017). Стэнфардская энцыклапедыя філасофіі

[15] Quattrone GA, Tversky A (1984) Прычынна-дыягнастычныя ўзаемасувязі: На самападман і на ілюзію выбаршчыка. Часопіс асобы і сацыяльнай псіхалогіі 46: 237-248

[16] Skyrms B (2004) Паляванне на алень і эвалюцыя сацыяльнай структуры. Cambridge University Press, Кембрыдж

[17] Spohn W (1977) Дзе Люсі і Кранц сапраўды абагульняюць мадэль рашэння Дзікуна. Erkenntnis 11: 113-134

[18] Starmer C (2000) Распрацоўкі ў тэорыі нечаканай карыснасці: паляванне на апісальную тэорыю выбару з рызыкай. Часопіс эканамічнай літаратуры 38: 332-382

[19] Sugden R (2005) Эканоміка правоў, супрацоўніцтва і дабрабыту. Palgrave MacMillan, выданне 2: 132

[20] Фон Нойман Дж. Моргенштэрн O (1953) Тэорыя гульняў і эканамічная паводзіны. Princeton University Press, Нью-Джэрсі

[21] Wolpert DH, Benford G (2011) Урок парадокса Ньюкома. Сінтэза 190: 1637-164