999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

2×2矩陣博弈中的混合策略均衡

2017-01-19 13:27:36史艷維

摘要:本文分析了2×2矩陣博弈中的混合策略均衡,討論了此類博弈的嚴(yán)格優(yōu)勢(shì)策略和純策略均衡,得到了在沒有嚴(yán)格優(yōu)勢(shì)策略且存在唯一均衡的2×2矩陣博弈中,均衡必為混合策略均衡。

關(guān)鍵詞:矩陣博弈; 嚴(yán)格優(yōu)勢(shì)策略; 均衡

博弈論是現(xiàn)代數(shù)學(xué)的一個(gè)新分支,也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。博弈論主要研究公式化了的激勵(lì)結(jié)構(gòu)間的相互作用。如今,博弈論在金融學(xué)、證券學(xué)、生物學(xué)、經(jīng)濟(jì)學(xué)、國(guó)際關(guān)系、計(jì)算機(jī)科學(xué)、政治學(xué)、軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。

均衡是博弈論一個(gè)重要研究對(duì)象。均衡是一種策略組合,使得同一時(shí)間內(nèi)每個(gè)參與人的策略是對(duì)其他參與人策略的最優(yōu)反應(yīng)。1951年納什提出著名的納什定理,即在矩陣博弈中一定存在均衡。這里的均衡可能是純策略均衡,也可能是混合策略均衡。

2×2矩陣博弈是一類最基本且被廣泛應(yīng)用的重要博弈類型,它是指在博弈過(guò)程中只有兩個(gè)參與人(參與人1和參與人2),且每個(gè)參與人只有兩個(gè)可選策略。經(jīng)典博弈諸如囚徒困境、性別戰(zhàn)爭(zhēng)、古諾雙寡頭壟斷、貝特蘭德雙寡頭壟斷等博弈都可以歸為此類博弈。

本文分析了2×2矩陣博弈中的混合策略均衡,討論了此類博弈的嚴(yán)格優(yōu)勢(shì)策略和純策略均衡,得到了在沒有嚴(yán)格優(yōu)勢(shì)策略且存在唯一均衡的2×2矩陣博弈中,均衡必為混合策略均衡。

考慮2×2矩陣博弈。對(duì)于參與人1和參與人2,參與人1的可選策略為U和D,參與人2的可選策略為L(zhǎng)和R。他們的收益情況如下:

(1)當(dāng)參與人1選擇策略且參與人2選則策略時(shí),他們的收益分別為和;

(2)當(dāng)參與人1選擇策略且參與人2選則策略時(shí),他們的收益分別為和;

(3)當(dāng)參與人1選擇策略且參與人2選則策略時(shí),他們的收益分別為和;

(4)當(dāng)參與人1選擇策略且參與人2選則策略時(shí),他們的收益分別為和。

我們可以用如下的矩陣表示:

其中第一列表示參與人1的可選策略,第一行表示參與人2的可選策略,收益中前者為參與人1的收益,后者為參與人2的收益。

設(shè)參與人1選取策略的概率為,參與人2選取策略的概率為。這樣,參與人1選取策略的概率為,參與人2選取策略的概率為。

可見,對(duì)參與人1而言,選取策略的期望收益為,選取策略的期望收益為,于是參與人1選取策略和策略無(wú)差異當(dāng)且僅當(dāng)。令表示參與人1對(duì)參與人2隨機(jī)化概率的反應(yīng)函數(shù)。則

類似地,對(duì)參與人2而言,選取策略的期望收益為,選取策略的期望收益為,于是參與人2選取策略和策略無(wú)差異當(dāng)且僅當(dāng)。令表示參與人2對(duì)參與人1隨機(jī)化概率的反應(yīng)函數(shù)。則

在博弈中,參與人的嚴(yán)格優(yōu)勢(shì)策略是使得參與人選取該策略所獲收益嚴(yán)格大于選取其他策略所獲收益。在2×2矩陣博弈中,嚴(yán)格優(yōu)勢(shì)策略具有如下特征:

對(duì)參與人1而言,策略嚴(yán)格優(yōu)于策略當(dāng)且僅當(dāng);策略嚴(yán)格優(yōu)于策略當(dāng)且僅當(dāng)。

對(duì)參與人2而言,策略嚴(yán)格優(yōu)于策略當(dāng)且僅當(dāng);策略嚴(yán)格優(yōu)于策略當(dāng)且僅當(dāng)。

由于均衡是每個(gè)參與人對(duì)其對(duì)手策略選擇的最優(yōu)反應(yīng),則在2×2矩陣博弈中,純策略均衡具有如下特征:

是均衡當(dāng)且僅當(dāng)且;是均衡當(dāng)且僅當(dāng)且;是均衡當(dāng)且僅當(dāng)且;是均衡當(dāng)且僅當(dāng)且。

定理 在2×2矩陣博弈中,如果不存在嚴(yán)格優(yōu)勢(shì)策略,且存在唯一的均衡,則此均衡必為混合策略均衡。

證明 (反證法)假設(shè)此博弈中唯一的均衡是純策略組合,設(shè)為,不失一般性,取,對(duì)策略組合,和可類似地討論。由于是均衡當(dāng)且僅當(dāng)且。對(duì)此分情況進(jìn)行討論。

(1)且。由于對(duì)參與人1而言,策略不嚴(yán)格優(yōu)于策略,則,于是;對(duì)參與人2而言,策略不嚴(yán)格優(yōu)于策略,則。于是策略組合是博弈中的一個(gè)均衡,這與是唯一的均衡矛盾。

(2)且。此時(shí),則,于是存在使得,即,從而令參與人1選取策略的概率為,可見混合策略組合是博弈的一個(gè)均衡,其中表示參與人1以概率選取策略,以概率選取策略,表示參與人2選取策略。這與是唯一的均衡矛盾。

(3)且。此時(shí),則,于是存在使得,即,從而令參與人2選取策略的概率為,可見混合策略組合是博弈的一個(gè)均衡,其中表示參與人1選取策略,表示參與人2以概率選取策略,以概率選取策略。這與是唯一的均衡矛盾。

(4)且。此時(shí)若策略組合不是均衡,則;若策略組合不是均衡,則。這樣策略組合是博弈的一個(gè)均衡,與是唯一的均衡矛盾。

綜上可知,策略組合不是此博弈的均衡,從而此2×2矩陣博弈的均衡必為混合策略組合。

參考文獻(xiàn):

[1]車競(jìng),錢煒祺,和爭(zhēng)春.基于矩陣博弈的兩機(jī)攻防對(duì)抗空戰(zhàn)仿真[J].飛行力學(xué),2015,33(2): 173-177.

[2]馬國(guó)勇,石春生.基于博弈矩陣模型的企業(yè)研發(fā)策略[J].統(tǒng)計(jì)與決策,2012,1: 54-55.

[3]R.Gibbons.A Primer in Game Theory[M].Prentice Hall,1994.

[4]D.Fudenberg,J.Tirole.Game Theory[M].MIT Press,1991.

[5]張維迎.博弈與社會(huì)[M].北京大學(xué)出版社,2013.

作者簡(jiǎn)介:

史艷維(1980- ), 女, 陜西西安人, 講師, 主要從事博弈論與應(yīng)用非標(biāo)準(zhǔn)分析方向的研究。

主站蜘蛛池模板: 热99精品视频| 一本久道热中字伊人| 台湾AV国片精品女同性| 亚洲中文无码h在线观看| 一本大道香蕉久中文在线播放| 亚洲国产清纯| 国产欧美视频一区二区三区| 国产日韩精品一区在线不卡 | 欧美精品在线观看视频| 欧洲成人免费视频| 国产福利在线免费| 91极品美女高潮叫床在线观看| 国产精品冒白浆免费视频| 99热这里都是国产精品| 久久精品视频一| 国产一区免费在线观看| 亚洲精品日产AⅤ| 香蕉视频国产精品人| 国产成人禁片在线观看| 亚洲第一区精品日韩在线播放| 国产精品永久在线| 亚洲成人一区二区三区| 国产精品尤物铁牛tv| 性欧美在线| 四虎国产永久在线观看| 麻豆国产在线不卡一区二区| 亚洲无码精彩视频在线观看 | 久久久久中文字幕精品视频| 亚洲色精品国产一区二区三区| 日本不卡在线| 亚洲第一色网站| 亚洲综合18p| AV不卡在线永久免费观看| 一级一毛片a级毛片| 孕妇高潮太爽了在线观看免费| 日本AⅤ精品一区二区三区日| 呦女精品网站| 国产成人永久免费视频| 国产精品女同一区三区五区| 蝴蝶伊人久久中文娱乐网| 亚洲日韩精品欧美中文字幕| 亚洲色大成网站www国产| 欧美午夜小视频| 成人午夜在线播放| 国产在线观看91精品亚瑟| 九九久久精品国产av片囯产区| 亚洲国产欧洲精品路线久久| 毛片在线看网站| 久草网视频在线| 18黑白丝水手服自慰喷水网站| 国产亚洲欧美日韩在线一区二区三区| 国产91全国探花系列在线播放| 精品91在线| 欧美中文一区| 欧美激情伊人| 一区二区在线视频免费观看| 伊人大杳蕉中文无码| 91视频首页| a国产精品| 日本不卡在线| 亚洲欧美人成人让影院| 久久女人网| 国产极品美女在线观看| 欧美日韩福利| 午夜不卡福利| 国产成人a毛片在线| 91青草视频| 中国黄色一级视频| 国产99视频免费精品是看6| 激情爆乳一区二区| 午夜国产精品视频黄| 全部毛片免费看| 亚洲av日韩综合一区尤物| 无码国产伊人| 久久伊人色| 国产亚洲视频免费播放| 日韩在线成年视频人网站观看| 91啦中文字幕| 青青青草国产| 国产本道久久一区二区三区| 国产成人免费观看在线视频| 88国产经典欧美一区二区三区|