999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

不完備偏好擴(kuò)展式博弈的序貫均衡

2012-01-01 00:00:00時(shí)奇,諶貽慶
經(jīng)濟(jì)數(shù)學(xué) 2012年1期

摘 要 將Kreps和Wilson提出的序貫均衡解概念推廣到了存在不完備偏好的情形. 首先給出了一個(gè)修正的顫抖手完美均衡的概念, 然后應(yīng)用它去證明不完備偏好擴(kuò)展式博弈序貫均衡的存在性.

關(guān)鍵詞 博弈;不完備偏好;序貫均衡;納什均衡;顫抖手完美均衡

中圖分類號(hào) F016 文獻(xiàn)標(biāo)識(shí)碼 A

Sequential Equilibrium in Extensive Games with Incomplete Preferences

SHI Qi 1,2, CHEN Yiqing 1

(1.School of Economics and Management, Nanchang University, Nanchang, Jiangxi 330031,China;

2.School of Economics, Shanghai University of Finance and Economics, Shanghai 200433,China)

Abstract The Kreps and Wilson’s solution concept of sequential equilibrium was generalized to the extensive games with incomplete preferences.First a revised concept of trembling hand perfect equilibrium was given, and then was applied to verify the existence of sequential equilibrium in extensive games with incomplete preferences.

Key words game;Incomplete preference;Sequential equilibrium;Nash equilibrium;Trembling hand perfect equilibrium

1 引 言

上個(gè)十年不完備偏好理論得到了復(fù)興[1-3]. Bade[4]把它應(yīng)用到博弈論中, 廣泛地探討了在參與者具有不完備偏好時(shí)的納什均衡概念. Bade將經(jīng)典納什均衡概念擴(kuò)展到不完備偏好的環(huán)境下, 發(fā)現(xiàn)一個(gè)博弈的納什均衡恰好就是該博弈的所有完備化博弈的納什均衡集的并集. 而且, 如果不完備偏好可以被一個(gè)多效用函數(shù)[1]所表示, 那么在一定假設(shè)下, 納什均衡集恰好就是該博弈所有線性完備化博弈的納什均衡集的并集.

納什均衡是博弈論中最重要的解概念, 但是, 它可能會(huì)給出了太多均衡; 當(dāng)博弈存在不完美信息的時(shí)候, 它甚至可能造成誤導(dǎo). Kreps和Wilson提出的序貫均衡[5]是納什均衡的精練, 其基本思想在于均衡不僅應(yīng)該描述參與者的策略, 還要描述參與者在每個(gè)信息集上關(guān)于究竟是哪個(gè)歷史發(fā)生了的信念. 一個(gè)很自然的問(wèn)題是: 當(dāng)去掉完備偏好的假設(shè), 是否仍然能夠定義一個(gè)序貫均衡的概念, 使得它在每個(gè)有限擴(kuò)展式博弈都存在呢?與Kreps和Wilson類似, 想使用原擴(kuò)展式博弈的代理人標(biāo)準(zhǔn)式表示的顫抖手完美均衡來(lái)證明序貫均衡的存在性. 然而, 對(duì)于不完備偏好, 顫抖手完美均衡可能不是一個(gè)納什均衡. 幸運(yùn)的是, 任意有限博弈都有一個(gè)顫抖手完美納什均衡(THPNE), 這樣就能得到與Kreps和Wilson類似的結(jié)論.

2 基本概念

在本文中, Γ:={N∪{c},H,P,fc,(Ii)i∈N,(≥i)i∈N}表示一個(gè)完美記憶有限擴(kuò)展式博弈. 其中, N為有限的參與人集合, c為自然, H為歷史集合, P 為參與人函數(shù),fc為每個(gè)P(h)=c 的歷史h指定一個(gè)A(h)上的概率測(cè)度f(wàn)c(·|h)), 而且, 集合Ιi∈Ii為參與人i的一個(gè)信息集.

終結(jié)歷史集合標(biāo)記為Z. 每個(gè)參與人i∈N擁有一個(gè)定義在Z上的(可能為不完備的)偏好關(guān)系≥i.假設(shè)每個(gè)偏好關(guān)系≥i都是傳遞的, 反身的, 但是, 與經(jīng)典理論不同, 不一定是完備的. 參與人 i 在 x和y之間無(wú)差異, 標(biāo)記為x~iy, 當(dāng)且僅當(dāng)x≥iy 且y≥ix. 參與人 i 嚴(yán)格偏好x甚于y, 標(biāo)記為x>iy, 當(dāng)且僅當(dāng)x≥iy但不是y≥ix.

與不完備偏好表示理論的最近文獻(xiàn)[2]相似, 考慮偏好關(guān)系≥i 是可以被函數(shù)表示的, 也即, 存在一個(gè)函數(shù)u:Z→Rn使得x≥y當(dāng)且僅當(dāng)u(x)≥u(y). 在下文中, 將用Γα:={N∪{c},H,P,fc,(Ii)i∈N,(ui)i∈N}表示博弈

Γα:={N∪{c},H,P,fc,(Ii)i∈N,(≥i)i∈N}, 其中函數(shù)ui:Z→Rmi表示偏好≥i. 更具體而言, 對(duì)于任意向量α={α1,…,αI},αi∈Rmi, 定義一個(gè)博弈

Γα:=N∪{c},H,P,fc,(Ii)i∈N,uii∈I,

其中, αiui:Z→R定義為αi和ui的點(diǎn)積, 或αiui=∑mij=1αijuij. 進(jìn)一步的, 定義

Δ:={α={α1,…,αI},αi∈Δmi,i},

經(jīng) 濟(jì) 數(shù) 學(xué)第 29卷第1期時(shí) 奇等:不完備偏好擴(kuò)展式博弈的序貫均衡

Δ+:=Δ∩R∑mi+ +,

其中,Δmi表示mi-1維單純形.

如果≥′和≥都是定義在Z上的偏好關(guān)系,≥≥′且>>′, 那么稱≥′是≥的完備化. 說(shuō)一個(gè)擴(kuò)展式博弈Γ′:={N∪{c},H,P,fc,(Ii)i∈N,(≥′i)i∈N}是另一個(gè)擴(kuò)展式博弈Γ:={N∪{c},H,P,fc,(Ii)i∈N,(≥i)i∈N}的完備化, 如果對(duì)于每個(gè)參與人i, ≥′i都是≥i的完備化. 那么, 對(duì)于任意αi>>0, 函數(shù)αiui代表了由ui所代表的偏好關(guān)系的完備化. 因此, 對(duì)于任意α∈Δ+, 博弈Γα是原博弈Γ的線性完備化.

仿照Kreps和Wilson的證明方法, 考慮博弈Γα的代理人標(biāo)準(zhǔn)表示(ANFR)[6]. 但在此之前, 給出一些術(shù)語(yǔ). 用Ii標(biāo)記參與人i應(yīng)該行動(dòng)的那些信息集的集合, 用 s 標(biāo)記任意信息集, 用 i.s 標(biāo)記應(yīng)該在信息集s∈Ii行動(dòng)的那個(gè)代理人. 而且, 用Ds標(biāo)記信息集s可以采取的行動(dòng); 更具體的說(shuō), 如果知道在信息集s采取行動(dòng)的應(yīng)該是參與人i, 那么稱他可以采取的行動(dòng)集為Di.s. 那么, 博弈Γα的ANFR可以表示為

Γaα:={I∪{c},(Di.s)i.s∈I,(ui)i∈N},

其中, I表示所有代理人的集合.

3 納什均衡和顫抖手完美均衡

給定博弈Γα, 定義代理人 i.s 的最優(yōu)反應(yīng)映射BRui,使得

BRui(σ-i.s):=arg max di.s∈Di.sui(di.s,σ-i.s),

其中,-i.s表示除i.s之外的其他代理人. 那么, 對(duì)于任意y(σ-i.s)∈BRui.s(σ-i.s), 給定其他代理人的行為策略σ-i.s, 不存在y′(σ-i.s)使得(σ-i.s,y′(σ-i.s))>i(σ-i.s,y(σ-i.s)).

對(duì)于博弈Γa的完備化Γaα, 也可以定義參與人i.s的最優(yōu)反應(yīng)映射BRαiui使得

BRαiui(σ-i.s):=arg max di.s∈Di.sαiui(di.s,σ-i.s).

定理1 對(duì)于所有代理人i.s, 以及所有αi∈Δmi+,有

BRαiui(σ-i.s)BRui(σ-i.s).

證明 用反證法. 假設(shè)定理1不成立, 那么必存在σ-i.s和di.s使得 di.s∈BRαiuiσ-i.s但di.s∈BRuiσ-i.s成立. 這樣必存在d′i,s使得di,s. 因?yàn)棣联琲∈Δmi+, 那么αid′i,s>αidi,s, 這與di.s∈BRαiuiσ-i.s相矛盾.

定理2 對(duì)于所有代理人i.s和所有σ-i.s,BRuiσ-i.s是上半連續(xù)的.

證明 因?yàn)椴┺氖怯邢薜模?BRuiσ-i.s總是緊值的. 根據(jù)最大值定理[7], 有, 對(duì)于所有代理人i.s, 所有αi∈Δmi+, 以及所有是上半連續(xù)的. 那么, 對(duì)于任意序列(σk-i.s)→σ-i.s和yk∈BRuiσk-i.s, 存在yk的一個(gè)子序列收斂于BRuiσ-i.s中的一點(diǎn). 但是, 根據(jù)定理1, 有BRαiuiσ-i.sBRuiσ-i.s. 那么BRuiσ-i.s也是上半連續(xù)的.

一個(gè)隨機(jī)策略組合σ:=(σ1,σ2,…,σI)是博弈Γaα的納什均衡, 如果不存在一個(gè)代理人i.s有策略σ′i,s∈Δ(Di,s)使得(σ′i,s,σ-i,s)>(σi,s,σ-i,s). 將一個(gè)擴(kuò)展式博弈的所有納什均衡集合標(biāo)記為NEΓ.

一個(gè)隨機(jī)策略組合σ:=(σ1,σ2,…,σI)是博弈Γaα的一個(gè)顫抖手完美均衡, 如果存在一個(gè)序列σk∞k=0使得

σk∈×i.s∈IΔ+Di.s,k∈1,2,3,…,

lim k→∞σki.sdi.s=σi.sdi.s,i.s∈I,di.s∈Di.s,

σi.s∈arg max uiσk-i.s,τi.s,i.s∈N,

但是, 如果允許不完備偏好, 一個(gè)顫抖手完美均衡可能不是納什均衡, 這與完備偏好情形時(shí)是不同的. Bade [4]給出了一個(gè)簡(jiǎn)單的反例,并且建議應(yīng)該把目光集中在那些也是納什均衡的顫抖手完美均衡上, 這就產(chǎn)生了一個(gè)新概念,即顫抖手完美納什均衡(trembling hand perfect Nash equilibrium, THPNE). 幸運(yùn)的是, 在一個(gè)有限擴(kuò)展式博弈的代理人戰(zhàn)略式中, 總是可以找到一個(gè)THPNE, 這一點(diǎn)由Bade[4]的推論1所保證.

定理3 (Bade)任意有限博弈Γaα都有一個(gè)顫抖手完美納什均衡.

4 序貫均衡

現(xiàn)在進(jìn)入到本文的核心部分, 原博弈Γ的序貫均衡的存在性. 先考慮這樣一個(gè)評(píng)估σ,μ[8], 其中σ為行為策略組合, μ為一個(gè)這樣的信念函數(shù):為每個(gè)信息集的歷史指定一個(gè)概率測(cè)度.

定義, 結(jié)果Oσ,μs為給定信息集s已達(dá)到由行為策略σ決定的終結(jié)歷史的概率分布. 一個(gè)評(píng)估σ,μ是序貫理性的, 如果對(duì)于每個(gè)參與人i∈N和每個(gè)信息集s∈Ii不存在一個(gè)σ′i,s使得

O((σ′i,s,σ-i,s),μ)>iO((σi,s,σ-i,s),μ).

注意到對(duì)序貫理性的定義不同于經(jīng)典定義, 這是因?yàn)樵诮Y(jié)果空間引入了不完備偏好.

說(shuō)一個(gè)評(píng)估σ,μ是一個(gè)擴(kuò)展式博弈Γα:=N∪{c},H,P,fc,(Ii)i∈N,uii∈I的序貫均衡, 如果σ,μ是序貫理性的且具有一致性. 一致性的定義是標(biāo)準(zhǔn)的[5].

定理4 假設(shè)Γα:{N∪{c},H,P,fc,(Ii)i∈N,(ui)i∈I}為一個(gè)完美記憶擴(kuò)展式博弈, 且σ為Γα的代理人標(biāo)準(zhǔn)式表示的一個(gè)顫抖手完美納什均衡. 那么必存在一個(gè)信念向量μ使得σ,μ為Γα的一個(gè)序貫均衡.

證明 對(duì)于博弈Γα中的任意參與人i,用s表示Ii中任意信息集. 那么s中的歷史集合被表示為Hs. 以Xs表示不被Hs中所有節(jié)點(diǎn)所達(dá)到的終結(jié)歷史集合;以σ∞k=1表示在×r∈IΔ+Dr中的行為策略組合序列. 對(duì)于Γα的代理人標(biāo)準(zhǔn)式表示而言,它們既是顫抖手完美均衡又是納什均衡. 對(duì)于任意k和Hs中的任意h, 令

μksh=Phσk∑g∈HsPgσk,

其中, Phσk代表如果該博弈按照σk進(jìn)行給定信息集s達(dá)到而歷史h達(dá)到的條件概率. 注意到對(duì)于任意h∈Hs有Phσk>0, 那么∑g∈HsPgσk>0. 令

μsh=lim h→

那么μ為一個(gè)與σ一致的信念向量.

令vs(·)表示ANFR中代理人i.s的效用函數(shù). 當(dāng)這個(gè)代理人使用隨機(jī)策略ρi.s∈ΔDs, 而其他代理人使用σk規(guī)定的策略 (可能包括了該參與人的其他代理人). 給定歷史h達(dá)到, 代理人i.s使用隨機(jī)策略ρi.s, 其他代理人使用σk-i.s, 令Uiσ-i.s,ρsh代表此時(shí)參與人i的期望多效用函數(shù). 那么,

vsσk-i.s,ρs=∑h∈HsPhσk-i.s,ρsUiσk-i.s,ρsh

+∑x∈XsPxσk-i.s,ρsuix

=∑h∈HsPhσkUiσk-i.s,ρsh

+∑x∈XsPxσkuix

=∑g∈HsPgσk∑h∈HsμkshUiσk-i.s,ρsh

+∑x∈XsPxσkuix.

因?yàn)棣覟橐粋€(gè)顫抖手完美均衡, 有σi.s∈arg max ρi.s∈Δsvsσki.s,ρi.s, 這意味著

σi.s∈arg max ρi.s∈Δs∑h∈HsμkshUiσk-i.s,ρi.sh.

那么, 根據(jù)最優(yōu)反應(yīng)映射的上半連續(xù)性,有

σi.s∈arg max ρi.s∈Δs∑h∈HsμshUiσ-i.s,ρi.sh.

這就是序貫均衡的序貫理性條件, 因此σ,μ為博弈Γα的一個(gè)序貫均衡.

證畢

根據(jù)定理3和定理4, 下面的定理成立.

定理5 所有完美回憶的有限擴(kuò)展式博弈都有一個(gè)序貫均衡.

5 結(jié) 論

Bade[4]為不完備偏好的標(biāo)準(zhǔn)式博弈定義了納什均衡的概念,本文是其在擴(kuò)展式博弈中的擴(kuò)展。采用 Kreps和Wilson[5] 的思路, 先給出了一個(gè)修正的顫抖手完美均衡的概念, 然后應(yīng)用它去證明不完備偏好擴(kuò)展式博弈的序貫均衡的存在性. 如何將其應(yīng)用到博弈論其他領(lǐng)域(例如產(chǎn)業(yè)組織理論)中去,將是進(jìn)一步研究的方向.參考文獻(xiàn)

[1] 時(shí)奇, 諶貽慶, 陳劍. 不完備偏好理論及其應(yīng)用綜述[J]. 經(jīng)濟(jì)評(píng)論, 2010, (3):116-123.

[2] E OK. Utility Representation of an incomplete preference relation[J]. Journal of Economic Theory, 2002, 104(2):429-449.

[3] J DUBRA,F(xiàn) MACCHERONI, E Ok. Expected utility theory without the completeness axiom[J]. Journal of Economic Theory, 2004, 115(1): 118-133.

[4] S BADE. Nash equilibrium in games with incomplete preferences[J]. Economic Theory, 2005, 26(2):309-332.

[5] D KREPS, R WILSON. Sequential equilbria[J]. Econometrica, 1982, 50(4): 863-894.

[6] R SELTON. Reexamination of the perfectness concept for equilibrium points in extensive games[J]. International Journal of Game Theory, 1975,4(1):25-55.

[7] S BERGE. Topological spaces[M]. New York: Macmillan, 1963.

[8] R MYERSON. Game theory[M]. Cambridge: Harvard University Press, 1991.

主站蜘蛛池模板: 亚洲欧美国产五月天综合| 精品小视频在线观看| 国产啪在线| 在线观看无码a∨| 99精品国产高清一区二区| 成人免费黄色小视频| 国产欧美视频在线| 丁香婷婷久久| 国产精品女在线观看| 永久成人无码激情视频免费| 999精品在线视频| 国产成人AV男人的天堂| 亚洲国产清纯| 精品视频一区在线观看| 19国产精品麻豆免费观看| 亚洲精品成人片在线观看| 亚洲第一极品精品无码| 亚洲无码免费黄色网址| 中字无码精油按摩中出视频| 99人妻碰碰碰久久久久禁片| 日本精品视频| www.精品视频| 精品少妇三级亚洲| 亚洲第一成年免费网站| 污网站在线观看视频| AV不卡在线永久免费观看| 久久香蕉国产线| 全部无卡免费的毛片在线看| 99在线观看国产| 538国产在线| 91啦中文字幕| 国产成人亚洲综合A∨在线播放| 少妇露出福利视频| 国产成人福利在线视老湿机| 亚洲av片在线免费观看| 在线毛片免费| 国产亚洲欧美日本一二三本道| 97国产精品视频人人做人人爱| 2021天堂在线亚洲精品专区| 91九色国产在线| 久久国产精品77777| 一本大道视频精品人妻| 中文字幕亚洲综久久2021| 久久黄色免费电影| 性喷潮久久久久久久久| 黄色一级视频欧美| 性欧美精品xxxx| 国产美女在线观看| 欧美国产日韩在线播放| 久久性视频| 午夜视频www| 国内丰满少妇猛烈精品播| 亚洲综合九九| 全午夜免费一级毛片| 欧美伦理一区| 国产精品综合色区在线观看| 国产精品无码翘臀在线看纯欲| 亚洲国产精品一区二区第一页免| 狠狠躁天天躁夜夜躁婷婷| 99无码中文字幕视频| 国产精品一区二区国产主播| 国产又黄又硬又粗| 国产精品漂亮美女在线观看| 欧洲在线免费视频| 亚洲无码日韩一区| 欧美性精品| 女同久久精品国产99国| 国产成人综合欧美精品久久| 91极品美女高潮叫床在线观看| 国产女人18毛片水真多1| 91久久国产综合精品| 国产真实乱子伦视频播放| 日韩精品毛片人妻AV不卡| 亚洲综合专区| 欧美视频二区| 91毛片网| 久久精品人人做人人爽电影蜜月| 国模极品一区二区三区| 亚洲一区二区精品无码久久久| 亚洲资源在线视频| 久久五月视频| 国产麻豆福利av在线播放|