[摘要] 風險決策是現實中人們面臨的一個普遍問題。傳統上對風險決策的研究是基于數學的規范范式;現在另一種基于心理學的描述范式正在興起。本文通過實例詳細闡釋期望值理論、期望效用理論和前景理論的理論演進過程,揭示了對風險決策研究的這種范式轉變。
[關鍵詞] 風險決策 期望值理論 期望效用理論 前景理論
一、引言
人們在現實中面臨著各種各樣的風險決策問題,這些問題根據其特點可分為兩類:一類是無互動的決策問題,即一般決策問題;另一類是有互動的決策問題,即博弈問題。前一類決策問題,如考慮清早出門是否要帶雨傘。出門是否帶雨傘取決于出門后的天氣狀況,而天氣狀況是不確定的,因此決策面臨著風險,這種不確定性是由客觀的自然因素變化的不確定性引起的。后一類決策問題,如考慮是否擺空城計。諸葛亮是否擺空城計取決于司馬懿的行為,而司馬懿的行為是不確定的,因此決策面臨著風險,但這種不確定性是由主觀的另一行為人決策的不確定性所引起。
對風險決策問題,有兩種研究的范式。傳統的研究范式是先人為地假定決策者是一個理想的完全理性人,考慮足夠“聰明”的決策者如何為了自己的利益最大化而決策。這種范式的基礎是數學。用這種范式來分析一般的無互動決策問題,就是一般的決策分析理論;用來分析有互動的博弈問題,就是一般的規范博弈論。對風險決策問題進行研究的另一種較新的研究范式基于對傳統范式的質疑,而去描述真實的有限理性人是如何決策。這種范式的基礎是心理學。用這種范式來分析一般的無互動決策問題,形成了行為決策理論;用來分析有互動的博弈問題,形成了行為博弈論。
上面的對風險決策問題的分類可概括如下表所示:
本文接下來就通過實例來闡釋期望值理論、期望效用理論和前景理論的理論演進過程,進而展示對風險決策的研究是如何從傳統的規范范式轉向現代的描述范式。我們主要闡釋無互動的一般決策問題。對于有互動的博弈問題,在范式思路上與一般決策相同,只是其問題更復雜,我們將另文介紹。接下來的第二部分是期望值理論,第三部分是期望效用理論,第四部分是前景理論,最后的第五部分是全文的一個小結。
二、期望值理論
1.期望值理論:典型風險決策問題的解決之道
我們先來看一個典型的風險決策問題:有兩項投資方案A和B;兩種市場狀況:好或壞,其概率分別為70%和30%;A方案在市場狀況好時獲利1000元,在市場狀況不好時損失500元;B方案在市場狀況好時獲利800元,在市場狀況不好時損失100元。請問,投資者會選擇哪種方案?
一般來講,投資者會計算E(A)=1000×70%+(-500)×30%=550,E(B)=800×70%+(-100)×30%=530。然后,投資者會比較E(A)和E(B)的大小,選擇較大的550所代表的方案A來投資。
我們關心的不是這個例子的結果,而是其過程。如果我們把這個例子一般化,就是:有種環境狀況,每種狀況的概率為;有種備選方案,方案在j狀況下的結果為xij,決策者該選擇何種決策方案?
前面例子中投資者的決策過程是先計算兩種方案的期望值,然后選擇一個期望值最大的方案。這樣的的決策決策原則是最大期望值原則。按最大期望值原則進行決策分析的理論是期望值理論。其核心思想用數學式可表述為:
2.期望值理論的困境:圣彼得堡悖論
下面,我們來看一個游戲問題。這是一個公平的擲硬幣游戲。在這個游戲中,如果出現反面,游戲便結束。游戲結束后,你將獲得2k元,k代表出現反面之前擲硬幣的總次數。也就是說,如果擲一次硬幣就出現反面,你將會得到2元,如果擲兩次硬幣才出現反面,你將獲得4元,如果擲三次硬幣才出現反面,你將獲得8元,依此類推。請問,你最多愿意付多少錢來玩這個游戲?
如果假設讓你付x元來玩這個游戲,那么上述問題就是一個風險決策問題,下面我們就用前面介紹的期望值理論來分析一下這個問題。這個問題中,有無窮多種狀況:第一次擲硬幣為反面結束游戲,概率為二分之一;第一次為正面第二次為反面結束游戲,概率為四分之一;前兩次為正面第三次為反面結束游戲,概率為八分之一;……。有兩種選擇方案:花元來玩這個游戲,不玩游戲。每種方案在每種狀況下的結果為:花元玩游戲第一次結束游戲凈收益為2-,第二次結束游戲凈收益為4-,……;不玩游戲,凈收益為0.如果是你最多愿意付的金錢數目,那么就意味著,這時你在付錢玩游戲與不玩游戲間是無差異的。根據最大期望值理論,這時兩者的期望值應相同。
玩游戲的期望值E(玩)=(2-)×(1/2)+(4-)×(1/4)+(8- )×(1/8)+……,不玩游戲的期望值E(不玩)=0。所以有,(2- )×(1/2)+(4-)×(1/4)+(8-)×(1/8)+……=0,即=2×(1/2)+4×(1/4)+8×(1/8)+……=1+1+1+……=!期望值理論告訴你應該花任意多的錢來玩這個游戲!但大量的實際測試結果表明:大多數人最多只愿意花幾元錢來玩這個游戲。人們為什么不愿意花更多的錢來玩一個期望值為無窮大的游戲?這就是著名的“圣彼得堡悖論”?!笆ケ说帽ゃU摗笔蛊谕道碚撓萑肜Ь?。
三、期望效用理論
1.期望效用理論:對“圣彼得堡悖論”的解釋
“圣彼得堡悖論”是一個叫尼古拉斯·伯諾利(Nicolas Bernoulli)的瑞士籍教授在1713年提出來的。25年后,他的堂弟,數學家丹尼爾·伯諾利(Daniel Bernoulli)對此做出了一個解釋。丹尼爾·伯諾利認為,金錢的價值隨其數額的增多而遞減(也許存在一個極限),人們追求的是金錢帶來的效用,而不是金錢本身。所以,圣彼得堡游戲的回報并不是無窮大。很多人并不認為丹尼爾·伯諾利的效用理論能真正解釋“圣彼得堡悖論”。但他的邊際效用遞減理論卻為后來的期望效用理論奠定了基礎。期望效用理論用期望效用替代了期望值,用最大期望效用原則替換了最大期望值原則來分析決策問題。其核心思想可用數學式表述為
期望效用理論有三個主要的假設原則:相消性、恒定性和可傳遞性。相消性原則認為人們將不同方案中相同部分去掉后進行決策,其結果不受影響。如,對兩臺價格一樣的筆記本電腦,消費者在選購時就可以只比較其質量、款式等,而不必考慮價格。恒定性原則認為,同一問題采用不同的表述方式不影響人們的決策,最大化收益就是最小化成本??蓚鬟f性原則認為如果A比B好,B比C好,那么人們就會得出A比C好。
期望效用理論的三個假設原則看似非常正確。建立在這些假設原則基礎上的期望效用理論應該能正確地解釋人們的風險決策行為。但現實果真如此嗎?
2.期望效用理論的困境
(1)相消性原則的困境:阿萊斯悖論
問題1(阿萊斯悖論):現有方案A,100%肯定能贏100萬元;方案B,10%的概率能贏150萬元,89%的概率能贏100萬元,1%的概率沒有盈虧。人們會選擇哪個方案?實際測試結果表明,大多數人會選擇方案A。因為100萬是一大筆錢,如果選擇方案A則可穩賺這一大筆錢,如果選擇方案B,萬一落到那個沒有盈虧的1%概率上可就慘了。根據期望效用理論,人們會選擇期望效用最大化的方案,所以,人們選擇方案A就意味著A方案的期望效用要大于B方案。即
根據相消性原則,有(1)
問題1′:現有方案A′,11%的概率能贏100萬元,89%的概率沒有盈虧;方案B′,10%的概率能贏150萬元,90%的概率沒有盈虧。人們會選擇哪個方案?實際測試結果表明,大多數人會選擇方案B′。這意味著,U(A′)
根據相消性原則,有(2)
我們看到(1)式和(2)式是矛盾的。原因何在?原因出在相消性原則上,真實人決策并非遵循相消性原則。
(2)恒定性原則的困境:亞洲疾病問題
問題2(亞洲疾病問題):假設美國政府正在為亞洲即將爆發的一場非比尋常的疾病做準備,這場疾病可能會導致600人喪生。有以下兩個情景方案:
情景I:A方案,可以救200人;B方案,有三分之一的可能救600人,三分之二的可能一個也救不了。你支持那種方案?
情景II:A′方案, 有400人死亡;;B′方案, 有三分之一的可能性無人死亡, 有三分之二的可能性600人全部死亡。你支持那種方案?
實驗測試結果表明在情景I中,大多數人支持方案A′;在情景II中,大多數人支持方案B′。稍作分析就會發現,兩種情景實質是一樣的,只是表述不同而已。情景I中可以救200人的A方案就是情景II中有400人死亡的方案A′,同樣B方案也就是方案B′。問題的表述不一樣導致了不同的選擇,這說明真實人的決策違背了恒定性原則。
(3)可傳遞性原則的困境:賭博游戲
問題3(賭博游戲):有一個賭博游戲,a、b、c、d、e是五種參加游戲的方案,每種方案下贏錢的概率與贏錢的數目如下表所示:
測試結果表明:大多數人會在a、b中選擇a,在b、c中選擇b,在c、d中選擇c,在d、e中選擇d。根據可傳遞性原則,人們會在a、e中選擇a。但實際結果卻是人們在a、e中選擇e,而不是a。這說明,真實人在決策時并沒有遵循可傳遞性原則。
以上的實驗(阿萊斯悖論、亞洲疾病問題、賭博游戲等)顯示,人們實際作決策時并沒有遵循期望效用理論的一些原則。期望效用理論并不能很好地解釋和預測真實人的風險決策行為。
四、前景理論
基于期望效用理論與現實的矛盾,一種新的理論應運而生,那就是前景理論(Prospect Theory)。與期望效用理論不同的是,前景理論是一種描述式的理論,它并不是像期望效用理論那樣基于一些假設的理性行為準則來演繹理論,而是通過大量的心理學實驗來歸納出真實人的決策規律。前景理論的提出者之一,丹尼爾·卡尼曼(Daniel Kahneman)是一位心理學家,他因前景理論而與從事實驗經濟學的弗農·斯密斯一起分享了2002年度的諾貝爾經濟學獎。前景理論用最大前景值原則替代了期望效用理論的最大期望效用原則,其核心思想可用數學式表述為:
可以看到,前景理論用價值函數替換了期望效用函數,用權重函數替換了概率。價值函數和權重函數是前景理論最重要的兩個方面。下面就分別對其特點做一介紹。
上圖是價值函數圖,從圖上可以看出,價值函數有三個特點:A.定義于對參考點的偏離;B.在贏區間呈凹形(風險規避),輸區間呈凸型(風險追求);C.在輸區間的斜率比在贏區間的大(損失規避)。價值函數是從大量的實驗中總結出來的,它具有的三個特點能解釋眾多現實中看似矛盾的問題。
問題4:商店中有一個標價為100元的CD機,商店規定:支付現金,則按商品的原價計算;如果以信用卡支付,則需要支付105元。你會選擇哪種支付方式?實驗結果表明,大多數人愿意選擇用現金支付。
問題4′:商店中有一個標價為105元的CD機,商店規定:以信用卡支付,則按原價計算;如果用現金支付,則可以優惠到100元。你會選擇哪種支付方式?實驗結果表明,大多數人愿意選擇信用卡支付。
稍做分析就會發現,同一種支付方式在兩個問題中的支付實質上是一樣的。兩個問題中,用現金支付均需100元,用信用卡支付均要105元。既然如此,那人們為何在兩個問題情境中選擇了不同的支付方式?
上面價值函數的第三個特點,損失規避可以解釋這一看似矛盾的現象。對照原價,人們感覺在問題4中,用信用卡支付,多付了5元;在問題4′中,用現金支付,少付了5元。多付了5元的虧的感覺比少付了5元的賺的感覺更強烈。信用卡支付比現金支付更方便,這種方便帶來的價值是介于虧5元的損失感覺值與賺5元的贏感覺值之間。所以,人們會在問題4中選擇現金支付而在問題4′中選擇信用卡支付。
上圖是前景理論的權重函數。它也有三個特點:
是的增函數;C.小概率區的超權重,大概率區的低權重。權重函數也是從大量的實驗中總結出來的,也能強有力地解釋許多現象。
問題5:有兩個選項,A.千分之一的概率贏得5000元;B.肯定會贏得5元。你如何選擇?實驗結果表明,大多數人愿意選擇A。這是彩票問題。
問題5′:有兩個選項,A′.千分之一的概率損失5000元;B′??隙〞p失5元。你如何選擇?實驗結果表明,大多數人愿意選擇B′。這是保險問題。
如何解釋人們既冒風險去買彩票,又規避風險去買保險?上面權重函數的第三個特性小概率事件的超權重可以解釋這一點。千分之一是一個很小的概率,人們對這樣小概率的感覺比起實際值來要大。因此問題5中,A贏得比B更多,問題5′中,A′損失得比B′更大。
五、小結
風險決策是現實中人們面臨的一個普遍問題,對風險決策問題的研究先后經歷了規范和描述兩種研究范式。本文以實例詳細闡釋了期望值理論、期望效用理論和前景理論的理論演進過程。我們從中看到,新理論是在舊理論遭遇困境時產生的,決策理論的演進過程是一個不斷克服現實困境而逐漸完善的過程,是一個逐步由傳統的規范范式向現代的描述范式轉變的過程。限于篇幅,我們只介紹了無互動的一般決策問題,對于有互動的博弈問題,我們將另文再述。
參考文獻:
[1]陳偉剛:期望值與風險決策[J].中國統計,2002年第8期
[2]周國梅傅小蘭:決策的期望效用理論的發展[J].心理科學,2001年第2期
[3]施海燕施放:期望效用理論與前景理論之比較[J].統計與決策,2007年第11期
[4]丁際剛蘭肇華:前景理論述評[J].經濟學動態,2002年第9期
[5]賈建民:行為經濟學和決策制定——2002年度諾貝爾經濟科學獎評論之一[J].管理評論,2002年第10期