宋妍 晏鷹


摘要:針對博弈論制度分析在解釋制度共時結構及演化路徑多樣性上的局限,嘗試構建基于個體認知演化的制度分析框架。制度作為個體間共同認知的自我維系系統,其均衡和變遷路徑受個體認知演化的影響;個體規則遵循和目標驅動的兩類局部認知狀態將導致個體間共同認知朝不同方向動態調整,從而解釋特定時空條件下的制度均衡和制度演化。
關鍵詞:認知;演化;制度分析
中圖分類號:F011文獻標識碼:A文章編號:1004-0544(2012)08-0136-05
一、引言
經濟活動的實質是對自然和社會范圍內稀缺資源的獲取和配置。在獲取和配置資源的過程中,人類構建出各種形式的制度加諸經濟活動之上。形成了蔚為壯觀的經濟社會現象。隨著新制度經濟學逐漸融入主流經濟學(其領軍人物先后獲得諾貝爾獎),制度,這一一向被視為經濟活動的約束條件的外生變量也開始內部化,成為決定經濟績效、解釋經濟演化的重要內生變量。然而,如何認識和理解制度的本質特征。并進而理解制度的均衡和演化現象,當下占據主流的博弈論制度分析并未取得共識。更為重要的是,基于博弈論的分析范式還存在著較強的局限性。因此,能否跳出博弈論制度分析的框架,選擇一個更加適當的切入點對制度進行剖析是制度理論發展的一個新方向。
從系統論的角度看,制度是一個復雜的高維系統,包含成千上萬個變量和參量,它們之間相互聯系、相互作用,構成了一幅非線性的圖像。要對這樣多的變量和參量進行分析和計算,不僅在實際上行不通,而且其計算結果也難以檢驗,所以一個好的經濟理論或模型通常是將實際的經濟社會制度投影到一個恰當的子空間上去。這個子空間具有較低的維數,但反映了所討論的制度問題的本質特征。近年來,從個體認知這一制度現象的子空間出發來探討制度發育及演化的文獻大量涌現,諾斯(North)等學者也承繼哈耶克的理論思路,從信念、學習等角度重新詮釋制度內涵。展現出制度分析新的發展方向。本文的立意即在于拓展這一方向的理論進路,以個體認知調整和共同知識演化為基點,討論制度的發育、均衡及演化問題,以對相關理論上的爭論作出回應。
二、幾類典型的博弈制度觀
由于博弈論分析工具的引入,近30年來,以個體策略互動為核心的博弈論制度分析取得了極大的進展。大量文獻運用重復博弈理論和演化博弈理論對諸如聲譽機制、交易制度、自組織體系等自發擴展制度進行建模分析,取得了一大批富有洞見的研究成果。歸納相關文獻的理論脈絡,博弈論制度分析分別將自發擴展制度看做是博弈的參與人、博弈規則和博弈過程中參與人的均衡策略。納爾遜(Nelson)明確將自發擴展制度等同于博弈的特定參與人,他聲稱諸如“行業協會、技術協會、大學、法庭、政府機構、司法等等”都是經濟社會制度的組成部分。這一觀點與人們日常生活中對制度的看法相似,但問題在于,將制度等同于組織忽略了二者之間的重要差異,以致無法對自發擴展制度展開真正有效的分析。諾斯早期將制度定義為正式或非正式的博弈規則,認為,制度是“人類設計的制約人們相互行為的約束條件”。赫爾維茨(Hurwicz)對這一定義做了更為技術性的處理,從博弈的三要素(參與者、策略空間、支付函數)出發對制度的博弈規則觀進行細化。這一定義抓住了自發擴展制度的表象,但仍未觸及制度的本質內涵。容易理解,經濟博弈中正式規則的確立必須先于博弈過程,而這立刻面臨兩個問題:誰有激勵來制定博弈規則,而誰又有激勵來監督規則的實施?因此,僅僅將制度視為博弈規則是無法對經濟社會系統中大量的自發秩序作出有效解釋的。第三種觀點是將自發擴展制度視為博弈均衡。肖特是這一觀點的始作俑者,隨后諸多學者從兩個方向拓展了制度的博弈均衡觀。薩金(Sugden)、揚(Young)和鮑爾斯(Bowles)從演化博弈論的角度討論制度的發育和變遷,他們認為,個體的行為習慣可以自我形成,不需要第三方實施或人為設計。當慣例演化時,個體在進化選擇的壓力下,傾向于發現某些適應性更強的特征(如認知、偏好、技能等)。這樣,習俗慣例與個體特征將共同演化。格雷夫(Greif)、米爾格羅姆(Milgrom)、諾斯和溫加斯特(Weingast)則從重復博弈論的角度來討論制度,把制度看作是重復性囚徒困境博弈下的子博弈精煉均衡。作為子博弈精煉均衡的制度為每個博弈參與人界定了一種行為策略,該策略是在所有可能的博弈狀態下行動決策的完備計劃,簡單地說,制度為個體提供了場景條件下的行動“腳本”。
演化博弈的制度觀明顯贊成制度乃自組織系統。但是它沒有進一步說明該自組織系統得以建立及運作的根源,而是僅僅停留在對它的描述上。重復博弈的制度觀假定個體具有完備的演繹推理能力。然而個體如何能夠在多重均衡的情況下聯合選擇相互一致的策略?重復博弈又如何解釋制度演化歷時結構的多樣性?正如青木所指出的,“子博弈精煉均衡理論根本無法解釋某種制度出現在此地而非別的地方的原因”。因此,盡管博弈論制度分析接近一般均衡理論,但正是這一看似優點之處也是它在制度分析上的軟肋。
如果把自發擴展的制度視為眾多參與個體通過行為互動而達成的一個能夠自我實施的激勵相容的博弈均衡的話,那么關鍵的問題就是,參與人相互之間如何形成關于博弈的共同認知,并且參與人關于博弈的共同認知與其基于這些共同認知做出選擇所導致的實際后果之間的一致性究竟是怎樣建立的呢?若這種一致性被打破,制度的變遷方向和演化路徑又將如何?這些問題乍看起來像是一個常規的系統均衡的穩定性問題,但其實這些問題比系統均衡的穩定性更為根本,不能簡單對待。回答這些問題,將對制度的內涵本質、制度的路徑依賴性及突變有更深入的理解,也將對傳統的制度博弈均衡觀做出重大修正。而這些需要提出一個新的切入點來解剖制度的內涵及其演化機制。
三、認知制度主義
沿著奧地利學派(Austfian school)注重個體行為選擇的研究傳統,無論是新古典還是新制度經濟學的研究。當前都開始轉向通過對個體認知和學習過程的考察來揭示制度的發育與演化過程,這一研究取向可稱之為“認知制度主義”。認知制度主義認為,制度的發育和演化是人類知識積累和認知過程的一部分,制度變遷應該被理解為個體認知與系統環境的互動調整過程,即內隱的認知調整和外顯的制度變遷具有某種程度上的同構性。以認知調整和信念學習的視角探討制度的發育和演化將為理解制度系統的復雜性奠定經驗基礎。
在自發擴展秩序理論中,哈耶克強調認知作為制度的經驗基礎的重要性,奠定了認知制度主義的理論基礎。在討論知識在社會中的運用時哈耶克指出,“假如某人的大腦知道所有的事實(正如我們假設所有的事實對于作為觀察者的經濟學家來說都是給定的那樣),就會有解決問題的唯一辦法。即使我們能夠證明這一點。也無法解決上述問題。相反,我們必須說明,一項解決問題的辦法究竟是如何通過每個只擁有部分知識的人之間的互動而得以產生的”。哈氏討論的“解決問題的辦法”指的就是調規經濟社會系統運行的種種制度設置,而這種制度設置恰恰是攜帶局部認知的個體通過交互作用而發育出來的。在比較制度分析文獻中,青木昌彥尤其關注個體交往的信念和符號系統,認為制度是行動主體之間共享信念的概要表征。近期,拋開個體完全理性還是有限理性的問題,諾斯將個體學習過程運用于制度分析,提供了關于認知、信念系統和制度互相影響及其如何影響經濟績效的理論觀察。諾斯認為,個體信念的演化過程是理解經濟變遷基礎的關鍵,經濟系統演化在很大程度上就是被人們對自身行動結果的信念和認知所塑造的一個精細的過程(a deliberate process)。在這一見解的基礎上,諾斯構筑了“現實——信念——制度——專門政策——產出(改變了的現實)”這一解釋社會變遷過程的框架。馬克斯·普朗克學會(Max Planck Institute)集體物品研究小組將制度理解為共享的心智模式或者是共享的針對重復發生的社會交往問題的處理方式(shared mental models or sharedsolutions to recurrent problems of social interaction),制度“被錨固”(anchored)在人類的心智中并與特定行為相對應。此外,新興的行為經濟學、實驗經濟學等理論也為深入理解認知行為和制度演化的關聯提供深刻的洞見。
在認知制度主義看來,制度是個體間關于策略博弈如何進行的共同認知的自我維系系統。制度的本質是對均衡策略顯著和固定特征的一種濃縮性表征。該表征被所有參與人所感知。這樣,制度就以一種自我實施的方式制約著參與人的策略互動,并反過來被他們在連續變化環境下的認知不斷再生出來。因此,從認知的角度來闡釋制度是充分解釋制度形成、演化和發揮作用的關鍵。可以從個體認知和共同認知的形成演化過程著手,構建一個基于認知的制度分析框架。
四、基于認知的制度均衡與演化分析框架
作為一個自組織系統,制度代表了重復參與博弈的當事人之間自我維系的基本預期(共同認知均衡)。從認知角度重塑制度分析框架,關鍵在于刻畫個體間共同認知均衡的收斂過程。由于共同認知均衡是個體間認知試錯與動態調整的結果,因此,首先需清楚單個體局部認知的形成和動態調整機制,在此基礎上再考察單個體局部認知向多個體共同認知均衡的收斂過程,從而建立基于認知的制度分析框架。
(一)個體局部認知的形成
考察單個體局部認知的形成過程,需要了解個體在具體決策場景下如何啟動自身攜帶的交往知識。歸納哈耶克關于個體經歷與共同知識的研究,基于朱憲辰的個體知識分層、知識積累與演化理論。本文引入個體“認知一行為”的簡化分析框架,以解釋個體局部認知的形成和調整過程。
首先。將個體“認知一行為”模式簡化為四個相互關聯的部分:認知結構、信號加工、適應性學習和外界環境。
個體的知識結構好比是個體認知系統的存儲器。其中存儲了哈耶克所謂的“分立的個人知識”及個體間共同知識。這兩類知識的核心構成了個體的認知傳統。認知傳統則決定于個體自身偏好和個體以往的經歷,其中,個體偏好又依賴于個體資源存量和個體控制資源的能力、范圍。在這里,認知被界定為個體對于一個信號和另一個信號(或事件)的聯結。例如,“紅燈停綠燈行”——個體在基本損益評價和學習能力的作用下形成聯結(認知):紅燈亮(綠燈亮)——危險(安全),當看到紅燈亮(綠燈亮)時,具有此認知的個體表現出危險(安全)意識,進而采取相應行為,而沒有此認知的個體就不會有這些反應。認知結構中充斥著這樣的聯結,同時,認知結構也對認知聯結進行動態處理,即個體根據偏好、結合自身經歷和擁有資源量的大小對這些聯結進行損益分析,從而區別情況新增或淘汰聯結。
外界環境(自然的、經濟社會的、其他個體的行為)給予個體以信號刺激,信號加工部分對這些信號刺激進行處理。個體主動或被動接受環境信號后。對信號中包含的成本、收益及相關參照系的信息進行處理。并根據處理信號的方式和技術以及學習調整部分反饋回的信息指示,做出接受或屏蔽該信號的決策。若個體做出屏蔽的決策。則停止該過程;若接受這一信號,則將導入個體的知識結構部分。
認知系統將導入知識結構的信號與知識結構中的既存聯結進行比對(這種比對是依據個體偏好、個體經歷和個體所擁有的資源量的大小進行損益分析),首先產生對所面臨的外部條件的判斷:(1)個體認知結構中存在與當前所接受的環境信號較強的相關聯結,便會啟動固定預期或行為模式行為。這種固定的預期或行為模式可能是原有慣例或交往方式;(2)在個體認知結構中有關聯結較弱,甚至不存在時,個體便會通過收集、加工信息,重新進行理性計算形成預期并付諸行動。上述第一種情況稱為規則支配行為,第二種情況稱為目標驅動行為。
1.當個體認知結構中存在與所接受環境信號較強的相關聯結,采取規則支配行為:行動結果與行動前計劃一致,則個體將保留強化原有的行為準則:行動結果與行動前計劃不符,則個體將重新進行理性計算,調整或徹底改變預期,直至兩者趨于一致,個體便接受經過調整的行為規則。
2.當個體認知結構中沒有與所接受環境信號較強的相關聯結,個體啟動目標驅動行為:經過理性計算做出的預期與行動結果一致,個體將繼續維護、積極遵循該行為規則;個體進行約束條件下的最大化計算做出的預期與行動結果不符,個體將繼續搜尋新的信息。重新進行理性分析,不斷地試錯,直到各自預期與支付結果相一致,個體的行動準則也達到穩定。
采取規則支配或目標驅動行為,每得到一個支付結果,個體將在進行一次適應性調整之后把信息反饋到信號加工部分和知識結構部分,最終都將影響個體的資源存量,并影響個體的經歷,從而促使個體調整偏好及認知結構。個體局部認知構成了多個體間共同認知的基礎。
(二)個體間共同認知的形成——制度發育與演化
制度作為個體間共有信念的自我維系系統,本質上是個體間共同認知形成、演化的動態過程。在經濟社會系統中,個體為應對環境不確定性而組織和協調集體行動。但這一任務顯然不能依靠單一個體運用其局部知識獨自完成,而需要多個體間的共同知識或共享信念來協調集體行動。制度能否形成、集體行動能否發起均取決于個體間的共同認知能否普遍建立并維持穩定。因此,共同認知的本質和共同認知的形成及動態調整是制度的認知基礎最核心的問題。本文將共同認知視為個體針對其他個體面對場景信號時行為反應的共同預期而建立的信號間聯結,可以對共同認知進行如下的形式化表征:
個體I發出行動ai,I對ai依個人知識中的意義mii聯結將發生的事件11,記為ai——mij,(11)。mij,(11)表示11對I、J分別具有獎懲意義mi、mj。J接收的是ai的信號,依J個人知識中的意義mij聯結將發生的事件12,記為ai——mij(12)。若mij(11)異于mij(12),則稱個體I與J就ai沒有關于將發生事件的共同知識;否則,將發生事件的獎懲意義相同,J的知識(聯結ai→12)就等同于I的知識(聯結ai→11),則稱個體I與J就ai具有關于將發生事件的共同認知。
當信號出現時,個體間基于基本效用評價和學習能力,通過試錯、觀察和模仿等學習方式逐漸形成對該信號行為反應的共同預期。共同認知存儲于社會的集體記憶里,分散在個體的知識體系中,在共同認知的協調下,個體之間便能在相同預期的基礎上交往互動。
個體在與環境的互動中,其攜帶的局部認知在個體群的交往互動中得到調整提煉。從而形成共同認知。我們從兩個體互動與多個體互動兩個方面來簡化共同認知的發生過程。
1.兩個體間共同認知發生簡化。將交往情境簡化為兩個體面對面互動場景。由于社會環境變遷,譬如市場交易機制替代行政控制經濟,個體在經濟交往中必然做出相應調整。此時,個體A對個體B發出行為信號Sa,個體B經評價反饋對信號Sa做出行為反應Sb。若sb與個體A的聯結(Sa-Sb)預期不符,則A將依一定學習規則調整發出第二次行為信號Sa,于是Sa又將與個體B聯結(Sa--Sb)的預期不符,再次引發個體B的調整行為S,b,……如此類推,經過長期的面對面試錯、模仿,最后形成了對于信號Sa的共同行為反應預期。
2.三個體間共同認知發生簡化。兩個體間的互動行為及反應,對于其他個體又是一系列新信息,其他個體在評價反饋的作用下也通過預期試錯、觀察模仿對信號形成聯結,如果該聯結結果與前兩個個體一致,即形成了三個個體的共同認知。由此類推到n個個體的共同認知。這種通過較長時間個體面對面交往形成的“共同認知”通常是個體“理性不及”的,擴散過程更多地通過個體潛移默化的“隱性學習”(implicit learning)進行,由此形成較穩定的共同“默會”知識。當個體群中絕大多數個體都采納這一共同認知或固定預期時,在該個體群中一種制度便形成了,見圖1。
但共同認知一經形成并非一成不變,而是在系統不確定性和個體認知不斷演化的作用下持續(緩慢或者急劇)調整,打破個體之間對博弈規則及可能結果的共同預期。個體通過在行為反應層面的交流互動,發現新的聯結(或信號)。再互相調整預期并作出行為反應,直到達致新的認知收斂狀態,呈現出“共同認知均衡——系統不確定性、認知沖擊及認知擾動——共同認知常規性落空、認知失衡—認知搜尋、試錯——新的共同認知均衡”這樣一個螺旋式波動調整的過程。因此,制度變遷應該被理解為個體信念系統與環境互動調整的過程,本質上是一個認知演化的過程,而認知演化的方向是促進信念系統所型構的制度框架能在怕累托意義上提高個體應對環境不確定性的效率。根據諾斯“信念系統調整——個體行為互動——制度局部發生”的分析思路,可以建構基于認知調整的制度演化框架,見表l。
如表1所示。既有制度以共有信念系統為內核存續下來,個體分享依場景啟動的相同的策略集,現存制度以共有信念系統的概要表征來約束個體在經濟社會場景下的行為選擇。隨著環境的演化(如政府政策變化、技術進步、法制完善、基層秩序自發擴展等),原有制度所設定的決策集合不能降低環境的不確定性(如計劃經濟條件下配給制的垂直型物品交易方式無法在市場經濟條件下水平橫向的交易環境中發揮作用),因而發生制度危機。在危機中,各種相互競爭的制度規則——由新的信念系統決定——為部分個體所運用試驗,進而發生個體適應性學習、模仿新決策等認知調整現象。在認知的動態調整過程中,若個體的認知結構內存在與當前所接受的環境信號較強的相關聯結,便會規則支配行為,可能是原有慣例或習俗;若在個體認知結構中有關聯結較弱,甚至不存在時,便會啟動目標驅動行為,重新進行理性計算形成預期并付諸行動。個體的認知調整導致各種變異性策略以一定的規模進行試驗和競爭;并且各種策略均在“演化選擇壓力”下接受演化考驗,隨著某些決策在演化過程中逐漸上升至主導地位,并成為個體群內的共同認知,新的制度均衡開始形成。特殊地,在環境變化——制度的形成或變革中,原有制度(固有行為模式)就可能阻礙個體對新行為模式的選擇(創新),或者個體自身依賴原有制度,當此類個體數量達到一定規模時,社會的演化力量被束縛。可能出現制度“鎖入”(look in)或路徑依賴(parth dependence)現象。
五、結論
近年來制度經濟學的一個重要進展是,認知要素逐漸被納入制度分析框架,成為制度變遷理論的重要構件。本文以近年發展起來的認知制度主義為理論基點,對個體局部知識及個體間共同知識的發生和調整過程進行簡化,以期厘清制度的內在發育及演化機制。
作為個體間共同認知的自我維系系統,制度的發育及演化均以個體認知調整為轉移。個體局部認知是個體基于自身的偏好及知識結構,在識別能力、行為能力和學習能力作用下,對外界環境給予個體的信號刺激進行處理形成的。根據個體的知識傳統與場景信號之間的匹配聯結程度,個體啟動遵循規則一模仿歸納或目標驅動一理性計算的認知規則。這兩種認知規則對制度均衡、演化都將產生重要影響。在形成局部認知的基礎上,個體間經過長期面對面試錯、模仿形成的針對環境信號的共同行為反應預期,即共同認知。當共同認知與集體行動一致時,制度便產生了。共同認知實際上與協調個體間互動行為的制度是同構的,而內隱的認知調整與外顯的制度變遷也具有某種程度上的同構性。
在方法論上,以個體認知為切入點建構制度分析框架體現了制度研究方法正朝著經驗檢驗的方向發展。在過去幾十年中,認知學領域的研究大大拓展了人類對大腦、心智與行為之間關系的理解,通過對個體認知過程的分析來理解制度的發生、演化機制已經具備了跨學科的經驗研究支撐。同時,在行為實驗以及計算機仿真技術的支持下,有關認知學習的數理模型迅猛發展,也為在經驗分析基礎上考察制度發育與演化提供了可能。因此。在這兩方面研究的支撐下,以認知為基點的制度分析便能夠建立在可檢驗的經驗根基上,認知制度主義在制度分析領域的發展前景是值得期待的。
責任編輯肖利