鐘永梅
摘 要:本文通過介紹貝葉斯統(tǒng)計推斷,并對貝葉斯方法在認知領域的應用進行綜述,從因果推理、類別推斷、語言學習、動作控制等方面,介紹其理論意義和對認知領域研究的推動作用,并對今后的研究方向進行展望。
關鍵詞:貝葉斯方法;認知領域;綜述
貝葉斯統(tǒng)計推斷在統(tǒng)計學中的影響雖遠不能與經典推斷統(tǒng)計相抗衡,但因其深厚的數(shù)學基礎和注重先驗知識在推斷中的作用等特點,一直被統(tǒng)計學家所推崇。近二十年來,隨著計算資源、理論工具和學科間聯(lián)系的日益緊密和完善,貝葉斯推斷統(tǒng)計的研究和應用都得到長足的發(fā)展。
一、貝葉斯方法簡介
貝葉斯推斷統(tǒng)計建立在貝葉斯定理的基礎上。貝葉斯定理是關于條件概率的逆概率規(guī)則,解釋如何從給定b時a的條件概率得到給定a時b的條件概率。貝葉斯定理可以簡單表述為后驗概率與先驗概率和可能性的乘積成比例。貝葉斯統(tǒng)計推斷就是使用先驗概率和樣本得出后驗概率,在后驗概率的基礎上進行推斷統(tǒng)計的方法。陳希孺(1999)認為:“貝葉斯方法的基本思想是,不論你做出何種推斷,都只能基于后驗分布,即由后驗分布所決定”。
二、貝葉斯方法在認知科學中的應用
1.因果推理
在因果推理方面的研究可能是貝葉斯推斷統(tǒng)計在認知領域最引人矚目的貢獻。Cheng(1997)的因果能量(power)模型將人們關于因果關系的判斷解釋為在一個簡單的貝葉斯網絡中的參數(shù)估計過程。Griffiths&Tenenbaum(2005)則在區(qū)分了因果結構和因果關系強度的基礎上得出了因果支持模型,更精確地解釋了以往因果推理研究所得的數(shù)據,還可以解釋以往的理論所不能解釋的諸如背景原因導致的非單調效應,數(shù)據不完整時被試的因果推理表現(xiàn)等。
2.類別特征推斷
Kemp,Perfors,&Tenenbaum(2007)關于特征推斷過程的研究假定自然界里的物種按照樹形結構來分類,物種間的不同特征在樹形結構中以漸變方式產生,這個漸變過程為特征(在不同物種之間)的不同拓展方式提供了先驗分布。他們認為特征的拓展采取一種平滑的方式來進行:在樹形結構中相鄰近的物種更容易有相同的特征。如果大猩猩所具有的某個特征,那么猴子就比鯊魚更可能具有這個特征。特征的拓展方式可能有樹形、簇形、線形等不同的先驗分布形式,使用不同的先驗分布可以解釋特征推斷研究中的不同概括方式。
3.語言學習
Xu,Tenenbaum(2007)關于單詞學習方面的研究主要著眼于低層次的P(數(shù)據/結構)階段。將單詞學習看作一個理性地抽取假設并進行推理的貝葉斯推斷過程。他們發(fā)現(xiàn)在給定樣例的基礎上要求被試概括出新單詞的情景中,4歲兒童和成人都表現(xiàn)出一種“一對三矛盾”:被試在面對相對少(一個)樣例時比在面對相對多(三個)樣例時更傾向于得到更高程度的概括。Chater N, Manning CD(2006)使用貝葉斯方法描述了產生不同的語法結構及其概率的過程以及語法與單詞串之間的聯(lián)系,這些信息反過來可用于從一串單詞中推斷出語法結構。他們認為:“從貝葉斯的角度看,每個候選的語法都有一個先驗概率,這些先驗概率經由新的經驗而調整(得到后驗概率)……學習者應該會選擇一個有更高,可能是最高,后驗概率的語法。”
4.動作控制
在控制我們的動作時,Ko¨rding&Wolpert(2004)認為人們?yōu)榱俗龀鲎罴逊磻仨殞㈥P于任務的先驗知識和感覺輸入中得到的可能性結合起來,得到網球最有可能的落地和反彈方式。他們用實驗說明被試表現(xiàn)出與貝葉斯方法所作出的預測相似的動作方式。
5.視自覺
Yuille&Kersten(2006)認為面對復雜而模糊的自然圖像,視知覺過程可以看作是一個反向推理過程:從圖像出發(fā)估計產生圖像的要素。理解這一過程的理論原則就是建立在貝葉斯推斷(定義了各個結構化表征的概率分布)基礎上的綜合分析方法。綜合分析包含了關于目標和背景的結構化的高水平的假設,這些假設經由一個自上而下的與自然圖像直接比較的過程而被接納或拒絕。這些假設在產生時就帶有一個概率(代表其信號強度),如果某個假設的信號強度足夠大,那它就可能在低水平上被接受而不需要任何高水平的確認。
三、尚待開發(fā)的領域
從宏觀角度來看,貝葉斯方法在計算水平方面取得了可喜的成績,但在算法水平和執(zhí)行水平方面就不如某些聯(lián)結主義模型有優(yōu)勢。貝葉斯模型需要進一步解決如何表征復雜的問題情境,如何解釋和模擬問題解決過程中大腦神經細胞的活動等問題。
從微觀角度來看,研究主題包括觀念學習和單詞獲得的貝葉斯模型是否可與獲得語法的貝葉斯模型融合來為語言發(fā)展提供一個統(tǒng)一的研究方法,人類大腦為何經常可以從很有限的數(shù)據出發(fā)做出正確的預測和概括,如何簡化復雜模型中的計算量等問題需要進一步的研究來解答。