胡嘯
摘 要 信號檢測論被廣泛用于解釋個體在不同類型認知任務(wù)中的決策過程。然而,經(jīng)典信號檢測論的重要不足之處在于難以進一步解釋個體設(shè)置報告標準的過程對應(yīng)怎樣的內(nèi)在心理機制。本文從貝葉斯決策理論的視角出發(fā),深入探討個體在信號檢測任務(wù)中的決策規(guī)則。首先基于貝葉斯定理介紹貝葉斯決策理論的基本觀點。隨后探討貝葉斯決策理論如何解釋理想觀察者的決策規(guī)則,以及在實際的信號檢測任務(wù)中個體的決策結(jié)果與理想觀察者之間的偏離。其次探討經(jīng)典信號檢測論和貝葉斯決策理論在不等方差信號檢測模型中的差異。最后簡要介紹支持貝葉斯決策理論的實證研究證據(jù)。
關(guān)鍵詞 信號檢測論;貝葉斯決策理論;先驗概率;似然函數(shù);報告標準
分類號 B841
DOI:10.16842/j.cnki.issn2095-5588.2023.09.003
1 引言
信號檢測論(signal detection theory, SDT)是實驗心理學(xué)研究中應(yīng)用最為廣泛的計算模型之一。自從心理學(xué)家John A. Swets及其合作者首次將信號檢測論系統(tǒng)性地引入心理學(xué)領(lǐng)域以來(Green & Swets, 1966; Tanner & Swets, 1954),研究者們已經(jīng)廣泛地應(yīng)用信號檢測論模型來解釋知覺、記憶、推理等不同心理過程的內(nèi)在機制(Banks, 1970; Mamassian, 2016; Wixted, 2020)。在心理學(xué)論文數(shù)據(jù)庫PsycArticles和PsycInfo中,以“signal detection theory”為關(guān)鍵詞可以檢索出超過4000篇文獻,且在2020至2022這三年間發(fā)表的文獻就達到了500篇,足以證明信號檢測論不僅在心理學(xué)研究的歷史上占有重要地位,而且在今天仍然具有旺盛的生命力。
在基于信號檢測論的心理學(xué)實驗設(shè)計中,研究者會向被試呈現(xiàn)兩類不同的刺激,其中一類刺激被稱為“信號”(signal),而另一類刺激被稱為“噪音”(noise)。被試的任務(wù)是判斷哪些刺激屬于信號,哪些刺激屬于噪音(Wickens, 2001)。比如,在一個聽覺任務(wù)中,被試聽到的刺激可能只包含白噪音,也可能在白噪音的基礎(chǔ)上疊加了一個特定聲調(diào)的聲音作為信號;被試需要判斷信號在哪些試次(trial)當中出現(xiàn)(Egan et al., 1959)。又如,在再認記憶任務(wù)中,被試需要首先學(xué)習(xí)并記憶一系列詞語,隨后研究者會向被試呈現(xiàn)一些學(xué)過的“舊詞”作為信號,和一些沒學(xué)過的“新詞”作為噪音,被試需要判斷每個詞語是新詞還是舊詞(Mickes et al., 2007; Wixted, 2007)。通常情況下,信號檢測論會假設(shè)信號和噪音的刺激強度分別符合一個正態(tài)分布,且信號分布的均值高于噪音分布;信號分布和噪音分布均值之差被稱為辨別力指數(shù)(d'),它反映了個體辨別信號和噪音的能力,d'越高則個體的辨別力越強(Wickens, 2001)。
信號檢測論關(guān)注的一個重要問題是,個體如何決策哪些刺激屬于信號,哪些刺激屬于噪音。經(jīng)典的信號檢測論觀點認為,個體會直接在刺激強度的數(shù)軸上設(shè)置報告標準C,如果當前刺激的強度高于C,則個體判斷當前刺激為信號,反之判斷為噪音(Wixted, 2020)。圖1給出了信號檢測論模型的一個示例。該模型中噪音分布的均值為0,信號分布的均值為d', 兩個分布的標準差均為1;當某個刺激的強度高于C時,個體會將其判斷為信號,反之則判斷為噪音。在信號檢測任務(wù)中,個體的作答結(jié)果可以被分為四種類型:擊中(將信號刺激判斷為信號)、虛報(將噪音刺激判斷為信號)、漏報(將信號刺激判斷為噪音)和正確拒絕(將噪音刺激判斷為噪音)(Wickens, 2001)。四類作答結(jié)果出現(xiàn)的概率由代表信號或噪音的正態(tài)分布在C的左側(cè)或右側(cè)的面積大小來表示(見圖1)。
信號檢測論的優(yōu)點在于,它可以從個體的作答正確率數(shù)據(jù)中,分離出辨別力指數(shù)d'和報告標準C這兩個指標,使得研究者可以分別探討任務(wù)難度(即d’)和個體的反應(yīng)偏向(即C)如何影響個體最終的作答結(jié)果(Wickens, 2001)。然而,經(jīng)典信號檢測論框架(即直接使用C來反映個體的決策判斷標準的信號檢測論模型)也存在一個重要的不足之處:它難以深入解釋個體在信號檢測任務(wù)中完成決策的過程對應(yīng)怎樣的內(nèi)在心理機制。雖然經(jīng)典信號檢測論簡單地假設(shè)個體會直接將當前刺激的強度與一個特定的判斷標準C在數(shù)軸上的位置進行比較,并基于比較的結(jié)果來完成決策,但它通常難以進一步解釋個體為何會把報告標準C設(shè)置在數(shù)軸上的特定位置,以及對于不同個體而言或在不同實驗條件下C的位置產(chǎn)生差異的內(nèi)在原因(Glanzer et al., 2009, 2019)。
事實上,早在信號檢測論提出之初,Swets及其合作者就開始使用貝葉斯決策理論(Bayesian decision theory, BDT)的觀點來解釋個體在信號檢測任務(wù)中的決策過程(Green & Swets, 1966)。近年來,貝葉斯決策理論與信號檢測論之間的關(guān)系開始受到越來越多研究者的重視(Fleming & Daw, 2017; Glanzer et al., 2019; Maloney & Zhang, 2010)。貝葉斯決策理論認為個體會基于觀測到的當前刺激強度,通過一個貝葉斯推理過程來決策當前刺激是信號還是噪音(Fleming & Daw, 2017; Maloney & Zhang, 2010; Pouget et al., 2016)。和經(jīng)典信號檢測論相比,貝葉斯決策理論為個體如何在信號檢測任務(wù)中完成決策過程給出了更加深入的理論解釋(Glanzer et al., 2019; Lau, 2007)。
本文將從貝葉斯決策理論的視角,深入探討信號檢測論框架下個體的決策規(guī)則。本文將首先介紹貝葉斯決策理論的基本觀點,即個體在信號檢測任務(wù)中如何通過一個貝葉斯推理過程完成決策。隨后,本文將闡述信號檢測論當中的“理想觀察者”問題,并在等方差信號檢測模型的框架下,介紹貝葉斯決策理論如何解釋實際研究中的被試與理想觀察者之間的偏離。接下來,本文將討論不等方差的信號檢測模型,并闡述貝葉斯決策理論與經(jīng)典信號檢測論在該模型中存在的差異。最后,本文將介紹支持貝葉斯決策理論的實證研究證據(jù)。
2 貝葉斯決策理論
貝葉斯決策理論的基礎(chǔ)是貝葉斯定理,它來源于對聯(lián)合概率的計算公式(胡傳鵬等, 2018)。假設(shè)有兩個事件——A和B,則A和B同時發(fā)生的概率被稱為聯(lián)合概率,記為P (A,B)。聯(lián)合概率的計算公式可以被寫為如下形式:
? ? ? ? ?P(A,B)=P(B|A)P(A) (1)
公式(1)的含義為:A和B同時發(fā)生的概率,等于A發(fā)生的概率P(A)乘以在A發(fā)生的條件下B發(fā)生的概率P(B|A)。其中,P(A)又被稱為邊緣概率,它指的是在不考慮其他事件的發(fā)生結(jié)果的情況下,某一事件發(fā)生的概率;而P(B|A)又被稱為條件概率,它指的是在確定某一個事件(如A)已經(jīng)發(fā)生的條件下,另一個事件(如B)發(fā)生的概率。實際上,A和B同時發(fā)生的聯(lián)合概率,還可以被寫為另一種形式,即等于B發(fā)生的邊緣概率P(B)乘以在B發(fā)生的條件下A發(fā)生的條件概率P(A|B):
? ? ? ? ? P(A,B)=P(A|B)P(B) ? ?(2)
基于以上的公式(1)和(2),可以得出如下的公式(3):
? ?P(A|B)P(B)=P(B|A)P(A) (3)
公式(3)通常會被寫為如下的形式:
公式(4)即為貝葉斯定理的一般形式。貝葉斯定理的提出起初只是為了刻畫兩個事件的邊緣概率和條件概率之間滿足的數(shù)學(xué)關(guān)系。然而,心理學(xué)家很快意識到,貝葉斯定理可以被用來刻畫人類的推理與決策過程(Kersten et al., 2004; Lau, 2007; Wickens, 2001)。比如,公式(4)可以用來解釋個體如何通過對事件B進行觀測,來推理事件A的發(fā)生概率。此時,公式(4)中的P (A)被稱為先驗概率,它指的是在觀測到事件B之前,個體對于事件A發(fā)生概率的先驗認識。P(A|B)被稱為后驗概率,它反映了個體在觀測到事件B的發(fā)生結(jié)果之后對事件A發(fā)生概率的認識。個體在貝葉斯推理過程中,會根據(jù)對事件B的觀測結(jié)果來更新自身對事件A發(fā)生概率的認識,即從P(A)更新為P(A|B)。另一方面,P (B | A)被稱為似然函數(shù),它反映了在給定事件A的情況下,事件B發(fā)生的可能性。在個體對事件A發(fā)生概率進行更新的過程中,先驗概率和似然函數(shù)都起到了重要的作用:一方面,當A發(fā)生的先驗概率值越高時,其后驗概率值也會越高;另一方面,在假定事件A發(fā)生的情況下,如果事件B發(fā)生的概率越高(即似然函數(shù)值越大),則個體在觀測到事件B之后也會認為事件A成立的后驗概率越高。
根據(jù)貝葉斯決策理論的觀點,在信號檢測任務(wù)中,個體會觀測到每個刺激的強度(記為x),并基于x的值來完成一個貝葉斯推理過程,以推理當前刺激屬于信號或噪音的后驗概率(Burgess, 1985; Fleming & Daw, 2017; Wickens, 2001)。下面的公式給出了個體如何基于刺激強度x對當前刺激屬于信號(記為S)的概率進行更新:
公式(5)意味著,在觀測到當前刺激之前,個體對當前刺激屬于信號的概率存在先驗認識,反映為先驗概率P (S)。而在觀測到當前刺激的強度x之后,被試將當前刺激屬于信號的概率更新為后驗概率P(S|x)。同理,個體基于刺激強度x對當前刺激屬于噪音(記為N)的概率進行更新的過程可以用如下公式表示:
貝葉斯決策理論認為,個體會基于當前刺激屬于信號或噪音的后驗概率,來決定應(yīng)當把當前刺激判斷為信號還是噪音。如果刺激屬于信號的后驗概率大于其屬于噪音的后驗概率,則個體就會把當前刺激判斷為信號,反之則判斷為噪音(Burgess, 1985; Fleming & Daw, 2017; Lau, 2007)。由于刺激屬于信號和噪音的后驗概率之和為1,因此個體會把P (S|x) =0.5作為判斷標準:如果刺激屬于信號的后驗概率大于0.5則判斷當前刺激為信號,而如果小于0.5則判斷刺激為噪音。
在公式(5)和(6)中,觀測到刺激強度x的邊緣概率P(x)是相等的。具體而言,P(x)的計算方法是,根據(jù)刺激屬于信號和噪音的先驗概率——P(S)與P(N),對給定當前刺激是信號或噪音的條件下觀測到x的概率(似然函數(shù))——P(x|S)與P(x|N),進行加權(quán)平均:
P(x)=P(x|S)P(S)+P(x|N)P(N) (7)
可以通過將公式(5)與公式(6)相除,消去P(x)項,得出下面的公式:
公式(8)意味著,貝葉斯決策過程可以被看作個體基于后驗概率的比值進行決策的過程:如果刺激屬于信號和噪音的后驗概率比P(S|x) /P(N|x)大于1,則被試會把當前刺激判斷為信號,反之則判斷為噪音。根據(jù)貝葉斯定理,后驗概率比值是由刺激強度x在信號和噪音成立的條件下的似然函數(shù)比值P(x|S)/P (x|N),以及信號和噪音的先驗概率比值P(S)/P(N)共同決定的。
由于在信號或噪音成立的條件下,刺激強度x分別滿足一個概率分布(通常假設(shè)為正態(tài)分布),因此x在信號或噪音成立條件下的似然函數(shù)反映了當刺激是信號或噪音時觀測到的刺激強度為x的相對概率,其等價于x在信號或噪音分布中出現(xiàn)的概率密度(即正態(tài)分布中x所在位置對應(yīng)的縱坐標的值)。當刺激強度x在信號分布下出現(xiàn)的概率密度P(x|S)越大,或在噪音分布下出現(xiàn)的概率密度P(x|N)越小時,個體越傾向于將當前刺激判斷為信號,反之則更傾向于判斷為噪音。需要注意的是,個體在完成貝葉斯推理的過程中,可能并不知道信號和噪音分布的真實形態(tài)。比如,個體可能并不知道真實的信號與噪音分布的均值和標準差分別等于多少(Lau, 2007)。為了完成貝葉斯推理過程,個體必須主觀推測信號和噪音分布的形態(tài),并據(jù)此估計當前刺激的強度x在信號和噪音分布中出現(xiàn)的似然函數(shù)(Lau, 2007)。
在一些情況下,個體對刺激屬于信號還是噪音可能不存在先驗的偏好。比如,被試在參加一個信號檢測實驗任務(wù)之前,可能對電腦屏幕上出現(xiàn)的刺激是信號還是噪音并沒有先驗的偏向,而是簡單地認為二者是等可能的。此時可以簡單假設(shè)信號和噪音成立的先驗概率相等,即P(S)=P(N)=0.5。這種情況下的后驗概率比值就等于似然函數(shù)的比值,因此貝葉斯決策的結(jié)果完全由似然函數(shù)的值來決定。然而,先驗概率并不一定始終等于0.5 (Wickens, 2001)。比如,一些個體對信號和噪音出現(xiàn)的先驗概率可能具有一定的主觀偏好,即可能偏向于認為信號或噪音其中之一更可能出現(xiàn)。此時,基于后驗概率比值的貝葉斯決策過程不僅受到似然函數(shù)比值的影響,也受到先驗概率比值的影響;當個體認為信號成立的先驗概率越大,或噪音成立的先驗概率越小時,就越傾向于把當前刺激判斷為信號,反之則越傾向于判斷為噪音。
根據(jù)貝葉斯決策理論的觀點,個體在貝葉斯推理過程中使用的似然函數(shù)值和先驗概率值,均來自個體自身的主觀估計。那么,當個體主觀估計的似然函數(shù)和先驗概率等于多少時,最終給出的決策結(jié)果是最理想的?當似然函數(shù)和先驗概率的主觀估計值發(fā)生變化時,個體的決策過程又會受到怎樣的影響?為了回答上述問題,本文接下來將從信號檢測任務(wù)中的“理想觀察者”視角出發(fā),在貝葉斯決策理論的框架下進一步探討個體何時會給出最理想的決策,以及如何解釋實際研究中被試的決策結(jié)果與理想觀察者之間的偏離。
3 理想觀察者
根據(jù)經(jīng)典信號檢測論的觀點,個體會在刺激強度的數(shù)軸上設(shè)置一個報告標準C,并通過比較當前刺激的強度x與C在數(shù)軸上的位置,來決定當前刺激是信號還是噪音。個體的作答結(jié)果可以被分為擊中、虛報、漏報和正確拒絕四種類型,其中擊中(將信號刺激判斷為信號)和正確拒絕(將噪音刺激判斷為噪音)視為正確作答,而虛報(將噪音刺激判斷為信號)和漏報(將信號刺激判斷為噪音)視為錯誤作答。那么,一個有趣的問題是,當報告標準C設(shè)置在哪里時,個體作答的正確率最大?在信號檢測論框架下,通過設(shè)置最合適的報告標準使得作答正確率最大的個體,被稱為理想觀察者(Wickens, 2001)。
為了計算出理想觀察者會把報告標準C設(shè)置在怎樣的位置,首先需要求出C值的變化如何影響作答正確率。這里以圖1中呈現(xiàn)的信號檢測論模型為例。在圖1所示的模型中,信號分布和噪音分布具有相等的方差(二者均等于1),該類模型又被稱為等方差信號檢測模型(Wickens, 2001)。根據(jù)圖1可知,當實驗中呈現(xiàn)的刺激為信號時,作答正確率(即擊中率,hit rate,HR)等于信號分布下報告標準C右側(cè)的面積。具體計算公式為:
? ? ? ? ? ? HR=1-Φ(C|μ=d',σ=1) ? ? (9)
上式中,Φ (C|μ,σ)代表均值為μ、標準差為σ的正態(tài)分布的累積分布函數(shù),即等價于該正態(tài)分布位于C左側(cè)的曲線下方面積。同理,當實驗中呈現(xiàn)的刺激為噪音時,作答正確率(即正確拒絕率,correct rejection rate,CRR)等于噪音分布下報告標準C左側(cè)的面積:
CRR=Φ(C|μ=0,σ=1) ? ? ? ? ? ? (10)
假設(shè)在信號檢測實驗任務(wù)中,信號刺激出現(xiàn)的可能性為P(St),噪音刺激出現(xiàn)的可能性為P(Nt)。字母t的意思是,上述概率代表了信號和噪音刺激在實驗中出現(xiàn)的真實(true)概率,以與個體在貝葉斯決策過程中使用的主觀先驗概率相區(qū)分。據(jù)此可以求出總體的作答正確率Pcorrect:
Pcorrect=P(St)·HR+P(Nt)·CRR=
P(St)·[1-Φ(C|μ=d',σ=1)]+P(Nt)·Φ(C|μ=0,σ=1) ? (11)
為了求出C值等于多少時Pcorrect最大,可以先求出Pcorrect的一階導(dǎo)數(shù):
公式(12)中,?(C|μ,σ)代表在均值為μ、標準差為σ的正態(tài)分布中,刺激強度等于C時的概率密度。理想觀察者的報告標準Cideal應(yīng)當設(shè)置在令Pcorrect的一階導(dǎo)數(shù)為0的位置,即滿足如下的公式(13):
P(Nt)· ?(Cideal|μ=0,σ=1)
-P(St)?(Cideal|μ=d',σ=1)=0 (13)
當個體把強度高于Cideal的刺激全部判斷為信號,而把強度低于Cideal的刺激全部判斷為噪音時,個體的作答正確率達到最大(Wickens,2001)。根據(jù)正態(tài)分布的概率密度函數(shù),可以進一步求出Cideal在刺激強度的數(shù)軸上的位置:
在等方差信號檢測模型中,當信號和噪音在實驗任務(wù)中出現(xiàn)的概率相同,即P(St)=P(Nt)=0.5時,C的位置恰好等于d'/2,即理想觀察者會把報告標準設(shè)置在信號分布均值和噪音分布均值的正中間位置。換言之,理想觀察者設(shè)置的報告標準正好處在信號分布和噪音分布交叉的位置(Wickens, 2001)。
接下來,本文將介紹如何從貝葉斯決策理論的角度來理解理想觀察者的決策規(guī)則。公式(13)又可以被寫為如下形式:
不難看出,公式(17)與反映貝葉斯決策過程的公式(8)非常相似。在公式(17)中,信號和噪音在實驗任務(wù)中出現(xiàn)的真實概率的比值P(St)/P(Nt),類似于個體在貝葉斯決策過程中使用的先驗概率比值;而在公式(17)中,當刺激強度等于Cideal時,信號和噪音分布中的概率密度比值?(Cideal|μ=d',σ=1) /? (Cideal|μ=0,σ=1)也類似于貝葉斯決策過程中的似然函數(shù)比值。事實上,貝葉斯決策理論指出,當個體完全清楚信號和噪音出現(xiàn)的客觀先驗概率以及信號和噪音分布的真實形態(tài)(即真實的似然函數(shù)值)時,采用貝葉斯決策機制可以保證個體成為理想觀察者,即能夠使得個體的作答正確率最大(Burgess, 1985)。具體而言,結(jié)合公式(8)與公式(17)可知,當刺激強度恰好等于Cideal時,后驗概率的比值(即信號和噪音條件下似然函數(shù)與先驗概率乘積的比值)等于1。而當刺激強度大于Cideal時,后驗概率的比值大于1,此時個體會把當前刺激判斷為信號;當刺激強度小于Cideal時,后驗概率的比值小于1,此時個體會把當前刺激判斷為噪音。上述基于貝葉斯推理過程的決策規(guī)則,與經(jīng)典信號檢測論框架下理想觀察者的決策規(guī)則完全相同。
然而,針對實際研究的數(shù)據(jù)分析結(jié)果表明,雖然真實被試設(shè)置的報告標準與理想觀察者近似(Knill, 1998; Legge et al., 2002; Stretch & Wixted, 1998),但被試通常不會把報告標準恰好設(shè)置在公式(16)給出的Cideal的位置,這意味著被試的決策規(guī)則與理想觀察者仍然存在一定的偏離(Lau, 2007; Wickens, 2001)。根據(jù)貝葉斯決策理論,真實被試與理想觀察者的偏離可能由兩種原因造成。第一種是被試對信號和噪音出現(xiàn)的先驗概率的估計與二者出現(xiàn)的實際概率不相同。圖2A給出了一個示例:在實際的實驗任務(wù)中,信號和噪音出現(xiàn)的客觀概率相等,但被試主觀認為信號出現(xiàn)的先驗概率大于噪音的先驗概率。基于貝葉斯決策理論的觀點,被試此時會根據(jù)自身對先驗概率的主觀估計,把報告標準設(shè)置在信號分布和噪音分布均值的中間靠左的位置,以保證作答正確率最大。但由于被試主觀估計的先驗概率與信號和噪音出現(xiàn)的客觀概率不同,因此被試設(shè)置的報告標準在實際的信號和噪音分布上就會與理想觀察者存在偏離。第二種是被試對信號或噪音分布形態(tài)的主觀估計與客觀分布的形態(tài)不同,進而造成對似然函數(shù)的主觀估計出現(xiàn)偏差。在圖2B的示例中,被試對噪音分布均值的主觀估計與其真實值相等,但是對信號分布均值的主觀估計大于信號分布的實際均值。在這種情況下,被試會基于貝葉斯推理的結(jié)果,把報告標準設(shè)置在信號和噪音分布均值的主觀估計值的中點。然而,被試對信號分布均值的主觀估計偏差會導(dǎo)致設(shè)置的報告標準偏離實際分布上的理想標準(Lau, 2007; Wickens, 2001)。因此,和經(jīng)典信號檢測論相比,貝葉斯決策理論進一步地解釋了為何個體在信號檢測任務(wù)中會把報告標準設(shè)置在特定的位置,并將其與個體對信號和噪音的出現(xiàn)概率及分布形態(tài)的主觀估計緊密聯(lián)系了起來。
以上結(jié)論都是基于圖1所示的等方差信號檢測模型推導(dǎo)得出的。在等方差信號檢測模型中,雖然和經(jīng)典信號檢測論相比,貝葉斯決策理論可以對個體的決策過程給出更加深入的理論解釋,但是二者在數(shù)學(xué)上是等價的。具體而言,雖然根據(jù)貝葉斯決策理論,個體對先驗概率和似然函數(shù)的主觀估計可能與其客觀真實值存在差異,但只要個體主觀認為信號和噪音分布的方差相等,基于經(jīng)典信號檢測論和貝葉斯決策理論得出的決策過程就會在數(shù)學(xué)上具有相等的形式:個體會在刺激強度x高于某一報告標準C時將刺激判斷為信號,而在x低于C時將刺激判斷為噪音(Glanzer et al., 2009, 2019; Wickens, 2001)。然而,在實際的信號檢測任務(wù)中,信號和噪音分布的方差并不會始終相等;該類模型被稱為不等方差信號檢測模型(Mickes et al., 2007)。在這種情況下,經(jīng)典信號檢測論與貝葉斯決策理論之間的關(guān)系會變得更加復(fù)雜。接下來,本文將介紹經(jīng)典信號檢測論與貝葉斯決策理論在不等方差信號檢測模型中存在怎樣的差異。
4 不等方差信號檢測模型
在信號檢測論模型中,為了簡化模型假設(shè),研究者經(jīng)常假設(shè)信號和噪音分布具有相等的方差(標準差)。然而,在實際研究中,這一假設(shè)并非始終成立(Green & Swets, 1966; Wixted, 2020)。比如,在前文介紹過的再認記憶任務(wù)中,研究者們發(fā)現(xiàn),和“新詞”代表的噪音分布相比,“舊詞”代表的信號分布具有顯著更大的標準差,且信號和噪音分布的標準差比值通常在1.25∶1左右(Mickes et al., 2007; Rotello, 2017)。Wixted (2007)提出了一種假設(shè)來解釋再認記憶任務(wù)中信號分布方差更大的原因:與新詞相比,舊詞之所以在再認記憶任務(wù)中具有更高的刺激強度,是由于個體對這些舊詞在學(xué)習(xí)階段進行了一定程度的學(xué)習(xí)與記憶;而只有當個體對所有舊詞的學(xué)習(xí)程度均相等時,信號分布的方差才能與噪音分布保持一致。但實際上,個體對每個舊詞的學(xué)習(xí)程度必然不是完全相等的,不同舊詞的學(xué)習(xí)程度之間的變異會導(dǎo)致信號分布的方差顯著大于噪音分布。因此,等方差信號檢測模型雖然具有簡單的理論假設(shè),但可能對信號檢測任務(wù)給出了過于簡化的描述;而不等方差信號檢測模型也許能夠更好地反映個體在實際任務(wù)中完成的信號檢測過程。
值得注意的是,并非所有的信號檢測任務(wù)都必須使用不等方差信號檢測模型來描述。比如,在二選一迫選任務(wù)(2 alternative forced choice, 2AFC)范式中,屏幕上每次會同時呈現(xiàn)一個信號刺激(如舊詞)和一個噪音刺激(如新詞),被試需要從兩個刺激中準確地選出信號刺激。即使信號和噪音分布的方差不相等,2AFC任務(wù)的信號檢測過程也能夠使用等方差信號檢測模型來定量刻畫(Wickens, 2001)。由于與本文主題不直接相關(guān),因此本文不對2AFC任務(wù)下的信號檢測論模型進行進一步介紹。感興趣的讀者可以閱讀已有文獻中對2AFC任務(wù)的論述(Macmillan & Creelman, 2004; Wickens, 2001)。
下面,本文將介紹在不等方差信號檢測模型的框架下,個體如何根據(jù)貝葉斯決策理論來完成決策過程。圖3給出了不等方差信號檢測模型的示例。與圖1相似,圖3中噪音分布的均值為0,信號分布的均值為d'。然而,與圖1不同的是,圖3中噪音分布的標準差σN等于1,而信號分布的標準差σS與1并不相等(圖3中假設(shè)σS大于1,即與再認記憶任務(wù)中的情況相同)。為了簡化貝葉斯推理過程,這里假設(shè)信號和噪音出現(xiàn)的真實概率均為0.5,且個體完全清楚信號和噪音的先驗概率及似然函數(shù)。由于信號和噪音出現(xiàn)的先驗概率相等,因此個體的決策結(jié)果完全依賴于當前刺激的強度x在信號和噪音分布中的似然函數(shù)的比值:根據(jù)公式(8),當似然函數(shù)的比值大于1時,個體會將當前刺激判斷為信號,反之則判斷為噪音。然而,根據(jù)圖3可知,在不等方差信號檢測模型中,信號分布和噪音分布存在兩個不同位置的交叉點(C1和C2)。當x小于C1或大于C2時,x在信號分布中的概率密度高于噪音分布,因此被試會把當前刺激判斷為信號;而當x處在C1和C2之間時,x在噪音分布中的概率密度更高,被試會把當前刺激判斷為噪音。換言之,信號和噪音分布的似然函數(shù)的一個特定比值,在刺激強度的數(shù)軸上對應(yīng)兩個不同的報告標準。
Glanzer等(2009)通過嚴密的數(shù)學(xué)推導(dǎo),給出了在不等方差信號檢測模型中,似然函數(shù)比值與刺激強度數(shù)軸上的報告標準C之間的對應(yīng)關(guān)系。Glanzer等首先計算了當刺激強度等于C時,信號和噪音分布中似然函數(shù)的比值,隨后對似然函數(shù)比值取自然對數(shù)(記為λ):
由于對數(shù)函數(shù)是單調(diào)遞增的,因此當λ取到其最大值(或最小值)時,似然函數(shù)的比值也應(yīng)當能夠取到最大值(或最小值)。進一步的計算結(jié)果表明(Glanzer et al., 2009),λ與刺激強度數(shù)軸上的報告標準C之間滿足二次函數(shù)關(guān)系(見圖4)。當信號分布的標準差σS大于1時,λ有最小值(記為λ*);而當σS小于1時,λ有最大值(記為λ*)。當且僅當λ等于λ*時,刺激強度數(shù)軸上存在唯一的報告標準與其對應(yīng)(記為C*);而當λ不等于λ*時,每一個λ值都對應(yīng)兩個不同的報告標準。當λ等于0(即似然函數(shù)比值為1)時,對應(yīng)的兩個報告標準C1和C2將整個刺激強度數(shù)軸分為三個部分。如果σS大于1,則個體會將C1和C2中間的部分判斷為噪音,而將兩側(cè)的部分判斷為信號;如果σS小于1則相反。
經(jīng)典信號檢測論認為,即使在不等方差信號檢測模型中,個體仍然只會簡單地設(shè)置一個報告標準C,并當刺激強度x高于C時將刺激判斷為信號,反之則判斷為噪音(Mickes et al., 2007; Wickens, 2001)。因此,經(jīng)典信號檢測論和貝葉斯決策理論為不等方差信號檢測模型中的決策機制給出了不同的預(yù)測,個體根據(jù)兩種理論給出的決策結(jié)果也不再完全等價(這一點與等方差信號檢測模型有別)。
經(jīng)典信號檢測論和貝葉斯決策理論在不等方差信號檢測模型中存在的差異可以從操作者特性曲線(receiver operating characteristic curve, ROC curve)中體現(xiàn)出來。ROC曲線指的是在保持信號和噪音的客觀分布形態(tài)不變的基礎(chǔ)上,反映擊中率(HR)和虛報率(false alarm rate, FAR)之間關(guān)系的曲線(Wickens, 2001)。在經(jīng)典信號檢測論框架下,通過改變報告標準C的位置(如設(shè)置寬松或嚴格的報告標準),可以同時改變擊中率和虛報率的值。而在貝葉斯決策理論框架下(假設(shè)個體完全清楚先驗概率和似然函數(shù)的真實值),可以通過改變信號和噪音刺激出現(xiàn)概率的方式來影響先驗概率,進而影響后驗概率比值等于1時的似然函數(shù)比值(即影響λ的臨界值);λ的臨界值對應(yīng)的報告標準的位置也會隨之發(fā)生變化,進而改變擊中率和虛報率。將所有可能的擊中率和虛報率配對繪制在圖上,以虛報率為橫坐標,擊中率為縱坐標,即可得到ROC曲線。
在等方差信號檢測模型中,無論個體基于經(jīng)典信號檢測論還是貝葉斯決策理論來完成決策過程(二者在數(shù)學(xué)上是等價的),只要辨別力指數(shù)d'的值大于0,ROC曲線就會始終處在對角線上方,即意味著擊中率始終高于虛報率;當d'的值越高時,ROC曲線下的面積越大(見圖5A的示例)。但是,在不等方差信號檢測模型中,如果個體基于經(jīng)典信號檢測論給出的決策機制來完成決策過程,則就算d'的值大于0,ROC曲線也會有一部分處在對角線下方。比如,當信號分布標準差σS大于1時,在擊中率和虛報率都非常接近1的情況下,擊中率會小于虛報率(見圖5B);而當σS小于1時,則在擊中率和虛報率都接近于0的情況下,擊中率小于虛報率(見圖5C)。與之相對,如果個體基于貝葉斯決策理論來完成決策過程,則即使在不等方差信號檢測模型中,ROC曲線也會始終處在對角線上方(見圖5D);這一結(jié)論可以在數(shù)學(xué)上得到嚴格的證明(Wickens, 2001)。
經(jīng)典信號檢測論和貝葉斯決策理論之間的差異可以在zROC曲線上得到更加直觀的體現(xiàn)(Macmillan & Creelman, 2004)。所謂zROC曲線,指的是首先利用下面的公式將擊中率HR和虛報率FAR轉(zhuǎn)化為z分數(shù):
? ? ? ? zHR=Φ-1(HR|μ=0,σ=1) ? (19)
? ? ? ? ?zFAR=Φ-1(FAR|μ=0,σ=1) ? ? ? (20)
公式(19)和(20)中,Φ-1(p|μ=0,σ=1)代表均值為0、標準差為1的標準正態(tài)分布累積分布函數(shù)的逆函數(shù),即將取值范圍在0到1之間的概率值p轉(zhuǎn)化為取值范圍在負無窮到正無窮之間的z分數(shù)。隨后,以zFAR為橫坐標,zHR為縱坐標,繪制二者之間的關(guān)系圖,即為zROC曲線。圖6給出了zROC曲線的示例。當zROC曲線位于直線y=x上方時,就意味著擊中率大于虛報率。從數(shù)學(xué)上可以證明,在經(jīng)典信號檢測論框架下,zHR和zFAR之間的關(guān)系為一條直線,其斜率等于噪音分布標準差和信號分布標準差的比值σN/σS (Wickens, 2001)。在信號檢測論中,噪音分布標準差σN通常設(shè)為1。當信號分布標準差σS大于1時,zROC直線的斜率小于1,此時zROC直線必然會在右側(cè)與直線y=x相交,并導(dǎo)致當擊中率和虛報率的值均很大時,擊中率小于虛報率。同理,當σS小于1時,zROC直線的斜率大于1,會在左側(cè)與y=x相交,并導(dǎo)致當擊中率和虛報率的值均很小時,擊中率小于虛報率(見圖6A的示例)。另一方面,在貝葉斯決策理論的框架下,zHR和zFAR之間的關(guān)系為一條曲線;無論σS的值等于多少,zROC曲線始終位于y=x的上方(見圖6B的示例)(Macmillan & Creelman, 2004)。
由于在不等方差信號檢測模型中,經(jīng)典信號檢測論和貝葉斯決策理論預(yù)測了不同的ROC曲線和zROC曲線形態(tài),因此從理論上講,可以通過考察實際研究當中獲得的ROC以及zROC曲線,以及在極端條件下獲得的擊中率和虛報率數(shù)據(jù),來確認哪一種理論能夠更好地解釋真實被試在不等方差信號檢測任務(wù)當中的決策過程。比如,在再認記憶任務(wù)中,可以考慮通過盡可能地增加舊詞的出現(xiàn)頻率,降低新詞的出現(xiàn)頻率,使得被試設(shè)置盡可能寬松的報告標準,即將絕大多數(shù)刺激都判斷為舊詞(此時擊中率和虛報率都接近1)。在該實驗條件下,如果發(fā)現(xiàn)被試的擊中率低于虛報率,則支持經(jīng)典信號檢測論;如果擊中率始終高于虛報率,則支持貝葉斯決策理論。
然而,上述實驗設(shè)計很難在實際研究中得到應(yīng)用。這是因為在經(jīng)典信號檢測論框架下,當不等方差信號檢測模型中的擊中率低于虛報率時,擊中率與虛報率的真值都非常接近極端值0或1。同時,即使存在擊中率低于虛報率的情況,二者之間的差異也是很小的(見圖5B和圖5C)。在此情況下,樣本數(shù)據(jù)中計算得到的擊中率與虛報率差值會受到抽樣誤差的嚴重影響,一點細微的抽樣誤差的存在都會導(dǎo)致研究者難以根據(jù)實驗結(jié)果準確估計擊中率與虛報率的真實差異(Glanzer et al., 2019; Macmillan & Creelman, 2004)。那么,是否存在某種實驗設(shè)計,使得研究者可以比較經(jīng)典信號檢測論和貝葉斯決策理論在解釋真實個體的決策過程時的優(yōu)劣呢?
5 支持貝葉斯決策理論的研究證據(jù)
有研究者指出,兩條件實驗可以被用于比較經(jīng)典信號檢測論和貝葉斯決策理論在真實決策過程中的合理性(Glanzer et al., 2009, 2019; Semmler et al., 2018; Stretch & Wixted, 1998)。所謂的兩條件實驗,指的是在一個被試內(nèi)實驗設(shè)計中,要求同一批被試完成兩個不同的信號檢測任務(wù);這兩個任務(wù)除了存在難度上的區(qū)別外,在任務(wù)要求上沒有任何差異。比如,被試可以完成兩個不同的再認記憶任務(wù),這兩個任務(wù)的唯一區(qū)別在于學(xué)習(xí)階段被試學(xué)習(xí)每個舊詞的時間長度存在差異,學(xué)習(xí)時間越長則任務(wù)難度越低(Glanzer et al., 2009)。同時,在兩個信號檢測任務(wù)中,被試不僅需要判斷每個刺激是信號還是噪音,而且需要給出自己對作答結(jié)果的信心判斷,即被試需要在一個李克特量表上評價自己對作答結(jié)果的信心程度。此外,Glanzer等(2019)指出,在兩條件實驗設(shè)計中,被試必須清楚意識到每個試次來自哪個任務(wù)難度條件。因此,兩個不同難度的信號檢測任務(wù)最好在不同的組塊中進行;如果一定要使用混合列表設(shè)計,即把兩個難度的信號檢測任務(wù)的試次混合在一起,則必須通過特定的提示告知被試當前的試次來自哪個實驗條件,比如為屏幕上呈現(xiàn)的詞語標注不同的顏色等。
研究者們提出了似然比理論來解釋個體在兩條件實驗中的決策過程(Glanzer et al., 2009, 2019; Semmler et al., 2018)。似然比理論以貝葉斯決策理論為基礎(chǔ),包含兩個具體假設(shè):(1)似然比不變假設(shè)。該假設(shè)認為,在兩種不同難度的實驗條件下,個體用于貝葉斯決策過程的似然函數(shù)比值的臨界值保持不變(這一假設(shè)會在下面進行更詳細的介紹)。(2)真實似然比假設(shè)。該假設(shè)認為,個體知道信號和噪音分布的真實分布形態(tài),并會依據(jù)刺激強度在信號和噪音分布中的真實似然函數(shù)比值來完成決策過程。需要注意的是,真實似然比假設(shè)比一般的貝葉斯決策理論更強:貝葉斯決策理論通常允許個體主觀估計的似然函數(shù)比值與真實的似然函數(shù)比值存在差異(Lau, 2007; Wickens, 2001),但真實似然比假設(shè)則認為個體知道(或至少近似知道)信號與噪音分布中的真實似然函數(shù)(Glanzer et al., 2019; Semmler et al., 2018)。根據(jù)似然比理論,個體在兩條件實驗中的決策過程應(yīng)同時滿足上述兩個假設(shè)(Glanzer et al., 2009, 2019)。
在似然比理論的基礎(chǔ)上,Glanzer等(2009, 2019)預(yù)測了兩條件實驗中可能出現(xiàn)的三種實驗現(xiàn)象,包括鏡像效應(yīng)、方差效應(yīng)和zROC長度效應(yīng)(zROC length effect)。Glanzer等指出,似然比理論可以很容易地解釋上述三種現(xiàn)象的產(chǎn)生機制,但經(jīng)典信號檢測理論難以同時解釋這三種現(xiàn)象的發(fā)生。實際研究結(jié)果表明,在不同認知領(lǐng)域(如知覺、記憶、推理、心理旋轉(zhuǎn)等)的信號檢測任務(wù)中,上述三種現(xiàn)象均穩(wěn)定存在(Glanzer et al., 2009, 2019; Hilford et al., 2015, 2019; Semmler et al., 2018),即在一定程度上支持了貝葉斯決策理論的合理性。由于篇幅所限,本文只著重介紹其中的一種現(xiàn)象——zROC長度效應(yīng)。
zROC長度效應(yīng)最早由Stretch和Wixted (1998)發(fā)現(xiàn)。Stretch和Wixted對已有的一項研究中的數(shù)據(jù)進行了再次分析(Ratcliff et al., 1994);在該研究中,被試需要完成兩種不同難度的再認記憶任務(wù)(容易vs.困難)。比如,在容易條件下被試學(xué)習(xí)每個舊詞的時間為3s,而在困難條件下每個舊詞的學(xué)習(xí)時間只有1s。在再認測驗中,被試需要在一個6點量表上針對每個詞語完成判斷任務(wù),其中1到6分別代表“確定是新詞”“很可能是新詞”“可能是新詞”“可能是舊詞”“很可能是舊詞”“確定是舊詞”。因此,被試不僅需要針對每個詞語進行新舊判斷,還需要報告自己對作答結(jié)果的信心程度。在經(jīng)典信號檢測論框架下,信心判斷任務(wù)是二分判斷任務(wù)(信號vs.噪音)的推廣形式,即在n點量表上進行的信心判斷任務(wù)等價于在刺激強度的數(shù)軸上設(shè)置(n-1)個報告標準(Wickens, 2001)。如圖7A所示,當刺激強度低于第一個報告標準C1時,被試會在信心判斷量表上報告為1;當刺激強度在C1和C2之間時,被試會在信心判斷量表上報告為2;以此類推。Stretch和Wixted發(fā)現(xiàn),與困難條件(辨別力指數(shù)d'更低的條件)相比,在容易條件(d'更高的條件)下,所有的報告標準的位置均會向中間收縮,即不同報告標準之間的距離會縮短(見圖7A)。Stretch和Wixted隨后在一個新的實驗研究中驗證了上述結(jié)論。
Glanzer等(2009, 2019)使用zROC曲線對Stretch和Wixted (1998)報告的現(xiàn)象進行了重新表述。具體而言,Glanzer等首先根據(jù)被試在n點信心判斷量表上給出的判斷結(jié)果,通過改變報告標準的方式計算出(n-1)對擊中率和虛報率。比如,在一個6點信心判斷量表上,假設(shè)將信心判斷量表點數(shù)1視為被試把當前刺激判斷為噪音,而將量表點數(shù)2~6視為被試把刺激判斷為信號,即可計算出一組擊中率和虛報率;而如果將量表點數(shù)1~2視為被試把刺激判斷為噪音,而將量表點數(shù)3~6視為被試把刺激判斷為信號,則可計算出另一組擊中率和虛報率;以此類推。隨后,Glanzer等基于每種實驗條件下獲得的(n-1)對擊中率和虛報率繪制出zROC曲線。結(jié)果表明,與困難條件相比;容易條件下繪制的zROC曲線兩端之間的距離顯著更短(如圖7B所示);這意味著當改變報告標準時,容易條件下的擊中率和虛報率值變化幅度更小,即說明容易條件下不同的報告標準之間更為接近。Glanzer等將這一現(xiàn)象命名為zROC長度效應(yīng)。
似然比理論指出,基于似然比不變假設(shè)可以很自然地推導(dǎo)出zROC長度效應(yīng)。根據(jù)貝葉斯決策理論(參考公式(8)),個體在n點信心判斷量表上給出判斷的過程,可以被看作在后驗概率比值上設(shè)置(n-1)個閾值(記為β1、β2……βn-1),并將當前刺激對應(yīng)的后驗概率比值與每個β值相比較的過程。假如當前刺激對應(yīng)的后驗概率比值小于β1,則個體在信心判斷量表上報告的結(jié)果為1;假如刺激對應(yīng)的后驗概率比值在β1和β2之間,則信心判斷的結(jié)果為2;以此類推(Green & Swets, 1966)。Glanzer等(2009, 2019)假設(shè),當兩個實驗條件之間的唯一差異為任務(wù)難度時,個體設(shè)置的閾值β應(yīng)當不會在實驗條件之間發(fā)生改變。由于后驗概率比值等于先驗概率比值和似然函數(shù)比值的乘積,且個體在貝葉斯推理過程中對于信號和噪音出現(xiàn)的先驗概率的主觀估計通??梢越埔暈楹愣ǎ‵leming & Daw, 2017; Wickens, 2001),因此可以在數(shù)學(xué)上等價地認為,個體在信號和噪音分布的似然函數(shù)比值上設(shè)置了一組閾值,并通過每個刺激對應(yīng)的似然函數(shù)比值與上述閾值之間的比較來給出信心判斷的結(jié)果。同時,個體在似然函數(shù)比值上設(shè)置的閾值應(yīng)當不會在兩個實驗條件之間發(fā)生變化(Glanzer et al., 2019)。上述假設(shè)即為似然比不變假設(shè)。
接下來,本文將以等方差信號檢測模型為例,根據(jù)似然比不變假設(shè)來推導(dǎo)zROC長度效應(yīng)。由于個體在似然函數(shù)比值上設(shè)置的閾值是恒定不變的,因此在為似然函數(shù)比值取對數(shù)之后,對數(shù)似然比(λ)上設(shè)置的閾值也不會在實驗條件之間發(fā)生改變?;谡龖B(tài)分布的概率密度函數(shù)(參考公式(14)和(15)),可以寫出λ與報告標準C之間的對應(yīng)關(guān)系(Glanzer et al., 2009):
當λ在不同實驗條件之間維持恒定時,隨著任務(wù)難度的下降(即d'的上升),報告標準C會逐漸向d'/2的周圍收縮,因此一組報告標準之間的距離會縮短,即得出了zROC長度效應(yīng)。此外,Glanzer等(2009)的數(shù)學(xué)推導(dǎo)結(jié)果表明,在不等方差信號檢測模型中,雖然個體的貝葉斯決策機制更為復(fù)雜,但只要個體保持λ在不同實驗條件之間的恒定, zROC長度效應(yīng)就會成立。Glanzer等(2009, 2019)指出,雖然經(jīng)典信號檢測論也可以對zROC長度效應(yīng)進行強行解釋,即認為個體在刺激強度的數(shù)軸上直接設(shè)置的報告標準恰好隨著任務(wù)難度的降低而收縮,但它無法解釋報告標準的收縮對應(yīng)怎樣的內(nèi)在心理機制。因此,zROC長度效應(yīng)可以被視為支持貝葉斯決策理論的證據(jù)?;谙嗨频姆椒?,Glanzer等(2009)從似然比理論中推導(dǎo)出了另外兩種現(xiàn)象——鏡像效應(yīng)和方差效應(yīng),并在實際研究結(jié)果中驗證了這兩種效應(yīng)的存在。感興趣的讀者可以閱讀Glanzer等(2009)的數(shù)學(xué)推導(dǎo)過程。
根據(jù)似然比理論得出的三種實驗現(xiàn)象在一定程度上為貝葉斯決策理論提供了支持。然而,似然比理論一直受人質(zhì)疑的地方在于其包含的真實似然比假設(shè),即認為個體在信號檢測任務(wù)中能夠知道信號和噪音分布的真實形態(tài)。一些研究者質(zhì)疑真實被試是否有能力掌握如此多的信息(Balakrishnan & Ratcliff, 1996; Criss & McClelland, 2006)。為了回應(yīng)這一質(zhì)疑,Semmler等(2018)提出,個體對信號和噪音分布形態(tài)的認識來自日常生活中經(jīng)年累月的學(xué)習(xí);即使個體不能通過學(xué)習(xí)精確地掌握信號與噪音分布的均值與標準差,也至少可以清楚地意識到信號和噪音分布之間的距離如何隨著任務(wù)難度的變化而發(fā)生變化(Turner et al., 2011; Wixted & Gaitan, 2002)。然而,上述觀點目前主要停留在理論層面。未來需要進一步對似然比理論的假設(shè)合理性進行考察。
6 結(jié)語
本文在貝葉斯決策理論的框架下,探討了個體如何通過貝葉斯推理過程完成信號檢測任務(wù)中的決策判斷。與經(jīng)典信號檢測論相比,貝葉斯決策理論可以更加深入地解釋個體辨別信號和噪音的決策過程對應(yīng)怎樣的內(nèi)在心理機制。但是,貝葉斯決策理論中涉及的參數(shù)較多(包括個體對先驗概率和似然函數(shù)的主觀估計),而在信號檢測實驗任務(wù)中,根據(jù)擊中率和虛報率的實驗數(shù)據(jù)難以對上述所有參數(shù)求解。比如,個體在信號檢測任務(wù)中的報告標準發(fā)生變化,既有可能是源于個體改變了對先驗概率的主觀估計,也可能是由于對似然函數(shù)的主觀估計發(fā)生了改變;而在實際研究中很難區(qū)分這兩種情況(Fleming & Daw, 2017; Lau, 2007)。雖然似然比理論認為個體對似然函數(shù)的主觀估計和客觀真實值基本相同(Glanzer et al., 2009, 2019; Semmler et al., 2018),即對貝葉斯決策理論進行了簡化,但這一假設(shè)受到了其他研究者的質(zhì)疑。因此,本文認為,在實際的信號檢測實驗任務(wù)中,經(jīng)典信號檢測論(以及該理論提出的報告標準C)依然是可用于數(shù)據(jù)分析的有效工具。
本文討論的貝葉斯決策理論并不能完整反映個體在信號檢測任務(wù)中的決策機制。比如,貝葉斯決策理論認為,個體的決策結(jié)果完全基于信號和噪音出現(xiàn)的后驗概率的比值,當信號的后驗概率大于噪音時,被試會將當前刺激判斷為信號,反之則判斷為噪音(Burgess, 1985)。然而,在實際研究中,被試的決策結(jié)果還會受到與任務(wù)相關(guān)的獎勵及懲罰程度的影響。比如,一名司機在駕駛汽車即將到達十字路口時,需要快速判斷前方的紅綠燈上目前顯示的是哪種顏色(這里定義綠燈為信號,紅燈為噪音)。在上述的知覺判斷任務(wù)中,漏報(即將綠燈判斷為紅燈)并不會產(chǎn)生非常嚴重的后果,只會導(dǎo)致司機在十字路口多等待一段時間。然而,虛報(將紅燈判斷為綠燈)則會造成嚴重危害,比如司機闖紅燈撞到綠燈方向通行的汽車或行人。因此,司機可能會采取非常嚴格的報告標準,即傾向于將紅綠燈上顯示的顏色判斷為紅色(噪音),而這一判別標準與司機實際接收的知覺信息(刺激強度)是相互獨立的。Green和Swets (1966)指出,當不同作答結(jié)果的獎勵或懲罰程度不同時,個體的作答目標可能會從最大化作答正確率(即理想觀察者),轉(zhuǎn)變?yōu)樽畲蠡陨慝@得的獎勵或最小化自身所受的懲罰。此時,個體的最終決策會同時基于信號和噪音成立的后驗概率,以及不同的作答反應(yīng)可能導(dǎo)致的后果。
前文提到,貝葉斯決策理論認為,個體在信號檢測任務(wù)中給出信心判斷的過程,可以被視為是在后驗概率比值上設(shè)置一組不同的閾限,并將當前刺激對應(yīng)的后驗概率比值與每個閾限值相比較的過程(Glanzer et al., 2009, 2019; Green & Swets, 1966)。然而,近年來,研究者逐漸認識到,基于刺激強度推理得到的后驗概率并不能準確地反映個體的信心判斷結(jié)果。這是因為個體在決策當前刺激是信號還是噪音時依賴的刺激強度,與信心判斷過程中使用的信息可能并不完全相同:個體在信心判斷中可能會丟失一部分關(guān)于刺激內(nèi)容的信息,也可能基于一些額外的推理過程獲得更豐富的信息(Hu et al., 2021; Jang et al., 2012; Maniscalco & Lau, 2012; Shekhar & Rahnev, 2021)。為了將信心判斷過程更好地納入貝葉斯決策理論的框架下,F(xiàn)leming和Daw (2017) 對傳統(tǒng)的貝葉斯決策理論進行了改進,并在改進后的理論中考慮了個體在決策過程和信心判斷過程中利用信息的差異。但是,另一些研究者認為,即使考慮了個體在信心判斷過程中利用的獨特信息,信心判斷過程自身的內(nèi)在機制可能也與貝葉斯決策理論的觀點并不完全相符(Adler & Ma, 2018; Li & Ma, 2020)。關(guān)于信心判斷對應(yīng)的內(nèi)在心理過程是否為貝葉斯決策過程,目前仍然是一個存在爭論的話題,需要未來研究進一步探索。
參考文獻
胡傳鵬, 孔祥禎, Wagenmakers, E.-J., Ly, A., 彭凱平(2018). 貝葉斯因子及其在JASP中的實現(xiàn). 心理科學(xué)進展, 26(6), 951-965.
Adler, W. T., & Ma, W. J. (2018). Comparing Bayesian and non-Bayesian accounts of human confidence reports. PLoS Computational Biology, 14(11), e1006572.
Balakrishnan, J. D., & Ratcliff, R. (1996). Testing mod-els of decision making using confidence ratings in clas-sification. Journal of Experimental Psychology: Human Perception and Performance, 22(3), 615-633.
Banks, W. P. (1970). Signal detection theory and human memory. Psychological Bulletin, 74(2), 81-99.
Burgess, A. (1985). Visual signal detection.III.On Bayesian use of prior knowledge and cross correlation. Journal of the Optical Society of America A, 2(9), 1498-1507.
Criss, A. H., & McClelland, J. L. (2006). Differentiating the differentiation models: A comparison of the retrieving effectively from memory model (REM) and the subj-ective likelihood model (SLiM). Journal of Memory and Language, 55(4), 447-460.
Egan, J., Schulman, A. I., & Greenberg, G. Z. (1959). Operating characteristics determined by binary decisions and by ratings. The Journal of the Acoustical Society of America, 31(6), 768-773.
Fleming, S. M., & Daw, N. D. (2017). Self-evaluation of decision-making: A general bayesian framework for metacognitive computation. Psychological Review, 124(1), 91-114.
Glanzer, M., Hilford, A., Kim, K., & Maloney, L. T. (2019). Generality of likelihood ratio decisions. Cognition, 191, 103931.
Glanzer, M., Hilford, A., & Maloney, L. T. (2009). Like-lihood ratio decisions in memory: Three implied regu-larities. Psychonomic Bulletin & Review, 16(3), 431-455.
Green, D. M., & Swets, J. A. (1966). Signal detection theory and psychophysics. Wiley.
Hilford, A., Glanzer, M., Kim, K., & Maloney, L. T. (2019). One mirror effect: The regularities of recognition memory. Memory & Cognition, 47(2), 266-278.
Hilford, A., Maloney, L. T., Glanzer, M., & Kim, K. (2015). Three regularities of recognition memory: The role of bias. Psychonomic Bulletin & Review, 22(6), 1646-1664.
Hu, X., Zheng, J., Su, N., Fan, T., Yang, C., Yin, Y., Fleming, S. M., & Luo, L. (2021). A Bayesian inference model for metamemory. Psychological Review, 128(5), 824-855.
Jang, Y., Wallsten, T. S., & Huber, D. E. (2012). A stoc-hastic detection and retrieval model for the study of met-acognition. Psychological Review, 119(1), 186-200.
Kersten, D., Mamassian, P., & Yuille, A. (2004). Object perception as bayesian inference. Annual Review of Psychology, 55(1), 271-304.
Knill, D. C. (1998). Discrimination of planar surface slant from texture: Human and ideal observers compared. Vision Research, 38(11), 1683-1711.
Lau, H. C. (2007). A higher order Bayesian decision theory of consciousness. Progress in Brain Research, 168, 35-48.
Legge, G. E., Hooven, T. A., Klitz, T. S., Stephen Mansfield, J., & Tjan, B. S. (2002). Mr. Chips 2002: New insights from an ideal-observer model of reading. Vision Rese-arch, 42(18), 2219-2234.
Li, H.-H., & Ma, W. J. (2020). Confidence reports in decision-making with multiple alternatives violate the Bayesian confidence hypothesis. Nature Communications, 11(1), 2004.
Macmillan, N. A., & Creelman, C. D. (2004). Detection theory: A user’s guide. London: Psychology press.
Maloney, L. T., & Zhang, H. (2010). Decision-theoretic models of visual perception and action. Vision Research, 50(23), 2362-2374.
Mamassian, P. (2016). Visual confidence. Annual Review of Vision Science, 2(1), 459-481.
Maniscalco, B., & Lau, H. (2012). A signal detection theo-retic approach for estimating metacognitive sensitivity from confidence ratings. Consciousness and Cognition, 21(1), 422-430.
Mickes, L., Wixted, J. T., & Wais, P. E. (2007). A direct test of the unequal-variance signal detection model of recognition memory. Psychonomic Bulletin & Review, 14(5), 858-865.
Pouget, A., Drugowitsch, J., & Kepecs, A. (2016). Conf-idence and certainty: Distinct probabilistic quantities for different goals. Nature Neuroscience, 19(3), 366-374.
Ratcliff, R., McKoon, G., & Tindall, M. (1994). Empirical generality of data from recognition memory receiver-operating characteristic functions and implications for the global memory models. Journal of Experimental Psychology: Learning, Memory, and Cognition, 20(4), 763-785.
Rotello, C. M. (2017). Signal detection theories of Recog-nition memory. In J. Byrne (Ed.), Learning and Memory: A Comprehensive Reference (Second Edition) (pp. 201-225). Academic Press.
Semmler, C., Dunn, J., Mickes, L., & Wixted, J. T. (2018). The role of estimator variables in eyewitness identification. Journal of Experimental Psychology: Applied, 24(3), 400-415.
Shekhar, M., & Rahnev, D. (2021). The nature of meta-cognitive inefficiency in perceptual decision making. Psychological Review, 128(1), 45-70.
Stretch, V., & Wixted, J. T. (1998). Decision rules for recognition memory confidence judgments. Journal of Experimental Psychology: Learning, Memory, and Cognition, 24(6), 1397-1410.
Tanner, W. P., & Swets, J. A. (1954). A decision-making theory of visual detection. Psychological Review, 61(6), 401-409.
Turner, B. M., Van Zandt, T., & Brown, S. (2011). A dynamic stimulus-driven model of signal detection. Psychological Review, 118(4), 583-613.
Wickens, T. D. (2001). Elementary signal detection theory. New York: Oxford university press.
Wixted, J. T. (2007). Dual-process theory and signaldet-ection theory of recognition memory. Psychological Review, 114(1), 152-176.
Wixted, J. T. (2020). The forgotten history of signal detec-tion theory. Journal of Experimental Psychology: Lea-rning, Memory, and Cognition, 46(2), 201-233.
Wixted, J. T., & Gaitan, S. C. (2002). Cognitive theories as reinforcement history surrogates: The case of likelihood ratio models of human recognition memory. Animal Learning & Behavior, 30(4), 289-305.