

摘" 要" 在口語詞匯產生過程中, 音節頻率效應(syllable frequency effect)指的是高頻音節相對于低頻音節的加工優勢。綜述了言語產生過程中音節頻率效應的表現形式和理論基礎, 從影響因素、發生階段和神經機制等角度闡述了印歐語系和漢語中音節頻率效應的跨語言差異。基于口語產生的理論模型和合適單元假說, 結合不同語言的固有特性, 分析了音節頻率效應存在跨語言差異的原因, 提出了一個有關漢語口語詞匯產生中音節作用機制的模型, 為音節在漢語和字母語言口語產生過程中的作用提供了新的視角。未來應進一步探究音節頻率的兩種測量方式對音節頻率效應產生影響的具體機制, 加強對漢語口語詞匯產生中音節頻率效應的考察, 利用多種實驗技術和范式深入探討言語產生過程中音節加工的跨語言差異。
關鍵詞" 言語產生, 音節頻率效應, 跨語言, 心理音節表, 音節鄰近項
分類號" B842
1" 引言
言語產生在人類溝通交流中起著重要的作用, 是指將思想轉化為言語, 并利用發音器官進行表達的心理過程, 包含三個認知加工階段:一是概念準備, 即講話者明確自己想要用言語表達的概念和內容; 二是言語組織, 即對概念進行組織并轉換為相應的語言形式; 三是發音運動, 即通過聲帶肌肉運動進行發音輸出(Levelt et al., 1999)。根據言語產生的WEAVER++ (Word-form Encoding by Activation and Verification++, Levelt et al., 1999)模型, 言語組織即詞匯通達(lexical access)階段, 包括了詞匯選擇(lexical selection)、詞素音位編碼(morphological encoding)和音韻編碼(phonological encoding)階段。講話者在音韻編碼階段根據詞素提取音段和節律信息, 并通過音節化過程(syllabification)將音段以嚴格的順序插入節律框架中; 之后進行語音編碼(phonetic encoding), 提取音節的發音運動程序并為發音輸出做好準備。已有研究對于音節在口語詞匯產生中的作用機制存在爭議。
音節是受具體語言結構和語義制約的自然發音單元(張清芳, 2005)。在言語產生過程中, 音節加工的認知機制和時間進程存在跨語言差異。已有研究在漢語口語詞匯產生中觀察到了穩定的音節啟動效應(syllable priming effect), 即啟動刺激和目標刺激具有音節重疊時命名潛伏期更短。研究者認為這一效應表明音節在詞匯選擇后首先被提取, 是音韻編碼階段重要的功能單元(Cai et al., 2020; Chen et al., 2002, 2016; Feng et al., 2019; Zhang amp; Damian, 2019; 蔣宇宸 等, 2020; 張清芳, 王雪嬌, 2020)。而對于英語、荷蘭語等印歐語系語言, 人們對音節的通達和加工主要發生在語音編碼階段, 表現為音節頻率效應(syllable frequency effect, Bürki et al., 2015; Cholin, 2008; Laganaro amp; Alario, 2006), 在圖畫命名或詞匯朗讀過程中, 高音節頻率詞語的命名潛伏期更短。目前, 盡管言語產生過程中的音節頻率效應已在不同語言當中得到了大量驗證(例如Croot et al., 2017; Laganaro amp; Alario, 2006; Levelt amp; Wheeldon, 1994; 楊群, 張清芳, 2015), 但缺乏對該領域研究成果的系統論述和跨語言比較。本文綜述和比較印歐語系和漢語中音節頻率效應的認知加工機制, 以深入理解言語產生過程中音節頻率效應的跨語言差異。下面我們首先介紹有關音節頻率的測量方式, 然后分別闡述印歐語系和漢語口語產生中音節頻率效應的認知機制及相關理論。
2" 音節頻率的測量: 類型頻率和實例頻率
音節頻率的測量與音節鄰近項(syllabic neighbours)密切相關。在字母語言中, 音節鄰近項廣義上是指無論音節在哪個位置, 相同位置上共享同一個音節的所有詞(Perea amp; Carreiras, 1998), 狹義上是指僅在首音節上具有相同音節的所有詞(Chetail amp; Mathey, 2011), 例如西班牙語詞casa (意思為“房子”, 下同)、caro (“昂貴的”)、caja (“盒子”)和cama (“床”)等互為音節鄰近項(見Perea amp; Carreiras, 1998)。漢語作為聲調語言, 存在大量的同音字和近音字(端木三, 2021; 史有為, 2019; 朱曉農, 2019), 漢語中的音節鄰近項是指音節相同的所有單字(不考慮聲調)。音節頻率通常存在兩種測量方式:音節鄰近項個數和音節鄰近項累計詞頻, 前者被稱為類型頻率(type frequency), 即目標音節所擁有的全部音節鄰近項的數量; 后者被稱為實例頻率(token frequency), 是將該音節的所有音節鄰近項的詞頻進行算數求和(Conrad et al., 2008)。例如, 漢語音節/shua/的音節鄰近項包括“刷” “唰”和“耍”, 根據漢語詞頻庫SUBTLEX- CH (Cai amp; Brysbaert, 2010)提供的詞頻, 三者的詞頻分別為16.4次/百萬、0.21次/百萬和54.37次/百萬, 因此, 音節/shua/的類型頻率為3, 實例頻率為70.98次/百萬。
已有多數研究僅考慮了音節的實例頻率(例如Bürki et al., 2015; Carreiras amp; Perea, 2004; Conrad et al., 2006; Croot et al., 2017; Farrell amp; Abrams, 2014; Hutzler et al., 2005; Laganaro amp; Alario, 2006; Perea amp; Carreiras, 1998; Stenneken" et al., 2007), 同時測量了兩種音節頻率的研究很少, 且本質上仍未真正區分二者所產生的效應。研究者同時測量了兩種音節頻率, 但目的僅在于選取兩種頻率值具有可比性的音節作為實驗材料, 以確保高頻音節同時具有較高的實例頻率和類型頻率, 低頻音節同時具有較低的實例頻率和類型頻率, 而沒有探討這兩種音節頻率的效應是否有所不同(Cholin et al., 2006, 2011; Cholin amp; Levelt, 2009)。單詞的實例頻率和類型頻率具有緊密的聯系, 研究中很難對這兩個變量進行獨立的操縱(Conrad et al., 2008; Miguel-Abella et al., 2022), 難以對音節頻率效應進行明確歸因。Conrad等人(2008)認為這兩種音節頻率在不同的加工水平上起作用:音節鄰近項累計詞頻容易受到詞頻極高的音節鄰近項的影響, 反映詞匯水平上各音節鄰近項和目標詞之間的競爭, 傾向于在詞匯選擇過程中產生抑制效應; 相比之下, 音節鄰近項個數能夠更好地反映亞詞匯水平上音節表征本身的使用頻率和典型性。Kwon (2014)采用韓語詞匯朗讀任務來檢驗上述觀點。作為一種表音文字, 韓語與印歐語系的語言類似, 其正字法深度較淺, 詞匯朗讀過程更多依賴拼讀規則直接通達音節表征, 而較少依賴詞匯水平的信息, 因此預期對音節表征敏感的類型頻率會表現出促進效應, 而對詞匯水平敏感的實例頻率不存在任何效應。結果發現類型頻率和實例頻率都表現出了促進效應, 因此研究者認為二者均可以反映講話者在亞詞匯水平上對音節表征本身的加工。兩種測量方式可能產生不同方向的效應, 這提示研究者兩類測量方式影響口語詞匯產生過程的機制是不同的。
3" 印歐語系中音節頻率效應的認知機制
采用圖畫命名、詞匯朗讀或符號?詞匯聯想命名任務, 研究者發現與命名低音節頻率詞相比, 高音節頻率詞的命名潛伏期更短, 即出現了音節頻率效應(Cholin, 2008; Laganaro amp; Alario, 2006; Levelt amp; Wheeldon, 1994)。言語產生過程中的音節頻率效應已在英語(Cholin et al., 2011; Croot et al., 2017; Macizo amp; Van Petten, 2007)、法語(Laganaro amp; Alario, 2006; Perret et al., 2014)、荷蘭語(Cholin et al., 2006; Cholin amp; Levelt, 2009; den Hollander et al., 2019; Levelt amp; Wheeldon, 1994)、西班牙語(Carreiras amp; Perea, 2004; Onochie-Quintanilla et al., 2019; Perea amp; Carreiras, 1998)和德語(Conrad et al., 2006; Hutzler et al., 2005)等印歐語系語言中得到了重復驗證。
3.1" 音節頻率效應的表現形式和發生階段
目前, 考察印歐語系言語產生過程的大多數研究發現了音節實例頻率的促進效應(例如Bürki et al., 2015; Carreiras amp; Perea, 2004; Cholin et al., 2011; Conrad et al., 2006; Croot et al., 2017; Laganaro amp; Alario, 2006; Perea amp; Carreiras, 1998), 但也有少數研究報告了實例頻率的抑制效應(Carreiras" et al., 1993; Conrad et al., 2006; Farrell amp; Abrams, 2014; Hutzler et al., 2005)或無任何效應(Hutzler" et al., 2005; Stenneken et al., 2007)。音節頻率對言語產生過程不同方向的影響可能源于其對言語產生過程的兩個加工階段產生了不同的影響(Conrad et al., 2006; Hutzler et al., 2005; Perea amp; Carreiras, 1998):在詞匯通達中的詞匯選擇階段, 高音節頻率詞由于擁有更多的音節鄰近項, 能夠激活更大的初始候選詞群, 且該詞群更有可能包含高頻詞, 這些激活的詞匯節點之間相互競爭并干擾目標詞的通達, 故表現為抑制效應; 而在語音編碼階段, 講話者從心理音節表(mental syllabary)中提取音節的發音運動程序。心理音節表是一個音節存儲庫, 包括抽象的音韻音節(phonological syllable)和語境相關的語音音節(phonetic syllable), 后者即音節的發音運動程序。在語音編碼階段, 音韻音節作為心理音節表的輸入信號, 映射到其中存儲的發音運動程序, 激活的發音運動程序將會從心理音節表中輸出, 進一步傳輸到發音系統以完成發音(Bürki et al., 2015; Cholin, 2008; Levelt, 1993; Levelt amp; Wheeldon, 1994)。由于高頻音節的發音運動程序能夠更快地從心理音節表中提取出來, 使講話者在構建高音節頻率詞的語音輸出時更加容易, 故表現為促進效應(見圖1a)。研究者通過讓被試出聲重復聽到的單詞, 發現音位配列概率(probabilistic phonotactics, 即音段和音段序列的頻率)促進了亞詞匯水平的加工, 而相似性鄰域密度(similarity-neighborhood density, 即音韻鄰近項累計詞頻)產生了抑制效應, 這可能是由詞匯水平上音韻鄰近項(即由一個音素替換、添加或刪除得到的詞)之間競爭導致的(Vitevitch amp; Luce, 1998; 1999)。因此, 在言語產生過程中與音韻信息相關的效應中, 促進效應可能反映了詞匯和亞詞匯水平上由音韻表征本身特性導致的加工優勢, 而抑制效應則源于詞匯水平上激活詞條之間的競爭。
研究者在詞匯判斷任務中通常觀察到音節頻率的抑制效應(實例頻率:Carreiras et al., 1993; Conrad et al., 2006, 2007, 2008; Conrad amp; Jacobs, 2004; 類型頻率:álvarez et al., 2001), 在假詞命名任務中則通常觀察到音節頻率的促進效應(實例頻率:Carreiras amp; Perea, 2004; Cholin et al., 2006, 2011; Conrad et al., 2006; Croot et al., 2017), 為口語詞匯產生中音節頻率的抑制效應和促進效應分別發生在詞匯選擇和詞匯選擇后的加工階段(包括音韻編碼和語音編碼)提供了支持證據。詞匯判斷任務要求人們判斷刺激是真詞還是假詞, 所涉及的加工過程并不包含語音輸出階段, 音節頻率主要在詞匯選擇階段起抑制作用。與低頻音節相比, 高音節頻率的音節鄰近項會產生較強的激活, 與目標詞之間形成競爭, 干擾了目標詞的真假詞判斷, 出現了音節頻率的抑制效應; 而假詞命名任務涉及的加工過程則不包含詞匯選擇階段, 因此音節頻率主要在音韻編碼、語音編碼階段起作用, 高頻音節相對于低頻音節有提取優勢, 產生了促進作用。Hutzler等人(2005)在真詞命名任務中并未觀察到音節頻率效應, 他們認為沒有發現音節頻率效應可能是由于音節頻率對詞匯選擇的抑制作用和對語音輸出的促進作用具有相等大小的強度, 在反應時的結果上產生了相互抵消。在言語產生過程中, 高低頻音節對詞匯選擇的抑制作用和對語音輸出的促進作用之間的相互權衡共同決定了音節頻率效應的具體表現形式。
根據口語詞匯產生過程的WEAVER++模型, 在音韻編碼階段講話者首先提取音段和節律信息, 然后通過音節化過程構建音節結構, 并在語音編碼階段進一步提取音節的發音運動程序(Levelt" et al., 1999)。對于音節頻率所表現出來的促進效應, 已有研究對其發生在音韻編碼還是語音編碼階段存在爭論。研究者主要采用了兩種研究思路:一種研究思路是基于相加因素法(additive-factor method, Sternberg, 1969), 檢驗音節頻率與其他語言因素的效應之間是否存在交互作用。Cholin和Levelt (2009)采用內隱啟動范式觀察到荷蘭語音節準備效應和音節頻率效應之間存在交互作用。由于音節準備效應包含了單詞形式編碼的所有加工階段(即詞素音位編碼、音韻編碼和語音編碼), 根據相加因素法的原理, 兩個因素之間存在交互作用表明二者可能作用于序列加工過程中相同的階段, 因此研究者認為該結果表明心理音節表可能位于整詞通達之后的語音編碼階段。第二種研究思路是采用包含不同口語詞匯產生階段的任務, 通過比較包含不同階段的任務間音節頻率效應是否出現推斷其發生階段。Laganaro和Alario (2006)采用即時命名任務、延時命名任務以及有發音抑制的延時命名任務來考察法語口語詞匯產生中音節頻率效應的發生階段。在三種任務中, 即時命名任務包含從概念化到發音的全部言語產生過程; 延時命名任務并不要求被試在看到圖片后立刻命名, 而是只有當屏幕上出現提示符時才開始出聲命名, 在發音前被試已經完成了對目標詞的音韻編碼和語音編碼, 當提示線索出現時執行已經準備好的發音運動程序即可, 因此該任務的命名潛伏期僅反映了發音階段的加工; 有發音抑制的延時命名任務則要求被試在圖片出現后一直出聲重復某個特定語音(例如/da/), 當看到提示符時立即停止并完成圖片命名。由于重復發音將占用講話者的發音環路(articulatory loop, Baddeley et al., 1984)并阻斷對目標詞的語音編碼, 因此提示符出現后所測量的命名潛伏期反映了語音編碼和發音兩個階段的加工。研究者在即時命名任務以及有發音抑制的延時命名任務中均觀察到了音節頻率效應, 而在延時命名任務中未觀察到。即時命名和有發音抑制的延時命名任務中均包括語音編碼過程, 而延時命名任務中未包括, 任務之間的對比結果表明音節頻率效應發生在語音編碼階段。然而, Croot等人(2017)采用類似的實驗設計來考察英語口語詞匯產生時, 僅在即時命名任務中發現了音節頻率效應。根據上述實驗任務間的對比, 該結果表明音節頻率效應并不發生在語音編碼和發音階段, 而是可能發生在音韻編碼階段。Croot等(2017)指出音節頻率效應也有可能出現在語音編碼階段, 只是效應比較微弱而未能在有發音抑制的延時命名任務中檢測到。
高時間分辨率的技術能夠精細地考察到音節頻率效應發生的時間進程。Bürki等人(2015)利用事件相關電位技術發現, 法語高頻音節和新異音節(音節頻率為0)之間誘發的波幅差異出現在發音前的180~160 ms以及115~100 ms。口語詞匯產生過程中與該時間窗相對應的加工階段是語音編碼(Indefrey, 2011; Laganaro et al., 2013), 腦電研究的發現表明音節頻率效應發生在語音編碼階段。綜上所述, 多數研究證據支持印歐語系中的音節頻率效應發生在語音編碼階段, 但目前也并不能排除音節頻率效應發生在音韻編碼階段的可能性。音節頻率的促進效應可能出現在音韻編碼或(和)語音編碼階段, 盡管英語和法語同屬于印歐語系, 然而其語言系統中詞匯和音韻之間的關系也存在差異, 跨語言之間的差異可能會影響口語詞匯產生中音節頻率效應的認知機制。
除此之外, 研究者也關注了音節的位置特征對印歐語系言語產生中音節頻率效應的影響。對于雙音節詞和多音節詞, 音節的位置頻率(positional frequency)是指音節在單詞中的特定位置上所出現的次數(以詞頻加權, Carreiras amp; Perea, 2004; Perea amp; Carreiras, 1998), 或同一位置上包含該音節的所有單詞的累計詞頻(Farrell amp; Abrams, 2014; Hutzler et al., 2005)。研究發現排除雙音節詞重音分配模式的潛在影響后, 音節的位置會影響音節頻率效應的有無, 但已有研究結果仍存在爭議。Levelt和Wheeldon (1994)在荷蘭語雙音節真詞的命名中僅觀察到了第二音節的頻率效應, 研究者認為只有當單詞中全部音節都完成語音編碼后才會輸出發音, 因此先提取出的高頻首音節在加工速度上的優勢變得不明顯。然而也有研究在西班牙語(Carreiras amp; Perea, 2004)和荷蘭語(Cholin et al., 2006)的雙音節假詞命名中僅觀察到了首音節頻率效應, 表明當首音節的語音編碼完成后就可以立刻開始發音, 即對首音節進行發音輸出的同時檢索提取第二音節, 因此在快速的命名任務中第二音節對頻率操縱不敏感。Cholin等人(2011)提出上述研究之間講話者采取不同語音檢索策略的原因可能在于實驗材料的詞匯性。在真詞口語產生中, 人們會在整個單詞完成語音編碼后才開始發音以正確地傳達單詞意義, 而對于假詞沒有傳達意義的要求, 人們只需要發音即可。也有針對英語雙音節詞命名的研究同時發現了首音節和第二音節的頻率效應(假詞命名:Cholin et al., 2011; 真詞命名:Macizo amp; Van Petten, 2007), 反映了英語母語者在語音編碼和發音的界面上可能具有更大的計劃廣度。Cholin等(2011)提出音節邊界的清晰性會影響不同語言的發音計劃廣度:與英語相比, 荷蘭語和西班牙語的音節邊界相對清晰, 講話者能夠較早地檢測到音節邊界, 音節化過程以及通達心理音節表的速度也較快。在快速命名任務中, 荷蘭語和西班牙語的講話者傾向于采用音節大小的發音計劃廣度, 而英語中音節邊界相對模糊, 檢測到音節邊界較為困難, 講話者傾向于采用跨音節邊界的、多音節的發音計劃廣度。多音節詞匯產生中不同位置上的音節是否表現出頻率效應, 不僅與講話者在命名真詞和假詞時依賴不同的語音檢索策略有關, 而且與發音計劃廣度的跨語言差異有關。
3.2" 音節頻率促進效應的認知機制:理論觀點
研究者對于口語產生中音節頻率促進效應的發生機制存在爭論, 提出了心理音節表理論(mental syllabary theory, Levelt, 1993)、混合模型(mixed model, Levelt amp; Wheeldon, 1994)和雙通路模型(dual-route model, Varley amp; Whiteside, 2001; Whiteside amp; Varley, 1998)。
Levelt (1993)提出了心理音節表理論(mental syllabary theory)來解釋字母語言口語詞匯產生中的音節頻率促進效應。根據該理論, 音節頻率效應源于講話者直接提取心理音節表中存儲的發音運動程序, 由于高頻音節比低頻音節能夠更快地通達心理音節表, 因此個體對高音節頻率詞語的命名更快(Cholin et al., 2006; Cholin amp; Levelt, 2009; Ferrand et al., 1996; Levelt et al., 1999)。心理音節表理論的意義在于提取音節的高效性, 由于大多數音節是多次使用的發音單元, 若每次使用時都重新計算其完整的發音運動程序會非常浪費加工資源(Levelt, 1993), 而通過直接提取存儲在心理音節表中的發音運動程序, 將大大減少言語產生系統的計算負荷并有助于快速流暢地發音(Carreiras amp; Perea, 2004; Cholin, 2008; Hagoort" et al., 1999)。
Levelt和Wheeldon (1994)通過荷蘭語口語詞匯產生中的音節頻率效應驗證了心理音節表理論, 同時他們指出講話者可以正確讀出由不存在的音節組成但音韻結構符合規則的假詞(例如fliltirp)。心理音節表中實際并未存儲這種不存在的音節(即新異音節), 因此講話者無法通達心理音節表來提取其發音運動程序, 對新異音節的加工可能依賴于其他機制。因此他們進一步提出了混合模型(mixed model), 假設在心理音節表中存在直接提取音節和在線計算音節兩種加工方式:新異音節和極低頻音節采取在線計算的方式, 常用的高頻音節則存儲在心理音節表中直接提取(同見Bürki, 2018)。音節頻率促進效應源于直接提取高頻音節的速度快于在線計算低頻音節的速度。Ferrand等人(1996)以法語中的音節數量為例, 指出并非所有音節都存儲在心理音節表中, 語言中潛在的新異音節可能是通過在線即時組裝而來的:法語中實際存在大約6000個音節, 若同時納入其他不符合法語單詞形式規則但仍然遵循法語發音規則的潛在音節(例如/km?lu/)則可能多達33600個, 講話者沒有必要在心理音節表中存儲如此大量的音節, 可以通過類比的方式對符合音韻規則的新異音節產生正確發音。正如在語音習得過程的早期, 所有音節都相當于新異音節, 講話者是在習得過程中依據語言使用經驗才逐步形成從心理音節表中提取音節的加工機制。
語音編碼的雙通路模型(dual-route model, Varley amp; Whiteside, 2001; Whiteside amp; Varley, 1998)同樣認為高頻音節和低頻音節依賴于不同的加工機制:高頻音節通過直接通路從心理音節表中進行提取, 低頻音節通過間接通路在線組裝音段形成(同見Cholin, 2008; Cholin amp; Levelt, 2009; Hagoort et al., 1999; Tremblay et al., 2018)。來自首音段替換錯誤的證據支持了音段在線組裝成音節的觀點:在連續語流中兩個單詞的首音段被交換位置(例如car park被錯誤發音為/pa: ka:k/), 這是由于音段在分配給音節框架對應槽的過程中出現了錯誤, 表明音段可以作為言語組裝過程中的獨立表征單元(Varley amp; Whiteside, 2001)。雙通路模型進一步假設音節的提取與其靜息激活水平(resting activation level)有關, 高頻音節的靜息激活水平較高, 從心理音節表中進行選擇和提取出來的閾值較低(Bürki et al., 2015), 因此直接提取高頻音節要比在線組裝低頻音節更容易。作為對心理音節表理論的補充和發展, 混合模型和雙通路模型同樣預測講話者對高音節頻率詞的命名快于低頻音節, 表現為促進效應, 但促進效應出現的認知機制是不同的。
3.3" 音節頻率效應的神經機制
近年來, 神經影像學研究利用多種成像技術考察了印歐語系中音節頻率效應的神經機制。基于混合模型和雙通路模型的觀點, 高頻音節和低頻音節的發音運動程序與不同的認知加工機制相關聯, 因此在產生不同頻率的音節時, 大腦的激活模式可能不同。Hagoort等人(1999)利用PET技術考察了德語母語者對真詞(包含更多高頻音節)和假詞(包含更多低頻音節)的默讀和出聲朗讀過程, 由于該研究混淆了刺激的音節頻率和詞匯性, 因此研究者僅推測輔助運動區可能參與了高頻音節通達心理音節表的過程, 而左內側前運動皮層可能參與了低頻音節的在線組裝過程。
已有利用fMRI技術的研究發現, 低頻音節相比于高頻音節能夠引起更加強烈的腦區激活, 而相反方向的對比中則不存在顯著差異, 表明產生低頻音節需要更高的加工成本(Bürki et al., 2015)。例如, Carreiras等人(2006)在西班牙語詞匯朗讀任務中發現, 低音節頻率詞相比于高音節頻率詞顯著激活了左側前腦島, 而高音節頻率詞與低音節頻率詞相比則沒有引起特定腦區的顯著激活, 研究者指出低頻音節引起的激活更強可能與其通達存儲的運動程序的速度更慢有關, 而高頻音節則能夠促進發音運動的計劃過程, 支持了心理音節表理論的觀點。類似地, Papoutsi等人(2009)要求英語母語者聽音節頻率不同的假詞并在6秒的延遲后重復它們, 結果發現低音節頻率詞顯著激活了前運動皮層中的背側中央前回、雙側額下回和輔助運動區, 而高音節頻率條件與低音節頻率條件相比同樣沒有觀察到顯著激活的腦區。然而, 上述研究所發現的高頻音節和低頻音節在腦區激活程度上的差異無法證明二者的加工是由不同腦區控制的, 雖然高頻音節與低頻音節相比沒有誘發特定腦區的激活, 但二者仍可能存在神經網絡上的差異, 只是差異發生的時間窗口太窄, 無法用fMRI等低時間分辨率的成像技術檢測到。進一步地, Bürki等人(2015)采用ERP技術考察了包含高頻、低頻和新異音節的法語假詞命名, 結果顯示在發音開始前的170~100 ms左右, 高頻和低頻/新異音節之間的ERPs波幅和整體地形模式上出現了差異, 而后兩類音節具有相同且穩定的電生理模式, 表明個體在產生高頻音節和低頻/新異音節時依賴不同的神經機制, 而在產生低頻音節和新異音節時依賴相似的神經機制。研究者認為該結果反映了高頻音節的加工優勢可能是源于其發音運動程序存儲在心理音節表中, 而低頻音節的加工機制則類似于新異音節, 其發音運動程序是通過在線組裝的方式生成的, 為音節頻率的雙通路模型提供了支持證據(Bürki et al., 2015)。
4" 漢語中音節頻率效應的認知機制
4.1" 音節在漢語口語詞匯產生中的作用
作為一種聲調語言和非拼音文字, 漢語和字母語言的語言特點存在很大差異。字母語言不僅音節數量眾多(例如荷蘭語和英語中均存在超過12000個音節), 而且存在模糊音節和重新音節化(resyllabification)現象, 即連續語流中前一詞的詞尾輔音可以跨越詞匯邊界與后一詞的詞首元音重新組合成音節(Levelt et al., 1999)。與字母語言不同, 漢語中音節數量很少, 不考慮聲調大約僅有400個, 即使考慮聲調也僅有1200個左右, 且漢語中音節之間界限清晰, 不存在重新音節化的現象(張清芳, 楊玉芳, 2005)。因此, 在音韻編碼階段, 漢語母語者可以直接從心理詞典中提取整個音節(O’ Seaghdha et al., 2010; 蔣宇宸 等, 2020; 張清芳, 王雪嬌, 2020)。
音節在口語詞匯產生中的作用存在跨語言差異。對于印歐語系的語言, 音韻編碼階段首先提取的加工單元是音素(Alario et al., 2007; Damian amp; Bowers, 2003; Damian amp; Dumay, 2007; Jacobs amp; Dell, 2014; Meyer, 1991; Schiller, 2008)。音素(phoneme)是能夠區分意義的最小語音單元, 分為元音和輔音(Clark amp; Yallop, 1995)。根據WEAVER++模型, 講話者隨后通過音節化過程來構建音節(Levelt et al., 1999), 完成語音編碼。在漢語中, 采用內隱啟動范式(Chen et al., 2002)、掩蔽啟動范式(Chen et al., 2016; You et al., 2012)和圖詞干擾范式(岳源, 張清芳, 2015; 張清芳, 楊玉芳, 2005)等, 大量研究發現音節是漢語口語產生過程中的音韻編碼單元。有研究利用ERP技術比較音節效應和音素效應的時間進程, 結果發現漢語口語產生中音節的提取早于音素, 音節在音韻編碼階段發揮作用, 而音素效應主要出現在音韻編碼階段的晚期或語音編碼階段(Cai et al., 2020; Feng et al., 2019; Zhang amp; Damian, 2019; 張清芳, 王雪嬌, 2020); 但也有研究在音韻編碼和語音編碼兩個階段均觀察到了音節效應(Wang et al., 2017)。特別地, 蔣宇宸等人(2020)通過時頻分析發現在音韻編碼階段出現了音節效應而非音素效應的θ頻段能量變化, 從神經振蕩的角度證實了音節是漢語口語產生過程中的音韻編碼單元。近年來, 盡管有研究發現音素在漢語口語產生的音韻編碼階段也會激活(Qu et al., 2012, 2020; Yu et al., 2014), 但目前有關漢語音素加工方面的證據相對較少且存在爭議(屈青青 等, 2018), 已有研究主要證實了音節在漢語音韻編碼中的重要作用。
基于印歐語系和漢語中的不同研究結果, 研究者提出了合適單元假說(proximate units principle, O’ Seaghdha et al., 2010)來闡述言語產生過程中音韻編碼單元的跨語言差異。合適編碼單元(proximate units)是指詞素信息被激活之后最先選擇的音韻加工單元, 印歐語系中的合適編碼單元是音素, 漢語中則是音節。對于印歐語系的語言, 首先提取完音素后需要結合節律框架進行音節化過程, 隨后在語音編碼階段從心理音節表中提取音節的發音運動程序。與此不同的是, 漢語的音韻編碼過程中講話者首先提取音節, 再進一步將音節分解為音段信息(即音素或大于音素而小于音節的音韻組合單元)和超音段信息(即聲調), 然后完成語音編碼和發音過程(見圖2)。Roelofs (2015)通過計算模擬的方法對該假說進行了驗證。
4.2" 音節頻率效應的表現形式和發生階段
已有漢語音節頻率效應的研究主要采用了圖畫口語命名任務, 要求講話者用單字詞(即單音節詞)對圖畫進行命名(例如Zhang amp; Wang, 2014; 楊群, 張清芳, 2015)。大多數研究均觀察到了實例頻率的促進效應(例如Zhang amp; Wang, 2014; 歐陽明昆, 2020; 楊群, 張清芳, 2015), 而忽略了對類型頻率的考察。僅有一項研究(蔣宇宸, 2021)采用圖畫命名和單字命名任務發現, 當同時操縱實例頻率和類型頻率時, 在圖畫命名和單字命名中分別發現了音節頻率的促進效應和抑制效應; 當匹配類型頻率操縱實例頻率時, 圖畫命名中的音節頻率促進效應仍然存在, 但單字命名中未發現任何頻率效應。作為典型的口語詞匯產生任務, 圖畫口語命名中發現的音節頻率促進效應, 效應方向與印歐語系的研究一致, 而且研究進一步發現主要是由于實例頻率的變化引起了音節頻率促進效應。而單字命名任務中不同變量操縱下的效應對比表明音節的類型頻率是引起音節頻率效應的主要因素。單字命名中音節頻率的抑制效應可能源于高音節頻率詞會激活更多的音節鄰近項, 以并行分布加工(parallel distributed processing, Seidenberg amp; McClelland, 1989)的方式相互作用并對目標詞造成干擾, 因此高音節頻率詞的命名潛伏期更長(蔣宇宸, 2021)。此外, 在單字命名任務中, 視覺呈現目標單詞要求被試大聲讀出單詞的任務中既包括了視覺再認單詞過程, 同時包括了口語產生中的音韻編碼、語音編碼和發音過程。單字命名過程中所發現的抑制效應可能是由于視覺詞匯通達階段所產生的抑制效應與音韻編碼和語音編碼過程中所產生的促進效應互相抵消后的結果。這一發現表明音節的類型頻率和實例頻率在漢語口語詞匯產生中起不同作用, 然而目前的研究尚不能清晰地闡述兩者的具體作用。
如前所述, 基于合適單元假說和有關漢語口語產生中音節加工的研究成果, 漢語母語者在音韻編碼過程中提取詞匯的音節信息(Cai et al., 2020; Feng et al., 2019; O’ Seaghdha et al., 2010; Zhang amp; Damian, 2019), 因此漢語中的音節頻率效應很有可能發生在音韻編碼階段。在行為層面上, Zhang和Wang (2014)采用漢語圖畫命名任務并未觀察到詞頻和音節頻率之間的交互作用, 表明這兩個因素獨立影響了命名過程, 與印歐語系中的結果(Levelt amp; Wheeldon, 1994)相一致。而有研究采用圖詞干擾范式觀察到了音節頻率和音韻相關性之間的交互作用(歐陽明昆, 2020; 楊群, 張清芳, 2015), 漢語口語產生過程中由音韻相關性引起的音節促進效應發生在音韻編碼階段(岳源, 張清芳, 2015), 因此該結果表明漢語中的音節頻率效應很有可能也發生在音韻編碼階段。然而, 有研究采取了相同的圖詞干擾范式卻未能成功重復出上述結果, 研究者認為該結果表明漢語口語詞匯產生中的音節頻率效應并不發生在音韻編碼階段, 而是可能發生在語音編碼階段(蔣宇宸, 2021)。在時間進程方面, 楊群(2017)借助ERP技術發現青年人的音節頻率效應主要出現在250~350 ms之間, 根據口語詞匯產生時間進程的元分析結果, 該時間窗對應于音韻編碼過程(Indefrey, 2011; Indefrey amp; Levelt, 2004), 因此該結果進一步證實了漢語音節頻率效應發生在音韻編碼階段。綜上所述, 盡管目前尚不能排除音節頻率也有可能對漢語的語音編碼階段產生影響, 但已有研究成果大多支持漢語音節頻率效應發生在音韻編碼階段(見圖1b), 為音節在漢語口語產生的音韻編碼階段發揮重要作用提供了支持證據。
根據已有研究發現, 我們提出了一個有關漢語口語詞匯產生中音節作用機制的模型(圖1b), 為后續研究提供理論基礎。在詞匯選擇階段, 目標詞與各音節鄰近項形成相互競爭, 與低頻音節相比, 高頻音節的鄰近項激活程度更高, 產生詞匯水平上的抑制效應。在音韻編碼階段, 講話者提取音節進行音韻編碼過程, 高頻音節的提取快于低頻音節, 產生音節頻率促進效應。語音編碼階段講話者針對所選定的目標詞進行發音運動程序上的編碼, 在此過程中必須考慮到音節和聲調的結合。高頻音節對應的發音運動程序由于多次使用其提取也會快于低頻音節, 因而在此階段也有可能產生音節頻率的促進效應。最終完成發音輸出時表現為音節頻率促進效應還是抑制效應, 依賴于各個加工階段所產生的抑制效應和促進效應的大小, 以及各個加工階段之間的關系(獨立的還是交互的)。目前有關漢語音節頻率效應的研究相對較少, 未來還需要借助多個實驗任務和技術, 在行為、電生理和腦機制層面深入考察漢語音節頻率效應的特征和認知機制并進行跨語言比較。
5" 跨語言視角下的音節:總結與展望
音節頻率效應廣泛存在于人類語言認知加工中, 研究者通過圖片命名、詞匯朗讀、假詞命名和圖詞干擾等實驗范式, 從跨語言的視角系統探討了印歐語系和漢語的言語產生過程中音節頻率效應的認知加工機制。音節頻率效應的跨語言差異主要體現在表現形式和發生階段兩個方面。在表現形式上, 印歐語系語言中發現了音節頻率促進效應、抑制效應或無任何效應, 而漢語中則是以音節頻率的促進效應為主。音節頻率效應的方向與所操縱的頻率指標(類型頻率或實例頻率)和任務密切相關。在發生階段上, 盡管目前無論是印歐語系還是漢語的研究對于音節頻率效應的發生階段均存在爭議, 但已有理論和研究證據多數支持印歐語系口語詞匯產生中的音節頻率效應發生在語音編碼階段, 而漢語口語詞匯產生中的音節頻率效應可能發生在音韻編碼和語音編碼階段。音節頻率效應的跨語言差異可能與不同語言系統的固有特性有關, 為音節在字母語言和漢語口語產生過程的不同加工階段發揮作用提供了新的視角。根據合適單元假說, 漢語的音韻編碼單元是音節(Cai et al., 2020; Chen et al., 2002, 2016; Feng et al., 2019; Zhang amp; Damian, 2019; 蔣宇宸 等, 2020; 張清芳, 王雪嬌, 2020), 漢語中音節數量較少, 因此在音韻編碼階段講話者可以直接提取音節, 高頻音節的提取快于低頻音節, 產生音節頻率促進效應, 音節頻率和圖詞干擾范式中的語音相關性之間的交互作用為音節頻率效應發生在音韻編碼階段提供了支持證據(歐陽明昆, 2020; 楊群, 2017; 楊群, 張清芳, 2015)。根據語音編碼階段的特點, 高頻音節在音韻編碼階段提取較快, 其發音運動程序的編碼和提取也會快于低頻音節, 我們認為音節頻率效應也可能發生在語音編碼階段。基于上述研究現狀, 漢語口語詞匯產生中的音節頻率效應亟需系統深入的研究。
具體地可以從以下方面展開深入探索:第一, 有關類型頻率和實例頻率的作用需要進一步研究, 兩類測量指標是否在不同詞匯產生任務中起了不同的作用, 其作用可能也存在跨語言的差異。第二, 音節頻率促進效應的認知機制有待進一步探討。目前關于音節頻率效應的主流觀點認為音節的加工是通過心理音節表起作用的(Laganaro, 2019), 混合模型和雙通路模型進一步發展了心理音節表理論, 對于高頻音節和低頻音節的加工機制持分離的觀點, 但均預測高音節頻率詞的命名潛伏期要短于低音節頻率詞, 因此僅根據以往研究所得到的音節頻率效應無法確定低頻音節是存儲在心理音節表中還是在線組裝而成。目前除了Bürki等人(2015)通過高頻音節和低頻音節的神經電生理模式存在分離而支持了雙通路模型的觀點, 其余還未有研究能夠直接檢驗混合模型和雙通路模型。由于漢語的語音系統特性不同于印歐語系, 其音節頻率效應的機制與印歐語系語言可能完全不同, 需要更為深入系統的探索。第三, 目前有關漢語音節頻率效應的研究相對較少, 已有研究關注的均是漢語單字詞(即單音節詞)的音節頻率效應, 而忽略了對雙音節詞或多音節詞的考察, 因此目前缺乏音節位置影響漢語音節頻率效應的證據; 此外, 考察漢語音節頻率效應發生階段的研究所采用的實驗任務較為單一(均為圖詞干擾范式), 未來還需著重關注不同的言語產生任務所涉及的認知加工過程, 結合更加多元的言語產生實驗范式, 進一步明確漢語音節頻率效應的發生階段和神經機制, 為探討音節在漢語言語產生中的作用以及音節頻率效應認知神經機制的跨語言差異提供更深入的理解。第四, 從音節頻率的視角思考漢語語言習得。由于漢語中存在大量的同音字和近音字, 尤其是對于類型頻率較高的音節來說, 其擁有的大量音節鄰近項使得人們在聽到單一音節時通常難以通達一個確定漢字的語義, 除非依賴語境信息的支持, 因此漢語學習者往往需要在音節水平上整體記憶漢字的音韻形式, 而非像學習字母語言的音韻形式那樣可以依賴拼讀規則。這啟示漢語初學者可以通過書寫或過度學習等策略來幫助區分同音字等易混淆的音節鄰近項, 從而在詞匯選擇過程中逐步降低易混淆音節鄰近項的干擾程度, 實現高音節頻率詞在語音構建上的優勢。
參考文獻
端木三. (2021). 英漢音節分析及數量對比. 語言科學, 20(6), 561?588.
蔣宇宸. (2021). 音節累計詞頻和鄰近項個數影響漢語口語詞匯產生過程的認知機制 (碩士學位論文). 中國人民大學, 北京.
蔣宇宸, 蔡笑, 張清芳. (2020). θ頻段(4~8 Hz)的活動反映了漢語口語產生中音節信息的加工. 心理學報, 52(10), 1199?1211.
歐陽明昆. (2020). 漢語詞匯產生過程中語義和語音提取年老化的認知神經機制 (博士學位論文). 中國人民大學, 北京.
屈青青, 劉維琳, 李興珊. (2018). 漢語言語產生的語音加工單元——基于音位的研究. 心理科學進展, 26(9), 1535? 1544.
史有為. (2019). 帶調音節: 解釋漢語的一個出發點. 華東師范大學學報 (哲學社會科學版), 51(3), 1?17.
楊群. (2017). 漢語口語詞匯產生中詞匯通達過程的認知年老化機制 (博士學位論文). 中國人民大學, 北京.
楊群, 張清芳. (2015). 口語產生中詞頻效應、音節頻率效應和語音促進效應的認知年老化. 心理科學, 38(6), 1303?1310.
岳源, 張清芳. (2015). 漢語口語產生中音節和音段的促進和抑制效應. 心理學報, 47(3), 319?328.
張清芳. (2005). 音節在語言產生中的作用. 心理科學進展, 13(6), 752?759.
張清芳, 王雪嬌. (2020). 漢語口語詞匯產生的音韻編碼單元: 內隱啟動范式的ERP研究. 心理學報, 52(4), 414? 425.
張清芳, 楊玉芳. (2005). 漢語單音節詞匯產生中音韻編碼的單元. 心理科學, 28(2), 374?378.
朱曉農. (2019). 聲調發生的五項前提. 語言科學, 18(6), 561?580.
Alario, F. X., Perre, L., Castel, C., amp; Ziegler, J. C. (2007). The role of orthography in speech production revisited. Cognition, 102(3), 464?475.
álvarez, C. J., Carreiras, M., amp; Taft, M. (2001). Syllables and morphemes: Contrasting frequency effects in Spanish. Journal of Experimental Psychology: Learning, Memory, and Cognition, 27(2), 545?555.
Baddeley, A., Lewis, V., amp; Vallar, G. (1984). Exploring the articulatory loop. The Quarterly Journal of Experimental Psychology Section A, 36(2), 233?252.
Bürki, A. (2018). Variation in the speech signal as a window into the cognitive architecture of language production. Psychonomic Bulletin amp; Review, 25, 1973?2004.
Bürki, A., Cheneval, P. P., amp; Laganaro, M. (2015). Do speakers have access to a mental syllabary? ERP comparison of high frequency and novel syllable production. Brain and Language, 150, 90?102.
Cai, Q., amp; Brysbaert, M. (2010). SUBTLEX-CH: Chinese word and character frequencies based on film subtitles. PLoS ONE, 5(6), Article e10729. https://doi.org/10.1371/ journal.pone.0010729
Cai, X., Yin, Y. L., amp; Zhang, Q. F. (2020). The roles of syllables and phonemes during phonological encoding in Chinese spoken word production: A topographic ERP study. Neuropsychologia, 140, Article 107382. https:// doi.org/10.1016/j.neuropsychologia.2020.107382
Carreiras, M., álvarez, C. J., amp; De Vega, M. (1993). Syllable frequency and visual word recognition in Spanish. Journal of Memory and Language, 32(6), 766?780.
Carreiras, M., Mechelli, A., amp; Price, C. J. (2006). Effect of word and syllable frequency on activation during lexical decision and reading aloud. Human Brain Mapping, 27(12), 963?972.
Carreiras, M., amp; Perea, M. (2004). Naming pseudowords in Spanish: Effects of syllable frequency. Brain and Language, 90(1?3), 393?400.
Chen, J.-Y., Chen, T.-M., amp; Dell, G. S. (2002). Word-form encoding in Mandarin Chinese as assessed by the implicit priming task. Journal of Memory and Language, 46(4), 751?781.
Chen, J.-Y., O’ Seaghdha, P. G., amp; Chen, T.-M. (2016). The primacy of abstract syllables in Chinese word production. Journal of Experimental Psychology: Learning, Memory and Cognition, 42(5), 825?836.
Chetail, F., amp; Mathey, S. (2011). Effect of syllabic neighbourhood as a function of syllabic neighbour length. Psychonomic Bulletin amp; Review, 18(5), 951?957.
Cholin, J. (2008). The mental syllabary in speech production: An integration of different approaches and domains. Aphasiology, 22(11), 1127?1141.
Cholin, J., Dell, G. S., amp; Levelt, W. J. (2011). Planning and articulation in incremental word production: Syllable- frequency effects in English. Journal of Experimental Psychology: Learning, Memory, and Cognition, 37(1), 109?122.
Cholin, J., amp; Levelt, W. J. (2009). Effects of syllable preparation and syllable frequency in speech production: Further evidence for syllabic units at a post-lexical level. Language and Cognitive Processes, 24(5), 662?684.
Cholin, J., Levelt, W. J., amp; Schiller, N. O. (2006). Effects of syllable frequency in speech production. Cognition, 99(2), 205?235.
Clark, J., amp; Yallop, C. (1995). An introduction to phonetics and phonology (2nd ed.). Oxford: Blackwell.
Conrad, M., Carreiras, M., amp; Jacobs, A. M. (2008). Contrasting effects of token and type syllable frequency in lexical decision. Language and Cognitive Processes, 23(2), 296?326.
Conrad, M., Grainger, J., amp; Jacobs, A. M. (2007). Phonology as the source of syllable frequency effects in visual word recognition: Evidence from French. Memory amp; Cognition, 35(5), 974?983.
Conrad, M., amp; Jacobs, A. (2004). Replicating syllable frequency effects in Spanish in German: One more challenge to computational models of visual word recognition. Language and Cognitive Processes, 19(3), 369?390.
Conrad, M., Stenneken, P., amp; Jacobs, A. M. (2006). Associated or dissociated effects of syllable frequency in lexical decision and naming. Psychonomic Bulletin amp; Review, 13(2), 339?345.
Croot, K., Lalas, G., Biedermann, B., Rastle, K., Jones, K., amp; Cholin, J. (2017). Syllable frequency effects in immediate but not delayed syllable naming in English. Language, Cognition and Neuroscience, 32(9), 1119?1132.
Damian, M. F., amp; Bowers, J. S. (2003). Effects of orthography on speech production in a form-preparation paradigm. Journal of Memory and Language, 49(1), 119?132.
Damian, M. F., amp; Dumay, N. (2007). Time pressure and phonological advance planning in spoken production. Journal of Memory and Language, 57(2), 195?209.
den Hollander, J., Jonkers, R., Mari?n, P., amp; Bastiaanse, R. (2019). Identifying the speech production stages in early and late adulthood by using electroencephalography. Frontiers in Human Neuroscience, 13, Article 298. https://doi.org/10.3389/fnhum.2019.00298
Farrell, M. T., amp; Abrams, L. (2014). Picture?word interference reveals inhibitory effects of syllable frequency on lexical selection. Quarterly Journal of Experimental Psychology, 67(3), 525?541.
Feng, C., Yue, Y., amp; Zhang, Q. F. (2019). Syllables are retrieved before segments in the spoken production of Mandarin Chinese: An ERP Study. Scientific Reports, 9(1), Article 11773. https://doi.org/10.1038/s41598-019-48033-3
Ferrand, L., Segui, J., amp; Grainger, J. (1996). Masked priming of word and picture naming: The role of syllabic units. Journal of Memory and Language, 35(5), 708?723.
Hagoort, P., Indefrey, P., Brown, C., Herzog, H., Steinmetz, H., amp; Seitz, R. J. (1999). The neural circuitry involved in the reading of German words and pseudowords: A PET study. Journal of Cognitive Neuroscience, 11(4), 383?398.
Hutzler, F., Conrad, M., amp; Jacobs, A. M. (2005). Effects of syllable-frequency in lexical decision and naming: An eye-movement study. Brain and Language, 92(2), 138?152.
Indefrey, P. (2011). The spatial and temporal signatures of word production components: A critical update. Frontiers in Psychology, 2, Article 255. https://doi.org/10.3389/ fpsyg.2011.00255
Indefrey, P. amp; Levelt, W. J. M. (2004). The spatial and temporal signatures of word production components. Cognition, 92, 101?144.
Jacobs, C. L., amp; Dell, G. S. (2014). ‘Hotdog’, not ‘Hot’ ‘dog’: The phonological planning of compound words. Language, Cognition and Neuroscience, 29(4), 512?523.
Kwon, Y. (2014). The syllable type and token frequency effect in naming task. Korean Journal of Cognitive Science, 25(2), 91?107.
Laganaro, M. (2019). Phonetic encoding in utterance production: A review of open issues from 1989 to 2018. Language, Cognition and Neuroscience, 34(9), 1193?1201.
Laganaro, M., amp; Alario, F. X. (2006). On the locus of the syllable frequency effect in speech production. Journal of Memory and Language, 55(2), 178?196.
Laganaro, M., Python, G., amp; Toepel, U. (2013). Dynamics of phonological?phonetic encoding in word production: Evidence from diverging ERPs between stroke patients and controls. Brain and Language, 126(2), 123?132.
Levelt, W. J. M. (1993). Timing in speech production with special reference to word form encoding. Annals of the New York Academy of Sciences, 682, 283?295.
Levelt, W. J. M., Roelofs, A., amp; Meyer, A. S. (1999). A theory of lexical access in speech production. Behavioral and Brain Sciences, 22, 1?38.
Levelt, W. J. M., amp; Wheeldon, L. (1994). Do speakers have access to a mental syllabary? Cognition, 50(1?3), 239?269.
Macizo, P., amp; Van Petten, C. (2007). Syllable frequency in lexical decision and naming of English words. Reading and Writing, 20(4), 295?331.
Meyer, A. S. (1991). The time course of phonological encoding in language production: Phonological encoding inside a syllable. Journal of Memory and Language, 30(1), 69?89.
Miguel-Abella, R. S., Pérez-Sánchez, M. á., Cuetos, F., Marín, J., amp; González-Nosti, M. (2022). SpaVerb-WN—A megastudy of naming times for 4562 Spanish verbs: Effects of psycholinguistic and motor content variables. Behavior Research Methods, 54(6), 2640?2664.
Onochie-Quintanilla, E., Defior, S. A., amp; Simpson, I. C. (2019). RAN and orthographic processing: What can syllable frequency tell us about this relationship?. Journal of Experimental Child Psychology, 182, 1?17.
O’ Seaghdha, P. G., Chen, J. Y., amp; Chen, T. M. (2010). Proximate units in word production: Phonological encoding begins with syllables in Mandarin Chinese but with segments in English. Cognition, 115(2), 282?302.
Papoutsi, M., de Zwart, J. A., Jansma, J. M., Pickering, M. J., Bednar, J. A., amp; Horwitz, B. (2009). From phonemes to articulatory codes: An fMRI study of the role of Broca's area in speech production. Cerebral Cortex, 19(9), 2156? 2165.
Perea, M., amp; Carreiras, M. (1998). Effects of syllable frequency and syllable neighborhood frequency in visual word recognition. Journal of Experimental Psychology: Human Perception and Performance, 24(1), 134?144.
Perret, C., Schneider, L., Dayer, G., amp; Laganaro, M. (2014). Convergences and divergences between neurolinguistic and psycholinguistic data in the study of phonological and phonetic encoding: A parallel investigation of syllable frequency effects in brain-damaged and healthy speakers. Language, Cognition and Neuroscience, 29(6), 714?727.
Qu, Q. Q., Damian, M. F., amp; Kazanina, N. (2012). Sound- sized segments are significant for Mandarin speakers. Proceedings of the National Academy of Sciences of the United States of America, 109, 14265?14270.
Qu, Q. Q., Feng, C., Hou, F. Y., amp; Damian, M. F. (2020). Syllables and phonemes as planning units in Mandarin Chinese spoken word production: Evidence from ERPs. Neuropsychologia, 146, Article 107559. https://doi.org/ 10.1016/j.neuropsychologia.2020.107559
Roelofs, A. (2015). Modeling of phonological encoding in spoken word production: From Germanic languages to Mandarin Chinese and Japanese. Japanese Psychological Research, 57(1), 22?37.
Schiller, N. O. (2008). The masked onset priming effect in picture naming. Cognition, 106(2), 952?962.
Seidenberg, M. S., amp; McClelland, J. L. (1989). A distributed, developmental model of word recognition and naming. Psychological Review, 96(4), 523?568.
Stenneken, P., Conrad, M., amp; Jacobs, A. M. (2007). Processing of syllables in production and recognition tasks. Journal of Psycholinguistic Research, 36(1), 65?78.
Sternberg, S. (1969). The discovery of processing stages: Extensions of Donders' method. Acta Psychologica, 30, 276?315.
Tremblay, P., Deschamps, I., Bédard, P., Tessier, M. H., Carrier, M., amp; Thibeault, M. (2018). Aging of speech production, from articulatory accuracy to motor timing. Psychology and Aging, 33(7), 1022?1034.
Varley, R., amp; Whiteside, S. P. (2001). What is the underlying impairment in acquired apraxia of speech?. Aphasiology, 15(1), 39?49.
Vitevitch, M. S., amp; Luce, P. A. (1998). When words compete: Levels of processing in perception of spoken words. Psychological Science, 9(4), 325?329.
Vitevitch, M. S., amp; Luce, P. A. (1999). Probabilistic phonotactics and neighborhood activation in spoken word recognition. Journal of Memory and Language, 40(3), 374?408.
Wang, J., Wong, W. K., Wang, S., amp; Chen, H. C. (2017). Primary phonological planning units in spoken word production are language-specific: Evidence from an ERP study. Scientific Reports, 7(1), 5815?5822.
Whiteside, S. P., amp; Varley, R. A. (1998). A reconceptualisation of apraxia of speech: A synthesis of evidence. Cortex, 34(2), 221?231.
You, W. P., Zhang Q. F., amp; Verdonschot, R. G. (2012). Masked syllable priming effects in word and picture naming in Chinese. PLoS ONE, 7(10), Article e46595. https://doi.org/10.1371/journal.pone.0046595
Yu, M. X., Mo, C., amp; Mo, L. (2014). The role of phoneme in Mandarin Chinese production: Evidence from ERPs. PLoS ONE, 9(9), Article e106486. https://doi.org/10.1371/ journal.pone.0106486
Zhang, Q. F., amp; Damian, M. F. (2019). Syllables constitute proximate units for Mandarin speakers: Electrophysiological evidence from a masked priming task. Psychophysiology, 56(4), Article e13317. https://doi.org/10.1111/psyp.13317
Zhang, Q. F., amp; Wang, C. (2014). Syllable frequency and word frequency effects in spoken and written word production in a non-alphabetic script. Frontiers in Psychology, 5, Article 120. https://doi.org/10.3389/fpsyg.2014.00120
Abstract: In speech production, the syllable frequency effect refers to the processing advantage of high frequency syllables over low frequency syllables. Features and theories of the syllable frequency effect in speech production of Chinese and Indo-European languages are summarized, and the cross-language differences of the syllable frequency effect are discussed from the perspectives of its main contributors, processing stages, and neural mechanisms. Based on the speech production model and proximate units principle, as well as considering the inherent properties of different languages, we analyse the potential causes for the cross-language differences in syllable frequency effects and propose a model to clarify the mechanism of syllable processing in Chinese speech production, which provides a new perspective on different roles of syllables in speech production of Chinese or alphabetic languages. Future studies should distinguish the effects of token syllable frequency and type syllable frequency, and focus on Chinese syllable frequency effects through a variety of techniques and paradigms, to further explore the cognitive mechanism and cross-language differences of syllable processing in spoken word production.
Keywords: speech production, syllable frequency effect, cross-language, mental syllabary, syllabic neighbours