





摘 要:本研究結合語義流暢任務和復雜網絡分析,探索晚期漢英雙語者的雙語詞庫結構,通過構建詞匯關聯網絡、計算網絡參數(網絡節點數、邊數、平均度、平均聚類系數、平均最短路徑、小世界屬性參數和模塊化參數)和生成網絡可視化圖,考察詞庫結構的特征與差異。結果發現:①雙語詞庫具有小世界屬性和模塊化屬性;② L1 詞匯網絡比L2 詞匯網絡結構更為優化,這與被試的L2 使用頻次和習得年齡相關;③詞匯網絡節點的組織方式在一定程度上支持激活擴散模型。本文據此為中國英語詞匯教學提出相關建議:順應學習者心理詞庫結構的發展趨勢,采用L2 詞匯與圖片或實物直接相連的教學方法,以促進L2 詞庫結構的動態發展。
關鍵詞:復雜網絡分析;語義流暢任務;心理詞庫;晚期漢英雙語者;雙語詞庫
[中圖分類號]H04/H3 DOI:10.12002/j.bisu.504
[文獻標識碼]A [文章編號]1003-6539(2024)01-0142-19
引言
語言系統是一種復雜的網絡結構,采用復雜網絡分析來研究語言現象可使語言研究更為精實(陳芯瑩、劉海濤,2011;劉海濤,2011;Chen amp; Zhou,2022)。復雜網絡分析是一種跨學科研究方法(陳芯瑩,2015),研究者基于真實語料考察語言系統的網絡特征,從而增進對語言結構的了解(劉海濤,2011)。在國外,運用復雜網絡分析探究語言現象的研究已經相當豐富,涉及語音學(如Vitevitch,2008)、語義學(如Steyvers amp; Tenenbaum,2005)和句法學(如Ferrer-i-Cancho et al.,2004)等領域。國內的復雜網絡分析在語言研究中的應用還主要停留在句法層面(高松等,2010;劉海濤,2010;陳芯瑩、劉海濤,2011),涉及其他層面的研究仍不多見;相關研究主要以語料庫文本為研究數據,因此只能探究語言表面結構,而不能探索語言背后的心理機制。若能以心理學范式為復雜網絡分析提供數據來源,將會提升復雜網絡分析在語言研究中的豐富度。
心理詞庫被喻為網絡系統(Castro amp; Siew,2020),在復雜網絡技術發展起來后, 許多研究( 如Wilks amp; Meara,2002;Steyvers amp; Tenenbaum,2005;Vitevitch,2008;Borodkin et al.,2016)都結合該研究手段和相應的心理學范式(如語義流暢任務)探究詞庫的結構特征。本研究也沿用該思路,通過語義流暢任務收集被試的詞匯產出,并借助復雜網絡分析進行數據統計,嘗試將網絡科學運用在實證數據的統計中,由此探究晚期漢英雙語者雙語詞庫的結構特征及結構差異,以期能為外語詞匯教學提供些許啟示。
一、研究背景
心理詞庫常被認為是以詞匯為節點、以詞匯間的關聯程度為邊線的網絡系統(Castro amp; Siew,2020)。基于此,Collins amp; Loftus(1975)提出了激活擴散模型,認為節點間根據詞匯間的語義關聯程度相互聯結。然而,Bock amp; Levelt(1994)認為,詞匯節點并不只以語義相似度進行聯結,還會以語音和句法 - 詞匯形態層面的相似度進行擴散式的聯結分布。雙語詞庫結構領域的研究者在此基礎上討論了兩種語言詞匯網絡結構的異同(熊永紅等,2011;孫繼平、孫秀麗,2014;徐歌,2016)。
雙語詞庫結構表征較為復雜,研究者難以用精準的儀器進行測量,因此,語義流暢任務常被應用于雙語詞庫結構的探索(Antón-Méndez amp; Gollan,2010)。語義流暢任務要求被試在有限的時間內就某個語義類別多而快地產出詞匯,然后主試按照聚類和轉化兩個維度對詞匯產出進行歸類和數據分析,這種分析方式使得該任務成為探究雙語詞庫結構的一扇窗戶(Roberts amp; Le Dorze,1997;Rosselli et al.,2002)。然而,該統計方式容易受到主試主觀因素的影響,導致結果的客觀性受到質疑。為彌補此不足,相關領域的研究(如Wilks amp;Meara,2002;Kenett et al.,2011;Borodkin et al.,2016)多使用復雜網絡分析來替代傳統分析方式,這是因為:其一,復雜網絡分析與傳統分析方式得出的結果相似(Borodkin et al.,2016);其二,復雜網絡分析囊括了數學和統計物理學的多種算法,統計過程不涉及人工分析帶來的偏差,從而使結果更為可靠。
復雜網絡分析是一種基于圖論的研究方法,它可以為認知結構(如詞匯網絡)的模擬提供多種縝密算法(Siew et al.,2019)。復雜網絡分析將系統視為網絡結構,網絡內的節點為獨立個體,邊線長短代表節點間關系的疏密程度。通過該研究方法,研究者可以從微觀、中觀和宏觀3 個層面探索系統的結構特征(Siew et al.,2019)。
在微觀層面,研究者可以通過網絡可視化圖呈現的節點組織方式來考察網絡的微觀特征。
在中觀層面,研究者可以通過模塊化參數(Newman,2006)對節點的聚類分布和聚類程度進行考察。模塊化參數主要觀察網絡可被分為多個子網絡的程度,當網絡的模塊化參數大于0.3 時,意味著網絡具有模塊化屬性(Newman,2006;Chen et al.,2018)。具有模塊化屬性的網絡更傾向聚類成不同的子網絡,進而實現子網絡間的協調配合。模塊化參數越大,意味著網絡的模塊化程度越高,網絡就越傾向聚類為多個子網絡,從而實現節點間更大程度的分工合作。
在宏觀層面,研究者可以通過網絡參數觀察整體結構特征。例如,可以由網絡節點數和邊線數來觀察網絡的規模大小,也可以由平均度觀察節點互為聯結的緊密程度。平均度指網絡中節點平均聯結的度量,度表示一個節點與其他節點之間的聯結數,而平均度則是所有節點的度的平均值(陳芯瑩,2015)。平均度越高,節點間的聯結就越緊密。此外,研究者還可以通過對比實證網絡 和隨機網絡的平均聚類系數和平均最短路徑來觀察該系統是否具有小世界屬性(Watts amp;Strogatz,1998)。相較于隨機網絡,具有小世界屬性的網絡平均聚類系數更高、平均最短路徑數值更小(Watts amp; Strogatz,1998;Hills et al.,2010;Siew et al.,2019),這種網絡內的節點聯結緊密,節點間的信息可以高效地聯結通達,是一種較為優化的結構(Bullmore amp; Sporns,2012;Siew et al.,2019)。平均聚類系數是指網絡內隨意的兩個節點互為相鄰的概率,平均最短路徑是指網絡內隨意的兩個節點間最短路徑的平均值(Siew et al.,2019)。此外,本研究還通過補充小世界參數(Humphries amp; Gurney,2008)來考察實證網絡的小世界屬性。小世界參數是指平均聚類系數和平均最短路徑的均衡值,當數值大于1 時,表示網絡具有小世界屬性(Humphries amp; Gurney,2008;Borodkin et al.,2016)。
目前,復雜網絡分析在心理詞庫研究中的應用集中于對單語者詞庫的探索,如語音網絡(Vitevitch,2008;Kello amp; Beltz,2009;Arbesman et al.,2010)、語義網絡(Steyvers amp; Tenenbaum,2005)、正字法網絡(Kello amp; Beltz,2009;Siew"et al.,2019)等,僅有少數研究(Wilks amp; Meara,2002;Borodkin et al.,2016)將其運用到對雙語詞庫的探究上。這些研究發現,單語者和雙語者詞庫均具有小世界屬性,這表明小世界屬性是心理詞庫結構的共性(Wilks amp; Meara,2002;Steyvers amp; Tenenbaum,2005;De Deyne amp; Storms,2008;Borge-Holthoefer amp;Arenas,2010;Kenett et al.,2011;Borodkin et al.,2016)。此外,Wilks amp; Meara(2002)通過對比雙語詞庫的網絡密度,發現L1(母語)詞庫比L2(第二語言)詞庫節點聯結更為緊密,由此他們認為L1 詞庫結構更為復雜、優化。然而,這項研究僅參考了網絡密度,沒有考察其他網絡屬性,這在一定程度上降低了結果的可靠性(Borodkin et al.,2016)。為了進一步探索雙語詞庫結構,Borodkin etal.(2016)基于Wilks amp; Meara(2002)的研究思路從小世界屬性和模塊化屬性角度觀察雙語詞庫結構,豐富了對網絡屬性的探索,結果發現:相較于L1 詞庫,L2 詞庫模塊化的程度更低,節點間的聯結更為緊密。這表明,L2 詞庫內的節點盡管聯結更為緊密,但由于節點聚類程度較低,語義信息的激活僅局限于某個子網絡而無法實現子網絡間的有效協作,阻礙了語義信息的高效通達,因此相較而言,L1 詞庫更為優化。上述研究(Wilks amp; Meara,2002;Borodkin et al.,2016)雖在節點聯結強度上的結果有所不同,但一致發現L1 詞庫比L2 詞庫結構更為優化。研究者將此結果歸因于雙語者較低的L2 使用頻次和較晚的L2 習得年齡。
然而,現有研究多以雙語均為印歐語系語言的雙語者為研究對象,鮮有研究關注以漢藏語系語言為L1、以印歐語系語言為L2 的雙語者(如漢英雙語者),前者雙語語言距離較近,而后者雙語距離較遠,后者的雙語詞庫是否會呈現出有別于前者的結構特征,我們尚未得知。此外,目前仍鮮有研究從復雜網絡分析的角度探索以漢藏語系語言為L1 的雙語者心理詞庫結構。因此,為了增進對此類雙語者詞庫的了解,本研究以晚期漢英雙語者為研究對象,探索此類雙語者的詞庫結構,并考察語言距離對詞匯網絡結構的影響。在我國,漢英雙語者多在出生后首先習得漢語,六七歲之后(母語成為主導語言后)才開始學習英語,因此他們被稱為晚期雙語者(Fabbro,1999)。
基于前人的發現及本文的研究目的,筆者提出以下研究問題:①晚期漢英雙語者的雙語詞庫結構有何特征?雙語詞庫是否具有小世界屬性?詞庫內節點以何種方式進行聯結?②晚期漢英雙語者雙語詞庫結構有何差異? L1 詞庫是否比L2 詞庫優化?為了解答上述問題,本研究沿用Borodkin et al.(2016)中的研究思路,結合語義流暢任務和復雜網絡分析來探索晚期雙語者詞庫的結構特征和結構差異。研究結果可驗證網絡科學在心理詞庫探究中的有效性,促進對雙語詞庫結構的認識,并根據詞庫特征提出改進二語詞匯教學模式的相關建議。
二、實驗方法
1. 研究思路與實驗設計
本研究的實驗范式是語義流暢任務,即要求被試用不同語言(漢語或英語)在相繼的1 分鐘內產出不同語義類別(“動物”或“蔬菜水果”)下的詞匯。選用這兩個語義類別是因為:其一,它們是語義流暢任務中最常用的語義類別(Acevedo et al.,2000);其二,它們在不同語言文化中有著較高的清晰度和穩定的統一性(Ardila et al.,2006);而蔬菜和水果合二為一是為了避免這兩個類別在植物學定義和日常使用中的歧義(Kavé,2005;Borodkin et al.,2016)。本研究為了避免前1 分鐘語言和語義類別順序對后1 分鐘詞匯結果的影響,對被試詞匯產出的語言類別和語義類別順序進行了拉丁方平衡。
2. 被試
廣東省某高校32 名晚期漢英雙語者(其中包括29 名女生、3 名男生)參與了本次實驗,他們均是英語專業一年級研究生,年齡相近(介于22 — 26 歲之間),都通過了英語專業八級考試,L2 水平較高,能較為熟練地使用漢英兩種語言。
實驗前,被試需完成二語詞匯量測試 VST-A(Nation amp; Beglar,2007),為了避免疲勞效應,筆者將題目按比例隨機減半到70 道小題,統計被試答對的題目數量并乘以200,得出被試最終詞匯量結果。實驗為拉丁方設計,在L2 詞匯產出部分,將被試隨機分為兩組(一組產出“動物”類別的詞匯,另一組產出“蔬菜水果”類別的詞匯),因此,需要對比這兩組被試L2 詞匯量大小,以確定他們L2 詞匯產出的結果是否具有可比性。結果顯示,兩組被試的英文詞匯量大小無顯著差異(t=0.476,p=0.641)。
3. 實驗程序
正式實驗前,主試引導被試完成1 組練習,要求被試在1 分鐘內快而多地用1 種語言(漢語或英語)產出屬于“家具”或“家人”類別的詞。被試在詞匯產出期間不可產出專有名詞,亦不可產出以不同詞素結尾的同一單詞(如復數形式等)。被試在完成練習并經確認熟悉流程后,進入正式實驗。
在正式實驗中,主試引導被試先后用不同語言在1 分鐘內產出屬于“動物”或“蔬菜水果”類別的詞匯。被試的所有詞匯產出均由主試用紙筆以及錄音機記錄,待被試完成任務后,主試當場向被試確認其詞匯產出的情況,以防數據錯漏。
4. 數據處理與統計
實驗結束后,主試將收集到的4 組數據分別整理為英文 - 動物組、英文 - 蔬果組、漢語 - 動物組和漢語 - 蔬果組。排除被試不正確的及重復出現的詞匯后,將其轉成4 組發生矩陣,每組矩陣的第1 行是所有被試產出的詞匯,第1 列是被試的序號,列與行交匯的每個單元格代表該被試詞匯產出的情況,若該被試產出某個單詞,則在該單詞的單元格上標“1”,無則標“0”。隨后使用R 語言軟件(3.5.1 版本)來構建實證網絡和隨機網絡、處理網絡、計算網絡參數并生成網絡可視化圖。
(1)詞匯關聯網絡的構建與網絡的處理
本研究的網絡節點為被試的詞匯產出,邊線權重是詞與詞之間的關聯系數(即產出詞匯a 會連帶產出詞匯b 的概率),關聯系數體現詞與詞之間的相互作用(Kenett et al.,2013;Borodkin et al.,2016),邊線權重的計算采用皮爾遜相關系數算法,將發生矩陣轉化為對應的相關系數矩陣(Kenett et al.,2013)。
轉換后的相關系數矩陣被視為鄰接矩陣,由此構建4 個有權重無向的詞匯關聯網絡(英語 - 動物詞匯網絡、英語 - 蔬果詞匯網絡、漢語 - 動物詞匯網絡和漢語 - 蔬果詞匯網絡)。
然而,詞匯間相關系數值通常較低,這樣會導致網絡局部拓撲關系和結構特征的疏漏。為彌補此缺陷,本研究采用基于層次聚類算法的最小生成樹算法來對網絡進行處理(Kenett et al.,2013)。
(2)網絡參數的計算
本研究計算節點數、邊數、平均聚類系數、平均最短路徑、小世界屬性參數和模塊化參數,詳見表1;并生成網絡整體和局部可視化圖,見下文圖1 —圖4,其中圖1 和圖2 分別為英語動物、蔬菜水果詞匯網絡圖,圖3 和圖4 分別為漢語動物、蔬菜水果詞匯網絡圖。此外,各圖中a 為整體圖,b 為最小生成樹算法處理后的局部圖。
(3)隨機網絡的生成與隨機網絡參數的計算
為了驗證網絡的可靠性, 本研究構建Erd?s-Rényi 隨機網絡(Erd?s amp;Rényi,1960)來證明實證網絡參數與隨機網絡參數在統計上是否存在顯著差異。隨機網絡由與實證網絡相同數量的節點和1 個固定概率(0.5)構建而成,固定概率指隨意的兩個節點互相聯結的概率。本研究對此進行了1000 次隨機模擬,取該1000 個圖的參數均值作為隨機網絡的參數數值,并將隨機網絡與實證網絡的參數進行獨立樣本t 檢驗,以比較兩者的差異性。
三、結果與分析
1. 網絡參數對比分析
詞匯網絡參數數值如表1 所示,4 個詞匯網絡中的聚類系數均大于隨機網絡的相應參數,平均最短路徑也比隨機網絡的小,并且兩者的數值差異不大,小世界屬性參數也大于1,因此,4 個詞匯網絡均具有小世界屬性。
此外,詞匯網絡的模塊化參數大于0.3,表明詞匯網絡均具有模塊化屬性(Chen et al.,2018)。同時,L1 詞匯網絡的模塊化參數大于L2 詞匯網絡(動物詞匯網絡:Q漢語=0.701 > Q英語=0.696;蔬果詞匯網絡:Q漢語=0.713 > Q英語=0.690),這表明L1 詞匯網絡的模塊化程度更高。
另外,由表1 可知,被試L1 詞匯網絡的節點、邊線數量比L2 詞匯網絡的多(動物詞匯網絡:N漢語=45 > N英語=26,E漢語=947 > E英語=293;蔬果詞匯網絡:N漢語=42 > N英語=26,E漢語=836 > E英語=323),這表明L1 詞匯網絡的規模更大。被試L1 詞匯網絡的平均度比L2 詞匯網絡的大(動物詞匯網絡:K漢語=42.098 > K英語=22.538;蔬果詞匯網絡:K漢語=39.810 > K英語=24.846),這表明L1 詞匯網絡內節點相連的緊密程度高于L2 詞匯網絡。
總之,相較于L2 詞匯網絡,雙語者L1 詞匯網絡中節點聯結更為緊密,模塊化程度更高,更傾向聚類為不同的子網絡,這使得詞匯信息的傳遞更為高效,意味著L1 詞匯網絡的結構更為優化。
除了網絡參數,本研究還獲得了網絡可視化圖,以此宏觀地觀察詞匯網絡結構特征。通過對比雙語詞匯網絡的整體圖(圖1a 和圖3a 對比,圖2a 和圖4a對比)可知,雙語者L1 詞匯網絡比L2 詞匯網絡的規模大(節點和邊數更多),節點分布也更為密集。此外,從網絡的局部圖可以看出,節點的組織模式雖分布較為散亂,但在一定程度上以語義、語音及句法 - 詞匯形態層面聚類,該聚類模式將在本文的討論部分進一步加以說明。
2. 網絡驗證
本研究采用Erd?s-Rényi 隨機網絡模擬方法(Erd?s amp; Rényi,1960),驗證實證網絡結果是否為有趨向性的而非隨機產出的網絡數據(Borodkin et al.,2016)。隨機網絡參數數值如表2 所示。由表2 中的數據可知,隨機網絡與實證網絡參數間存在顯著差異(平均聚類系數:t=-28.392,p< 0.001;平均最短路徑:t=23.311,p < 0.001;模塊化參數:t=-87.233,p < 0.001;平均度:t=-2.589,p < 0.05)。
四、討論
本研究采用語義流暢任務和復雜網絡分析來探究晚期漢英雙語者的雙語詞庫結構。對應研究問題,下文將從雙語詞庫的結構特征和結構差異這兩個方面對研究結果進行討論。
1. 晚期漢英雙語者雙語詞庫的結構特征
從宏觀層面的平均聚類系數、平均最短路徑和小世界參數可知,晚期漢英雙語者的雙語詞匯網絡均具有小世界屬性,這意味著漢英詞庫內節點間的聯結程度緊密,節點間的距離較短,詞匯語義信息均能較為高效地聯結通達,表明兩種語言的詞匯網絡均為優化的網絡結構(Siew et al.,2019)。這與已有研究結果相符(Wilks amp; Meara,2002;Borge-Holthoefer amp; Arenas,2010;Kenett etal.,2011;Borodkin et al.,2016),進一步驗證了小世界屬性是心理詞庫結構的共性。同時,該結果也豐富了前人對雙語詞庫研究的發現(Wilks amp; Meara,2002;Borodkin et al.,2016),即對于雙語語言距離較近和語言距離較遠的雙語者而言,雙語詞庫均具有小世界屬性,這表明語言距離并不會對詞庫的小世界屬性產生影響。
從中觀層面的模塊化參數可知,雙語詞庫具有模塊化屬性,這表明晚期漢英雙語者的雙語詞庫均可根據節點間的關聯程度進行聚類分布,從而實現網絡有效的分工協作。
從微觀層面的網絡可視化圖可知,雙語詞匯網絡內的節點主要以語義為線索聚類聯結。例如,在英語 - 動物詞匯網絡(如圖1b)中,節點tiger、crocodile、leopard 和lion 相連,這是因為這4 種動物均為兇猛的食肉類動物,且均為野生動物,因此,被試傾向將四者同時聯想。當被試聯想到這些動物的食肉性質時,便會進而聯想起處于食物鏈較低端的動物chicken;而當被試聯想到這些動物的野生特性時,便會聯想起同屬野生動物類別的kangaroo。又如,在英語 - 蔬果詞匯網絡(如圖2b)中節點cherry、carrot、lichee、tomato 和cucumber 相聯,這是因為前4 種蔬果的表皮均為紅色。而當被試聯想到節點tomato 時,便會激活該節點屬于蔬菜類別的屬性,進而提取出同為常見蔬菜的節點cucumber。漢語詞匯網絡結構也是如此,在漢語 - 動物詞匯網絡中(如圖3b),由于詞匯共享昆蟲類別屬性,節點“蝴蝶”與“蝸牛”相連,節點“蚯蚓”與“蜻蜓”相連。此外,詞匯節點除了以語義為線索相連,還會以語音相似度為線索互為聯結。例如,在漢語 - 動物詞匯網絡(如圖3b)中,由于共享語音“bào(豹)”,節點“海豹”和“獵豹”相連。另外,句法 - 詞匯形態層面信息也會影響節點的聚類模式。例如,在英語 - 動物詞匯網絡(如圖1b)中,由于節點共享首字母p,penguin 和pig 相連。漢語詞匯網絡也是如此(如圖4b),偏旁一致的詞匯節點會互為聚類,如共享偏旁“艸”的“蘋果”會與“蔥”“葡萄”相連。綜上所述,晚期漢英雙語者雙語詞庫內的詞匯節點主要以語義、語音和詞匯形態等因素相互聯結,而激活擴散模型也認為心理詞庫內的詞匯以概念層(語義)、語音層和句法 - 詞匯形態層(詞匯形態或句法特征)為線索互為相連,因此,晚期漢英雙語者雙語詞庫詞匯組織方式支持激活擴散模型的假設。
2. 晚期漢英雙語者雙語詞庫的結構差異
從宏觀層面的網絡參數可知,L1 詞匯網絡節點的聯結更為緊密,表明L1詞庫的復雜度更高,這與Wilks amp; Meara(2002)的結果相符,與Borodkin etal.(2016)的結果不一致。后者研究發現,L2 詞庫內節點的聯結更為緊密。這種結果上的差異可能是由不同實驗被試的L2 使用頻次不同導致的:Borodkin etal.(2016)研究中的被試雖和本研究的被試一樣,均在習得L1 后才開始學習L2,但Borodkin et al.(2016)的被試是在L2 環境下學習和生活的,L2 在日常生活中的使用頻次較高,而本研究的被試是在L1 環境下學習和生活的,僅在特殊場合(如語言課堂)使用L2。這就造成本研究被試的L1 使用頻次遠高于L2,隨著被試與L1 的接觸日益增多,他們詞庫內的L1 詞匯會隨著漢語文化的發展不斷進行概念層面的細分和結構層面的拓展,從而導致L1 詞匯網絡的節點聯結更為緊密。同時,該結果也表明語言使用頻次比語言習得年齡更能對詞匯聯結的緊密程度產生影響。
從中觀層面的模塊化參數可知,L1 詞庫的模塊化程度更高,這與Borodkinet al.(2016)的發現相符,意味著與L2 詞匯網絡相比,L1 詞匯網絡內的節點更傾向聚類成不同的子網絡,由此關聯程度高的節點便會聚類分布,子網絡內的節點可更為高效地傳遞信息,同時也方便單個子網絡與其他子網絡間的信息交流,從而實現子網絡間的分工協作和語義信息的快速通達,更有利于網絡的動態發展。而L2 詞匯網絡的發展則較為滯后,這可能是因為中國英語課堂傾向以L1 作為L2 詞匯教學的主要媒介,從而導致雙語者在L2 習得初期借助L1的詞匯網絡來構建相應的L2 詞匯網絡。但隨著被試L2 水平的提升以及他們對L2 文化的進一步了解,原先在L1 詞匯網絡結構中聚類的節點會作出相應的重組,使得網絡內的節點聚類更符合L2 文化背景下的概念表征。由于本研究中的被試在日常生活中缺乏與L2 的接觸,L2 使用頻次較低,因此,他們的L2 詞匯結構仍處于重組的過程中,網絡內節點會為了概念重組而打破原先網絡中的聚類群落,逐步過渡到與L2 文化因素相吻合的聚類部落,這導致網絡內節點的分布較為零散,模塊化程度較低。此外,L2 詞匯網絡的模塊化程度不如L1詞匯網絡的另一個原因可能是L1 是知識體系構建的主要工具,因此L1 詞匯網絡可以隨著被試知識體系的擴展而不斷發展;而L2 較少參與知識系統的拓展,這導致其發展較為滯后。
從上述網絡參數和微觀層面的可視化圖可以發現,晚期雙語者L1 詞匯網絡的規模更大,節點聯結程度和模塊化程度更高,因此L1 詞庫更為優化,這一結果與Wilks amp; Meara(2002)和Borodkin et al.(2016)的發現一致。Borodkinet al.(2016)將L1 詞庫結構更為優化的結果歸因于語言習得年齡和語言使用頻次,本文也基于這兩個因素對研究結果進行了闡釋。如上文所述,本研究的被試學習L2 的年齡晚于L1,同時使用頻次也低于L1,因此,盡管被試是較為熟練的雙語者,但他們的L2 水平還是遠不如L1 水平;被試L1 詞匯網絡的構建不僅早于L2,而且還得到了更為充足的語言輸入,因而促進了L1 詞匯網絡的動態發展和優化。此外,本文認為,L1 詞匯結構更為優化的結果還可用非選擇性激活假說加以解釋。根據非選擇性激活假說(Kroll amp; Tokowicz,2005),被試在詞匯產出時會自動激活目標語言,因此,在L2 詞匯提取的過程中,L1 詞匯信息同時被激活,而由于被試L2 水平相對薄弱,容易受到L1 激活的干擾,導致被試需要在有限的時間內對L1 進行較大程度的抑制而無法流暢地產出L2詞匯;而在L1 詞匯提取過程中,雖然L2 詞匯信息被激活,但L1 能對其進行有效的抑制(Grosjean amp; Li,2013),因此被試能較好地完成L1 詞匯的產出任務,這導致基于產出性任務數據構建而成的L2 詞匯網絡不如L1 詞匯網絡結構優化。
結語
本研究結合復雜網絡分析和語義流暢任務,對晚期漢英雙語者詞庫的結構進行了探索,結果發現:①雙語詞庫均具有小世界屬性和模塊化屬性;②雙語者L1 詞匯網絡比L2 詞匯網絡的結構更加優化;③雙語詞匯網絡間節點的組織方式支持激活擴散模型假設。
本文研究結果與前人研究結果(Borodkin et al.,2016;Wilks amp; Meara,2002)整體相符。本研究表明雙語者的雙語語言距離并不會對詞庫結構的屬性和差異造成影響,同時也展示了復雜網絡分析在雙語詞庫探究中的穩定性和可行性。
本研究可以為英語詞匯教學提供相應的建議。在詞匯教學過程中,教師可以根據學習者心理詞庫的結構特征來改進教學模式。例如,由于雙語者的詞匯網絡具有小世界屬性,教學者可據此采用復雜網絡分析中的貪心演算法(Borgatti,2006)或者大語言模型(如ChatGPT)(宋飛等,2023),提取學習材料中的詞匯中心節點,讓學習者先掌握中心詞匯,再引導他們順帶習得與中心詞匯在語音和語義層面相聯結的詞匯,幫助學習者高效科學地構建和完善L2詞庫。此外,如上文所述,以L1 翻譯為主的傳統詞匯教學方式可能是導致L2詞匯網絡模塊化程度較低的原因,因此,為了減少L1 對L2 詞庫構建的干擾,教師可以嘗試使用L2 詞匯和圖片或實物直接相聯的教學方法來加強L2 詞匯與概念之間的聯系(吳詩玉等,2017),進而幫助學生提高L2 詞庫的模塊化程度,促進L2 詞庫結構的動態發展。另外,本研究還認為,L2 詞庫的模塊化程度不高的另一個原因可能是因為L2 較少參與知識結構的構建過程,因此,可以增加L2 在知識結構構建過程中的比重。例如,可考慮將EMI 教學模式引入課堂(讓教師使用英語教英語以外的其他科目,如歷史、地理和生物等),有利于完善雙語者L2 詞庫的結構。當然,這些教學建議是否可行,還需要未來的研究結合復雜網絡分析和英語詞匯教學法進一步加以探索。
總之,本研究的結果展示了復雜網絡分析在心理詞庫探究中的可行性,并從結構特征和結構差異層面對晚期漢英雙語者詞庫進行探討,增進了對雙語詞庫結構的了解,也為英語詞匯教學提供了一些建議。但是,本研究作為復雜網絡分析在漢英雙語詞庫研究中的初探,存在以下缺點:第一,本研究的被試數量不多,如若增加被試數量,估計可以提高研究結果的推廣度;第二,沒有考慮以L2 為知識系統構建用語的被試,如香港的漢英雙語者(香港的大學課堂主要以英語為教學用語,L2 是他們知識體系構建的主要工具),對他們而言,L2 詞庫模塊化的程度是否會更高,或者是否會與L1 詞庫模塊化程度相當?這些問題均有待進一步探討;第三,僅以詞與詞之間的關聯系數作為網絡的邊線權重,而心理詞庫是一個非常復雜的系統,詞與詞之間的關聯可能還存在錯綜復雜的關系,因此,未來在構建詞匯網絡時可將詞與詞之間的多重聯系(如句法關系)加以考慮,從而多維度地豐富對詞庫結構的探索。希望本文可以拋磚引玉,吸引更多的研究者使用復雜網絡分析探討雙語詞庫的結構以及二語詞匯習得的發展進程。
參考文獻:
[1] ACEVEDO A,LOEWENSTEIN D A,BARKER W W,et al. Category fluency test:Normative data for English- and Spanish-speaking elderly[J]. Journal of the International Neuropsychological Society,2000(7):760-769.
[2] ANTóN-MéNDEZ I amp; GOLLAN T H. Not just semantics:Strong frequency and weak cognate eff ects on semantic association in bilinguals[J]. Memory amp; Cognition,2010(6):723-739.
[3] ARBESMAN S,STROGATZ S H amp; VITEVITCH M S. The structure of phonological networks across multiple languages[J]. International Journal of Bifurcation and Chaos,2010(3):679-685.
[4] ARDILA A,OSTROSKY-SOLíS F amp; BERNAL B. Cognitive testing toward the future:The example of Semantic Verbal Fluency( ANIMALS)[J]. International Journal of Psychology,2006(5):324-332.
[5] BOCK K amp; LEVELT W. Language production:Grammatical encoding[C]//GERNSBACHER M A. Handbook of Psycholinguistics. San Diego:Academic Press,1994:945-984.
[6] BORGATTI S P. Identifying sets of key players in a social network[J]. Computationalamp; Mathematical Organization Theory,2006(1):21-34.
[7] BORGE-HOLTHOEFER J amp; ARENAS A. Semantic networks:Structure and dynamics[J]. Entropy,2010(5):1264-1302.
[8] BORODKIN K,KENETT Y N,FAUST M,et al. When pumpkin is closer to onion than to squash:The structure of the second language lexicon[J]. Cognition,2016(1):60-70.
[9] BULLMORE E amp; SPORNS O. The economy of brain network organization[J]. Nature Reviews: Neuroscience,2012(5):336-349.
[10] CASTRO N amp; SIEW C S Q. Contributions of modern network science to the cognitive sciences: Revisiting research spirals of representation and process[J]. Proceedings of the Royal Society A: Mathematical,Physical,and Engineering Sciences,2020(6):1-25.
[11] CHEN H,CHEN X amp; LIU H T. How does language change as a lexical network? An investigation based on written Chinese word co-occurrence networks[J]. Plos One,2018(2):1-22.
[12] CHEN Y amp; ZHOU R. The mental lexicon features of the Hakka-Mandarin dialect bilingual[J]. Brain Sciences,2022(12):1-20.
[13] COLLINS A M amp; LOFTUS E F. A spreading-activation theory of semantic processing[J]. Psychological Review,1975(6):407-428.
[14] DE DEYNE S amp; STORMS G. Word associations:Network and semantic properties[J].Behavior Research Methods,2008(1):213-231.
[15] ERD?S P amp; RéNYI A. On the evolution of random graphs[J]. Publication of the Mathematical Institute of the Hungarian Academy of Sciences,1960(1):17-61.
[16] FABBRO F. The Neurolinguistics of Bilingualism: An Introduction[M]. London:Psychology Press/Taylor amp; Francis,1999.
[17] FERRER-I-CANCHO R,SOLé R V amp; K?HLER R. Patterns in syntactic dependency networks[J]. Physical Review E: Statistical, Nonlinear, and Soft Matter Physics,2004(5):1-8.
[18] GROSJEAN F amp; LI P. The Psycholinguistics of Bilingualism[M]. New York:John Wiley amp; Sons,2013.
[19] HILLS T T,MAOUENE J,RIORDAN B,et al. The associative structure of language:Contextual diversity in early word learning[J]. Journal of Memory and Language,2010(3):259-273.
[20] HUMPHRIES M D amp; GURNEY K. Network ‘small-world-ness’:A quantitative method for determining canonical network equivalence[J]. Plos One,2008(4):1-10.
[21] KAVé G. Phonemic fluency,semantic fluency,and difference scores:Normative data for adult Hebrew speakers[J]. Journal of Clinical and Experimental Neuropsychology,2005(6):690-699.
[22] KELLO C T amp; BELTZ B C. Scale-free networks in phonological and orthographic"wordform lexicons[C]//PELLEGRINO F,MARSICO E,CHITORAN I, et al.Approaches to Phonological Complexity. Berlin:Walter de Gruyter Mouton,2009:171-190.
[23] KENETT Y N,KENETT D Y,BEN-JACOB E,et al. Global and local features of semantic networks:Evidence from the Hebrew mental lexicon[J]. Plos One,2011(8):1-14.
[24] KENETT Y N,WECHSLER-KASHI D,KENETT D Y,et al. Semantic organization in children with cochlear implants:Computational analysis of verbal fluency[J].Frontiers in Psychology,2013,4:1-11.
[25] KROLL J F amp; TOKOWICZ N. Models of bilingual representation and processing:Looking back and to the future[C]//KROLL J F amp; DE GROOT A M B. Handbook of Bilingualism:Psycholinguistic Approaches. Oxford:Oxford University Press,2005:531-553.
[26] NATION I S P amp; BEGLAR D. A vocabulary size test[J]. The Language Teacher,2007(7):9-13.
[27] NEWMAN M E J. Modularity and community structure in networks[J]. Proceedings of the National Academy of Sciences of the United States of America,2006(23):8577-8582.
[28] ROBERTS P M amp; LE DORZE G. Semantic organization,strategy use,and productivity in bilingual semantic verbal fl uency[J]. Brain and Language,1997(3):412-449.
[29] ROSSELLI M,ARDILA A,SANTISI M N,et al. Stroop eff ect in Spanish-English bilinguals[J]. Journal of the International Neuropsychological Society,2002(6):819-827.
[30] SIEW C S,WULFF D U,BECKAGE N M,et al. Cognitive network science:A review of research on cognition through the lens of network representations,processes,and dynamics[J/OL]. Complexity,2019:2108423. (2019-1-17)[2019-10-1].https://doi.org/10.1155/2019/2108423.
[31] STEYVERS M amp; TENENBAUM J B. The large-scale structure of semantic networks:Statistical analyses and a model of semantic growth[J].Cognitive Science,2005(1):41-78.
[32] VITEVITCH M S. What can graph theory tell us about word learning and lexical retrieval?[ J]. Journal of Speech,Language,and Hearing Research,2008(2):408-422.
[33] WATTS D J amp; STROGATZ S H. Collective dynamics of ‘small-world’ networks[J]. Nature,1998,393:440-442.
[34] WILKS C amp; MEARA P. Untangling word webs:Graph theory and the notion of density in second language word association networks[J]. Second Language Research,2002(4):303-324.
[35] 陳芯瑩. 從復雜網絡看漢字句法功能的演變[J]. 山西大學學報(哲學社會科學版),2015(2):48-54.
[36] 陳芯瑩,劉海濤. 漢語句法網絡的中心節點研究[J]. 科學通報,2011(10):726-731.
[37] 高松,顏偉,劉海濤. 基于樹庫的現代漢語動詞句法功能的計量研究[J]. 漢語學習,2010(5):105-112.
[38] 劉海濤. 語言復雜網絡的聚類研究[J]. 科學通報,2010(27-28):2667-2674.
[39] 劉海濤. 語言網絡:隱喻,還是利器?[J]. 浙江大學學報(人文社會科學版),2011(2):171-182.
[40] 宋飛,郭佳慧,曲暢. ChatGPT 在漢語作為外語教學中的應用體系及實踐[J].北京第二外國語學院學報,2023(6):110-128.
[41] 孫繼平,孫秀麗. 心理詞庫研究視角下的二語詞匯習得——一項基于詞匯聯想網絡體系的實證研究[J]. 外語研究,2014(1):42-46.
[42] 吳詩玉,馬拯,胡青青. 中國英語學習者詞匯與概念表征發展研究:來自混合效應模型的證據[J]. 外語教學與研究,2017(5):767-779.
[43] 熊永紅,黃元,王云龍. 激活擴散模型與英語詞匯教學中的常規關系建構[J].外語教學,2011(4):61-64.
[44] 徐歌. 基于構建式詞匯聯想的二語心理詞庫組織模式及重組研究[J]. 西安外國語大學學報,2016(1):76-79.