郭 燕,鄧 宇
(四川外國語大學 a.研究生院,b.語言與腦科學中心, 重慶 400031)
詞匯語義學旨在探析詞的意義,其發展路徑與語義學的發展軌跡密不可分,尤其是結構主義語義學、生成語義學和認知語義學。結構主義主要研究詞的內部結構,如直接成分分析法、詞義上下義、同義、反義、詞匯語義場理論等;生成語義學側重詞匯語義的形式化分析以及深層結構與表層結構之間的轉換;認知語義學則關注詞的概念化、范疇化、隱喻轉喻擴展、詞義的認知模型及框架網絡等[1-2]。詞匯語義學一直是當代語言學的重點學科和議題,并受到心理學、人工智能、計算機科學、神經科學等交叉學科的青睞。因此,把握國際詞匯語義學的最新動態和趨勢,厘清其關注的核心議題和前沿,對于當代語言學及其相關的交叉學科來說十分必要。本文借助CiteSpace這一科學計量學方法,對近十年(2008—2018)國際詞匯語義學的研究現狀與趨勢進行了動態計量分析,通過繪制科學知識圖譜,來客觀呈現國際詞匯語義學的最新動態和熱點,以期為國內詞匯語義學未來研究提供參考和建議。
本研究旨在運用CiteSpace對國際詞匯語義學進行動態計量的可視化分析,擬呈現詞匯語義學的地域研究和學科交叉情況,分析該領域高被引作者和文獻,并通過被引文獻的聚類分析探尋其演進發展過程。最后通過共詞分析,從歷時的角度管窺國際詞匯語義學的發展趨勢,以探尋其研究熱點和前沿。
本文借助由陳超美團隊開發的CiteSpace 軟件對國際詞匯語義學研究動態進行圖譜分析。CiteSpace是基于Java語言開發的一款在科學計量學、數據和信息可視化背景下發展起來的信息可視化軟件[3]。該軟件基于共引分析理論和尋徑網絡算法等,對特定學科范疇的文獻進行計量統計和分析,以探尋出特定學科的演變路徑和拐點,具備多元、分時和動態的特征。該軟件可得出作者、機構的合作網絡圖譜,主題、關鍵詞的共現圖譜,文獻、作者、期刊的共被引圖譜等[4]。其繪制的可視化圖譜足以充分地顯示某個學科范圍演變的潛在動力機制和探測學科發展的前沿[5]。本研究采用的是CiteSpace5.3版本。
本文研究數據下載于Web of Science數據庫。首先,分別以“lexical semantics”“sense relation”“lexical relation”“synonymy”“antonymy”“polysemy” 和“cognitive lexical semantics”為檢索詞在Web of Science-SSCI核心合集中進行主題檢索(檢索到19 670 個結果),再設定刊物類別為“linguistics”和“language linguistics”,時間跨度為“2008年至2018年”,剔除重復項,最終本文共確定了1106項有效文獻來進行深度分析。
將這1106 篇文獻的基本信息導入Cite Space5.3,具體操作如下:時間跨度選擇為2008—2018年,1年為切割分區,切成10個分段處理;術語來源(term source)同時勾選標題(title)、摘要(abstract)、作者關鍵詞(author keywords)和關鍵詞(keywords plus);節點類型(node types)分別勾選合作網絡分析中的國家(country),共現網絡分析中的關鍵詞,共被引網絡分析的被引文獻以及被引作者;閾值閥門選擇TOP50;在網絡裁剪功能區(pruning)參數勾選“尋徑網絡算法(pathfinder network)”和“對合并后的網絡進行剪裁(pruning the merged network)的剪裁方法”。將CiteSpace 5.3分析出來的數據結果,主要呈現ClusterView,TimezoneView兩種可視化分析模式,得到各個知識圖譜,再制成可供科學分析的直觀圖表。經過同類歸并,并結合有關文獻進行具體分析。
本文基于CiteSpace提取出國際詞匯語義學2008—2018年發文量前10的國家,繪制為表1(如下)。由表1來看,發文量排名前10的國家的文獻總和為757篇,占全數總文獻量的68.44%。其中北美國家2個、歐洲國家7個、亞洲國家1個。美國在詞匯語義學研究領域最活躍,數量為215篇,約占總數的19.44%,可見美國是國際詞匯語義學研究的學科中心。位列第二的英國發文111篇,占總數的10.04%。中國總文獻量排名第6位,占總發刊文獻量的5.24%。總體來看,母語為英語的國家在詞匯語義學研究領域的發文量占有優勢。

表1 各國/地區(TOP10)發文數量及其中心性(2008—2018)
從中心性強弱程度來看,英國的中心性最高,說明盡管在2008—2018年該國的研究成果僅有美國的一半,但這些成果大部分是具有重要意義的關鍵節點文獻。值得一提的是,中國的發文中心性位居前列,這表明中國學者在詞匯語義學領域的研究成果亦有較大的國際影響力。

圖1 詞匯語義學學科共現圖譜
Category提供學科共現分析功能,用于交叉學科的分析,通過構建學科的關系網絡,以展現各個學科之間的內在聯系。通過可視化分析,在 CiteSpace生成的學科共現知識圖譜中,共展現出23門學科以及61條學科之間的連線(N=23,E=61),學科間的網絡密集度為0.2411(Density=0.2411)。網絡密度表明節點間合作的緊密程度。固定空間內的節點之間的連線越多,網絡密集度便越大[6]。總體上來講,學科合作網絡密集度反映了國際詞匯語義學研究的跨學科性較強,學科間的合作較多,關系較為密切(見圖1)。圖中最大節點的是Linguistics,其次是Language,這兩個學科研究內容與詞匯語義學的研究內容相近,故而詞匯語義學學科的相關研究大多與此兩個學科相關聯。同時,與詞匯語義學結合緊密的學科還有心理學,計算機科學,聽力-言語病理學、教育學、人工智能等。可見詞匯的研究廣涉認知、計算機、教育學、病理學、人工智能化等諸多前沿領域,是一門應用十分廣泛的交叉學科。
1.高被引作者分析
美國德雷克賽大學懷特博士表示,作者共引頻次越高則作者學術相關性越強[7]。在CiteSpace生成的作者共被引科學知識圖譜中,共顯示出 308個作者和728條作者之間的連線(見圖2)。圖中,節點越大,表示該作者在國際詞匯語義學領域越有突出貢獻。從圖中可以看出, 語義學家Lyons,生成語言學家Chomsky、Pustejovsky,系統功能語言學奠基人Halliday,認知語言學家Lakoff、Langacker、Talmy、Croft 、Cruse、Fellbaum等學者從不同語言學視角對詞匯的結構、網絡、功能、認知等層面做了廣泛研究,這些知名學者的引領性研究把詞匯語義學帶入了諸多語言流派,使得詞匯的研究成為語言學的風向標。

圖2 近十年詞匯語義學高被引作者
2.高被引文獻分析
(1)詞匯語義學高影響力文獻
一個研究領域(Specialty)可以被概念化成一個從研究前沿(Research Front)到知識基礎的時變對偶(Time- variant duality)或是時間映射,該研究領域的知識基礎即由原始數據中的被引文獻構成。基于1106項文獻,我們繪制了詞匯語義學研究的文獻共被引知識圖譜,見圖3。如圖 3所示,彩色的節點和節點間連線構成較為宏觀的知識圖譜。節點代表文獻,其大小代表該文獻被引用的總頻次——節點越大,表明其被引頻次越高;節點由代表不同時間分區的年輪呈現,不同顏色表示不同的時間。若節點間連線越粗,說明共被引強度越大,文獻之間的關系越密切[5]。根據引文數據的總被引頻次來看,詞匯語義學的認知轉向頗為顯著。

圖3 國際詞匯語義學研究的文獻共被引知識圖譜
比如,位于圖譜正中間,最顯著的節點——“Croft, W. & Cruse, D. A.(2004).Cognitivelinguistics”是近十年詞匯語義學認知研究中影響力最大的文獻,總計被引23次。該著作從原型范疇理論、ICM、隱喻、轉喻等多個認知視角探究了詞匯語義的認知關系,如多義、同義、上下義、反義和互補等[8]。Croft尤其注重基于用法的研究視角,這對于詞匯語義學的實證研究范式具有推動作用。
又如第二大影響力的文獻,位于第一大節點右下方——“Goldberg, A.(2006).Constructionsatwork:Thenatureofgeneralizationinlanguage”,總計被引15次。構式語法強調形式與功能的互動,詞匯意義與構式意義的連續統關系在詞匯使用和習得之中愈發重要[9]。按照激進構式觀,詞匯亦可視作構式,可見詞匯的構式研究極大拓展了詞匯語義學的研究對象以及研究視角。
詞匯語義學研究第三大影響力的文獻位于前兩大節點中間——“Baayen(2008),AnalyzingLinguisticDataAPracticalIntroductiontoStatisticsUsingR”,總計被引 14 次。該書以詞匯研究為例,重點討論了詞匯語義學研究可能創新的實證方法,如聚類、回歸建模策略、混合效應模型,以及用嵌套和數據集分析所需的模型交叉重復法[10]。該書折射出詞匯研究的定量趨勢,尤其是詞匯研究大數據視角是未來的前沿。
(2)詞匯語義學研究中的轉折點文獻
每個學科研究領域在一定時間范圍內還會出現轉折點文獻,可通過計算文獻的中介中心性(Betweenness Centrality)來辨識。在CiteSpace中,中介中心性是節點在關系網絡圖譜中度量連接作用大小的一個重要的指標,常用此指標來衡量某文獻的重要性,中心性超過0.1的稱為關鍵節點[4]。表2匯總了近十年國際詞匯語義學研究中介中心性前五的文獻。

表2 高中介性的文獻(2008—2018)
首先,中介性最高的也是上述高被引第三的文獻。Baayen利用R語言技術為研究詞匯意義提供了更為科學的方法論,也是詞匯語義學定量轉向的標志。Gries和Stefanowitsch探索詞匯與更大語言單位句法和構式的互動,Gries ST 以語料庫為基礎,量化分析句法和詞匯的關系[11];Stefanowitsch則重點通過新的構式搭配的分析方法來揭示詞匯意義和構式意義的互動關系[12]。Klepousniotou和Tyler 均轉向詞匯語義學多義詞領域的研究[13-14]。Klepousniotou用腦電圖來研究英語中同名詞和多義詞的隱喻和轉喻現象,這是詞匯語義學研究與腦神經科學、心理學相結合的一大科學研究趨勢;且根據學科共現分析,筆者認為這一趨勢會在未來幾十年內成為潛在的新型研究熱點。
(3)詞匯語義學的前沿課題
CiteSpace可根據文獻間的共被引關系通過自動抽取施引文獻的關鍵詞或名詞短語顯示聚類(Cluster)標識,用于歸結研究熱點,每個聚類可以被認定為一個關系較為密切的獨立研究領域[15]。將圖3進行自動聚類運算生成科學知識聚類,然后通過LLR算法,從引用聚類的相關施引文獻中提取關鍵詞,以此表征相對應的知識背景和研究前沿[4]。一般來說,聚類值Modularity Q值>0.3表示劃分出來的社團結構是顯著的;聚類內部相似度指標Silouette S值>0.7表示聚類是高效率令人信服的,可以說明“聚類內節點的主題聯系比較強,結果有參考價值”[15]。通過對聚類的分析,我們可以從歷時的角度對詞匯語義學研究進行梳理,把握該學科的歷史與現狀。

圖4 詞匯語義學文獻共被引聚類知識圖譜
通過CiteSpace軟件,總共生成131個聚類結果,本文著重提取Q值>0.3,S值>0.7的13個聚類如圖(見表3)。詞匯語義學這一研究領域顯著的13個聚類分別為“Conceptual metaphor(#0)”、“Polysemy(#1)”、“Semantic analysis(#2)”、“Antonymy(#3)”、“Near-synonymy(#4)”、“Subsumption(#5)”、“Pluricentric languages(#6)”、“Computational linguistics(#7)”和“Vocabulary(#8)”、“Speech event feature(#9)”、“Discourse makers(#10)”、“Semantic ambiguity(#12)”、“Concept similarity(#22)”這13個聚類在一定程度上代表了詞匯語義學的研究熱點和前沿。其中,最大的三個聚類是“Conceptual metaphor”、“Polysemy”和“Semantic analysis”,節點數分別為39,36和35,聚類“Semantic ambiguity”代表了國際詞匯語義學的最新研究主題(平均發表時間為2011年)。

表3 文獻共被引聚類信息(2008—2018)
3.關鍵詞共現分析
一個領域的研究熱點和前沿動態可以通過研究關鍵詞在其領域出現的頻率來確定。關鍵詞濃縮和提煉了論文的核心觀點和研究主題,根據關鍵詞頻次數目可以分析出研究中的熱點。關鍵詞的頻次越高,代表其研究熱度越強[4]。同時,研究領域的研究熱點也可由中心度來判斷。作為節點在網絡圖譜中連接作用大小的度量,中心性(Centrality)大的節點文獻往往被視為該領域知識發展過程中的關鍵文獻。關鍵節點在整個網絡中起戰略性作用,展現了關鍵詞之間的內部關聯。節點的中心度越高,連接和傳達信息的關鍵詞越多,說明其在整個網絡中的“媒介”作用能力也就越強[4]。表4是由CiteSpace軟件統計得出的2008-2018年間國際詞匯語義學的高頻關鍵詞和高中心度的關鍵詞,而圖5則是由CiteSpace軟件所生成的高頻關鍵詞的聚類圖。表 4列舉了2008-2018年共現頻次前15的關鍵詞。從表 4 中可以看到,“polysemy”是出現頻率最高的關鍵詞,出現頻次為119次;其次是“language”,出現頻次為99次;而后是“English”“semantics”和“discourse”等。這五大高頻關鍵詞在一定程度上顯示了研究者的研究傾向性及其所關注的核心話題。

圖5 高頻關鍵詞共現圖
我們抽取Centrality>=0.1的結果15條。如表 4 顯示,中心度排在前三位的關鍵詞依次是“vocabulary”、“language”、“word”,這是由于詞匯語義學緊緊地與詞義聯系;隨后依次為“working memory”“children”“sentence comprehension(comprehension)”“polysemy”與語篇相關的關鍵詞,它們在國際詞匯語義學研究的知識網絡中也具有重要的中介作用。但是,并非所有的高頻次、高中心度的關鍵詞都有明確的傾向性和指向性,如“vocabulary”“language”“word”“semantics”等所指籠統寬泛,難以說明其研究的趨勢,在統計時需剔除此類詞匯。如此可見,“working memory”“comprehension”“children”“polysemy”“acquisition”等關鍵詞為國際詞匯語義學研究的熱點和關注聚焦中心。

表4 高頻關鍵詞(TOP15)及其中心度(2008—2018)
為揭示國際詞匯語義學研究主題的變化趨勢,本研究通過Citespace 的 “Timezone View”關鍵詞時區劃分功能,以1年作為一個時區,分別對2008-2012年和2013-2018年兩個時間段的研究主題演進進行了分析,篩選出最為顯著的關鍵詞,結果見圖6和圖7。在CiteSpace的關鍵詞時區圖中,每個十字標記都代表一個關鍵詞,且關鍵詞一旦出現,便固定在其首次出現的年份,相同時區中集結了相同時間范圍內出現的關鍵主題詞,而十字標記的大小則對應該詞從首現年份開始以后共出現的頻次多少;各時間段之間的連線代表各時間段之間的順承關系,連線的多少對應關鍵詞間順承關系的強弱[16]。從圖6可看出,2008年最早的研究視野主要集中在“polysemy”“English”“language”“semantics”和“discourse”等議題;逐步出現“corpus linguistics”“children”“acquisition”等主題,表明詞匯語義學在2008—2012年間與語料庫結合和研究兒童語言習得相結合。而后又出現了“learner”“syntax”以及“wordnet”等將語義與句法和學習者相結合的主題。圖7顯示,2013—2018年“polysemy”“English”“language”“semantics”和“discourse”仍然是研究的熱點所在。后來相繼出現了“working memory”“grammar”等認知記憶和語法的研究主題。而后又出現了與“metaphor”“lexical semantics”“cooccurrence”“construction”“proficiency”和“recognition”等詞匯隱喻認知的相關主題,尤其是2006年首現的詞匯和構式的互動關系為目前詞匯認知研究的研究熱點。此外值得注意的是,在2017年出現新興的關鍵詞“autism spectrum disorder”和“alzheimers disease”等與病理學有關的關鍵詞,正好照應了上文詞匯語義學和病理語言學的學科交叉性。綜合來看,2008—2018年間,與“polysemy”“semantics”“metaphor”和“discourse”等相關熱點主題的研究較為豐碩,后繼學者在認知詞匯語義學上的探索可以借鑒此類主題的研究,并加以深入發掘,或是拓展此領域相對興起的與“construction”“proficiency”“disease”和“language disorder”等相關的研究主題。

圖6 2008—2012年關鍵詞演化

圖7 2013—2018年關鍵詞演化
本文通過CiteSpace可視化工具揭示了近十年國際詞匯語義學研究的熱點和前沿。研究發現本學科的主流地域為美國、英國等歐美國家,這些國家主導著國際詞匯語義學研究的話語權,中國在詞匯語義學研究的國際影響力也在逐漸提升。同時,詞匯語義學領域也涌現出了一批高影響力作者,引領著詞匯語義學的發展前沿。詞匯語義學領域近十年普遍關注的熱點主題是 “polysemy”“discourse”“metaphor”“semantic analysis”“computational linguistics”等,這些高頻關鍵詞在某種程度上代表了在 2008 年到2018 年間國際范圍內詞匯語義學界普遍關注的熱點領域;且詞匯語義學和心理學、計算機科學、病理語言學以及神經科學結合是研究趨勢和前沿。總體而言,詞匯語義學研究的認知轉向和定量轉向頗為顯著,代表著詞匯語義學未來的總體研究方向。