【摘 要】讀者接受與評價是衡量國際中文教育圖書質量的重要指標。利用Python語言數據處理工具獲取海外讀者對國際中文教育圖書的評價文本數據,并使用情感分析技術量化呈現海外讀者對此類圖書的態度,選取讀者最有共鳴的評價進行質性文本分析。研究發現,海外讀者對于國際中文教育圖書的評價以積極為主,但國際中文教育圖書在海外傳播中存在內容質量欠佳、國際競爭激烈、傳播渠道單一等問題,就此提出加強圖書多模態資源的建設及國際交流合作、打造圖書全媒體營銷渠道等優化路徑。
【關" 鍵" 詞】國際中文教育圖書出版;海外讀者;國際傳播水平;情感分析
【作者單位】田美,西安交通大學外國語學院,西安交通大學國際教育學院;蔡樂芊,西安交通大學外國語學院,西安交通大學出版社;秦茂盛,西安交通大學出版社。
【基金項目】陜西省社科基金項目(2023P001)。
【中圖分類號】G239.26 【文獻標識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2025.08.016
國際中文教育是我國國際傳播體系的重要組成部分。作為國際中文教育事業的重要載體,國際中文教育圖書的出版質量在傳播中華文化、推動人民相知相親和文明交流互鑒、增強國家軟實力等方面具有不可忽視的重要作用[1]。據統計,目前世界各國共有3萬多所中小學、4000多所大學和4.5萬所培訓機構開設了中文課程,在學人數超過2500萬,全球學習和使用中文的人數超過2億[2]。遍布世界的中文學習者對于國際中文教育圖書和教育資源的直接反饋和評論,是國際中文教育圖書海外接受研究的重要資源,但目前針對大范圍的海外中文學習者對于國際中文教育圖書接受度的實證研究數量較少。有學者發現外籍教師和來華留學生的話題興趣與4本國際中文教材的話題總體匹配度較高[3];有學者針對面向泰國學習者的系列國際中文教材進行了學校、教師、學生和家長的需求分析,并對該系列教材的內容設計、呈現方式等提出了建議[4];但這些研究樣本數量較少,很難代表數量龐大的中文學習者。也有研究針對某一類型的國際中文教育圖書,如專門用途漢語教材等[5-6],但未涵蓋不同類型的國際中文教育圖書。
隨著互聯網技術和全媒體時代的發展,個體讀者可以通過多種渠道隨時隨地表達對圖書的評價和意見。通過大數據手段獲取、分析各個國家和地區中文學習者對國際中文教育圖書的評價,對優化學習者的中文學習體驗、推動國際中文教育資源高質量發展、探尋構建中國國際傳播體系的有效路徑具有重要意義。
本研究利用Python語言數據處理工具,以亞馬遜圖書平臺上關于中文學習圖書的讀者評論文本數據為研究對象,采用定量和定性結合的方法,可視化呈現海外中文學習者對于國際中文教育圖書的整體評價、關注主題、情感態度等,分析國際中文教學資源的海外讀者接受效果,并基于此實證數據和研究發現,對優化此類圖書的輸出路徑、改善國際中文資源的海外傳播效果提出相關建議。
一、情感分析技術的應用
情感分析(sentiment analysis),又稱意見挖掘 (opinion mining),是指對自然語言文本中所體現的文本的發起人對某個特定對象,以及相關屬性或者話題的情感、態度、觀點的評價等進行計算分析的過程[7]。情感分析按照文本的粒度大小可分為文檔級、句子級和方面級[8]。目前,文本情感分析方法主要有基于情感詞典的分析方法和基于機器學習的分析方法等[9]。
基于情感詞典的文本情感分析方法是通過匹配目標文本中與情感詞典中標記的帶有情感傾向的詞匯單元和詞匯組合,來計算目標文本的情感傾向值。可以選擇現有較權威的情感詞典,如由加拿大國家研究委員會(簡稱NRC)開發的情緒和情感詞典、大連理工大學開發的中文情感詞匯本體庫等,也可以根據研究對象的特性構建專門的情感詞典來滿足對目標文本情感傾向的分類和計算的準確性需求。基于情感詞典的分析方法可以快速準確地分析出目標文本的情感極性,但由于語言本身的復雜性,如反諷等情況的出現等,無法準確判斷未收錄詞的情感值,從而導致計算準確性的降低[10]。基于機器學習的分析方法會受到原始數據數量的影響,因此要不斷測試計算機適用于何種類型和規模的數據。這種方法操作起來比較費時,也存在結果不準確的情況[11]。
應用情感分析技術可以幫助人們在大數據時代識別和理解他人的觀點和態度[12],幫助個人和團體作出有效的決策。近年來,文本情感分析技術被廣泛應用于輿情分析、商品評論研究、大數據研究、教育管理等領域[13-14],甚至被一些研究者用于研究中華傳統典籍或現當代文學作品的英文譯本海外接受程度[15-16],以及漢語國際教育碩士的教材評價研究[17]。
二、研究思路及研究方法
1.研究思路及研究工具
本研究以全球最大的圖書銷售網站亞馬遜網站上關于國際中文教育圖書的英文讀者評論為研究對象,獲取原始數據后進行數據的清洗和降噪,然后利用Python中的輔助工具TextBlob評論的情感極性功能,可視化呈現海外漢語學習者對國際中文教材的直觀評價、情感態度和關注主題等,探究其閱讀和學習體驗,從實證數據中發現和分析國際中文教育圖書海外傳播過程中存在的問題,并據此為優化國際中文圖書的出版質量、提升國際中文教育圖書的海外傳播力和影響力提出相關建議。
本研究采用TextBlob作為輔助工具。TextBlob是一款英文類的情感分析工具,該工具為Python編寫的開源文本處理庫,適用范圍較廣泛,可以用來執行很多自然語言處理的任務,如詞性標注、名詞性成分提取、情感分析、文本翻譯等。相較于SnowNLP等初始工具,TextBlob適用范圍更加廣泛。
2.研究流程
(1)文本數據獲取
本研究以Chinese learning、Chinese teaching、
Mandarin、Putonghua、Chinese character、HSK(漢語水平考試)、YCT(中小學生漢語考試)等為檢索條件,在亞馬遜網站圖書分類的高級搜索圖書名稱(title)一欄中進行搜索,排序方式選擇為按照銷量降序排列(Bestselling)。搜索關鍵詞既包括“中文學習”的相關主題詞,也涵蓋主要的漢語水平測試名稱,以求最大限度涵蓋圖書銷售平臺上的國際中文教育類圖書種類。再爬取英文文字評論,其中不包含純星級評論或視頻評論,共獲得2797條評論。采集評論的時間范圍是2004年10月25日至2023年1月23日。
(2)數據的清洗與降噪
首先對數據進行初步清洗。人工剔除不相關圖書和重復書籍的評論,包括學術專著、兒童繪本、文學作品的中文譯本及表情符號等,獲得2797條評論。其次對文本進行降噪。用Python及NLTK進行語料文本降噪:文本分詞,詞形還原(如名詞復數形式、形容詞或副詞比較級),自定義設置停用詞。再使用Python工具進行對降噪后的文本詞頻進行排序,人工標注非主題詞或無意義詞(詞性非實詞特征),并將其添加到自定義停用詞列表再次降噪。最后基于清洗和降噪后的文本,統計讀者評論的詞頻分布,呈現和分析讀者關注的主題。
三、國際中文教育圖書海外讀者總體接受情況分析
1.讀者總體評價和評論數量趨勢
通過對處理后的2797條讀者評論進行情感極性分析,發現讀者評論的情感態度總體趨勢如表1所示。
可以看出,在海外讀者對于國際中文教育圖書的在線評論中,正向的積極評論占75.29%,中性的情感評論占17.59%,負向的消極評論占7.11%。其中,正向評論的情感極值為0.36,負向消極評論的情感極值為-0.15。可以看出,海外讀者對于國際中文教育圖書的評價整體上以積極的評價為主,對于已出版的國際中文教育圖書整體比較滿意。雖然整體評論以積極評論為主,但積極評論的情感均值為0.36,說明讀者對于圖書的滿意程度并不是很高。
讀者關注度方面,基于本研究獲取的數據,2004年至2023年(因本研究采集數據至2023年1月23日,故未包括2023年的數據),評論數量總體呈現上升趨勢,其中有兩個時間段出現明顯躍升:2014年的評論數量比2012年增長了304.44%,2019年的評論數量比2018年增長了43.93%。2020年的評論數量達到361條,為近20年內最多,但后面兩年出現小幅下降(如圖1所示)。從上述數據可以看出,海外讀者對于國際中文教育圖書的關注度在過去幾年時間里呈現越來越高的趨勢,由此也可看出海外中文學習需求在不斷增長。
2.讀者評論詞云圖
詞云圖是一種可視化呈現評論涉及主題、表現讀者關注主題的有效手段,可以對網絡文本中出現的關鍵詞進行渲染,詞頻越大,顯示字號越大。筆者利用Python語言處理工具對數據進行處理后,繪制了讀者評論的詞云圖(見圖2)。
分析詞頻列表可以發現,讀者評論的主題詞主要分為三大類。一是圖書主題。如漢字(Chinese Character或Character)、普通話(Mandarin)、中文(Chinese)、語言(language)、拼音(pinyin)等,這些主題詞總計出現了4881次,說明讀者購買圖書時對圖書的主題已經有所了解,購買和選擇的意圖比較明確。二是閱讀體驗。好的(good)、棒的(great)、有用的(useful)、很棒的(excellent)、完美的(perfect)等主題詞總計出現2002次,顯示了讀者對圖書的積極態度和較好的閱讀體驗。三是圖書的呈現形式。卡片(card)、音頻(audio)、光盤(CD)、閃卡(flashcard)等均出現在詞云圖中,詞頻總計為1360次,說明讀者樂于接受多種方式的內容呈現形式,單一、傳統的紙質圖書已經無法有效地滿足讀者的學習和閱讀需求。
四、國際中文教育圖書海外傳播中的主要問題
為了更加深入、細致地呈現和理解海外讀者閱讀體驗中具體、真實的感受和態度,以及對圖書內容和呈現形式等的接受和認同程度,進而分析影響國際中文教育圖書海外傳播的因素和傳播過程中的主要問題,筆者采用目的抽樣的方法,將爬取的圖書評論按照讀者“發現此評論有用”(“helpful”)的點擊數量進行降序排列。由此得到的評論應該是讀者最能產生共鳴的,可以幫助我們對讀者的反饋有一個相對全面、客觀的認識。為保護讀者隱私,在引用讀者評論時,筆者對讀者網名進行了匿名處理(標注為R1、R2、R3……)。
基于選取的評論文本數據可以發現,國際中文教育圖書的海外傳播主要存在以下三個方面的問題。
1.內容質量不高,且呈現形式較單一,無法有效滿足讀者使用需求
筆者通過分析評論發現,很多讀者反饋圖書設計的內容趣味性和實用性不強,或者脫離真實語境,對學習產生一定負向影響。如:“書中漢字意義的解釋不夠全面,甚至存在誤導性。有的漢字沒有給出最常用的含義,與日常使用不相符”(R1,2010);“許多解釋性的故事內容很機械,像是為了解釋相應的漢字而故意編造,與現實相差甚遠”(R2,2016);“漢字和解釋性的故事內容脫節,關聯性不強”(R3,2009)。此外,還有讀者指出圖書中存在文字錯誤、序號混亂、圖文不符等內容質量問題:“音頻材料中序號重復、混亂,與圖書編號不符,給讀者造成不便”(R4,2013);“漢字寫錯了”(R5,2010);等等。
從量化數據可以發現,雖然讀者對圖書配套語言學習資源具有強烈的關注和需求,但很多國際中文教育圖書資源僅包含傳統紙質圖書或者簡單的電子版本。有讀者指出,“這本書最大的缺點是并未配備漢字和詞語的閃卡,閃卡上可寫上例句或故事”(R5,2010)。即使有的圖書配備了額外的音頻、視頻資源,卻未充分考慮讀者的實際情況和現實需求,導致讀者無法正常使用,閱讀體驗感較差。如有讀者提出,“音頻的設計很不科學,下載音頻的網站全部都是中文,不知該怎么操作。文件名只有數字,你需要把它們一一對應到每一課上,而且沒有參考答案,只能自己再去找別的資源”(R6,2021)。
2.國外出版機構產品強勢競爭,但其圖書可能存在意識形態或內容質量問題,容易誤導讀者
國外出版機構直接面向海外讀者,深諳其需求和接受心理,推出的國際中文教育圖書在海外市場占有很大比重。從本研究獲取的數據可發現,評論數或者受歡迎程度比較高的圖書很多是由國外出版機構打造的,如Mandarin Chinese、Tuttle Learning Chinese Characters (HSK Levels 1-3)、A Revolutionary New Way to Learn the 800 Most Basic Chinese Characters等。客觀上說,國外出版機構推出的圖書產品和資源在推廣中文教育、傳播中華文化方面具有積極的作用,但可能出于操控輿論、爭奪國際話語權等原因,其圖書中往往出現一些意識形態等問題,容易引起海外讀者對中華文化或中國社會的誤讀。如有讀者認為,“西方的思維不像書里的東方思維一樣,一遍一遍重復寫漢字來記住它們”(R7,2008)。或者是頻繁出現繁體字和簡體字混用的情況,造成讀者的理解和學習障礙。“書中的漢字一會是繁體字,一會是簡體字,很混亂且增加負擔”(R8,2017)。
3.圖書宣傳和營銷渠道較局限,過于依賴傳統模式
讀者評論數據顯示,其購書動因主要集中在“老師或朋友推薦”“學校訂閱”“自主搜索”三個傳統渠道,反映出當前國際中文教育圖書的海外傳播機制存在明顯局限,即過度依賴于教育體系內的定向輸送,如國家指定教材、學校或機構批量采購等模式,而非傳播主體主動構建多元化營銷網絡。
盡管此類傳統模式在短期內可以保障圖書的基礎銷量,但已顯現一定弊端。首先,讀者覆蓋面窄化。海外圖書市場龐大,不同年齡階段、不同國家和地區的讀者群體特點和需求差異較大。許多國際中文教育圖書被動等待機構采購或熟人推薦,難以觸達海外差異化的年齡層及區域市場。其次,認同感培育不足。學校批量采購導致圖書與個體需求錯位,削弱了讀者認同。最后,傳播半徑受限。本研究獲取的數據顯示,不足50%的讀者表示會主動推薦所購圖書,反映出傳統模式未能激發口碑擴散效應,圖書的影響范圍并不廣,圖書產品未形成品牌效應。
五、國際中文教育圖書海外高質量傳播的優化路徑
1.從讀者需求出發,加強圖書多模態資源的建設
語言的學習和使用可以視為一個學習者調動感官系統與外部環境不斷互動的過程[18]。在學習者獲取外部信息時,信息的呈現和傳遞方式可以有多種形式或渠道,包括圖片、音頻、視頻、附帶語境講解等。這些信息和意義呈現的方式被稱為模態[19]。已有研究發現,多模態模式對于外語學習具有明顯的促進作用[20-21],可幫助學習者在學習過程中調動各種感官,通過各種資源不斷刺激獲得立體、多元、綜合的信息。
國際中文教育圖書可配套相應的跟讀訓練視頻、APP、智能學習或測評軟件、在線課程、漢字閃卡等符合數智時代讀者語言學習需求的各類資源,幫助讀者不受時間和空間的限制,隨時隨地、循序漸進地學習,但配套視頻需解決各類設備上的不兼容問題,方便讀者使用。如漢字閃卡紙張應比較硬挺,且配上套環,不易散落。此外,信息的呈現形式與內容之間的平衡也需要把握,過度和設計欠佳的多模態形式都會給語言學習帶來負擔,干擾學習效果。而且,多模態資源的使用需要是讀者友好型的,操作簡單明晰且考慮讀者的語言情況,尤其是面向中文初學者的圖書資源,不應全部設置成復雜的中文操作界面。
2.加強國際交流合作,優勢互補,借筒出聲
國際出版機構在語言教育類圖書產品的設計、出版和營銷方面經驗和資源非常豐富,積累了龐大且穩定的讀者群。國內出版機構應有競爭和合作意識,主動出擊,在圖書內容尤其是涉及中華文化和中國精神的相關內容上守住底線,發出聲音,與國外出版機構在信息生產、內容構建、版權貿易、全渠道推廣等方面深度合作,發揮各自優勢,逐步提高產品的市場占有率和中國圖書產品的國際話語權,在海外目標市場和讀者群中建立良好的口碑和聲譽。同時,還需加強與海外各級教育機構、研究機構等的合作。這些國際出版機構深諳文化傳播的策略和語言教育的規律,不僅能在國際中文教育圖書的內容建構上出謀劃策,還是國際中文教育圖書產品的潛在用戶,具有較強的號召力。
3.打造圖書全媒體營銷渠道,實現圖書“雙效”最大化
以社交媒體等為代表的圖書新興營銷渠道在圖書推廣方面正發揮越來越大的作用。相較于學校或圖書館訂閱、線上線下書店上架等傳統的圖書宣傳和營銷方式,出版機構應根據國際中文教育圖書的內容亮點、受眾對象特點構建用戶畫像,并將其與短視頻、視頻直播、社交媒體、網絡學習社區等方式和渠道緊密結合,以達到預期的傳播效果,最終實現圖書社會效益和經濟效益的雙贏。如:在TikTok等海外短視頻網站推出每日中文學習小視頻,配合圖書宣傳;在網絡學習社區開設直播,推介圖書相關資源和服務,隨時與讀者互動。
六、結語
網絡上的圖書評論代表了最廣泛的讀者群體“最直接、最真實”的觀點和感受[22],能夠體現其對圖書內容的判斷和選擇。國際中文教育圖書的海外傳播擔負著向世界展示立體、全面、生動的中國的重要使命,對于推廣中國語言和文化、提升中國語言和文化的國際影響力具有重要意義[23]。精準呈現、分析海外中文學習者對圖書的接受程度和情感態度,能夠為優化國際中文教育資源的設計提供有價值的視角和信息。
基于主流圖書銷售平臺上讀者對于國際中文教育圖書的讀者評價可以發現,海外讀者對國際中文教育圖書的關注度近20年來整體上越來越高,評價以積極、正向為主,尤其對圖書的多模態呈現方式、配套資源對語言學習的積極作用等給予了較高的關注。本研究基于讀者的評論文本,發現國際中文教育圖書在海外傳播過程中存在內容設計欠佳、呈現形式單一、圖書產品競爭激烈、依賴傳統的宣傳和推廣渠道等問題,并就此提出加強圖書多模態資源的建設及國際交流合作、打造圖書全媒體營銷渠道等優化路徑。
本研究的局限性在于,只選取和分析了英文的讀者評論,未能納入更多語種的讀者評價。值得注意的是,在本研究選取的質性分析評論中,有相當一部分讀者詳細地描述了個人中文學習的經歷以及學習策略,這也給未來針對中文學習經歷和學習策略的研究提供了有益的視角。
|參考文獻|
[1]馬箭飛. 推動新時代新征程國際中文教育高質量發展[EB/OL]. (2023-01-09) [2023-02-24]. http://www.jyb.cn/rmtzcg/xwy/wzxw/202301/t20230109_2110990971.html.
[2]馬箭飛,梁宇,吳應輝 等. 國際中文教育教學資源建設70年:成就與展望[J]." 天津師范大學學報(社會科學版),2021(6):15-22.
[3]余千華,樊葳葳,陳琴. 漢語學習者話題興趣及其與對外漢語教材話題匹配情況調查研究[J]. 語言教學研究,2012(1):23-29.
[4]馮麗萍. 泰國中學漢語教材需求分析與教材編寫設計[J]. 云南師范大學學報(對外漢語教學與研究版),2014(2):12-16.
[5]CAI Q-Y W. Constructing assessment indicators weight system of digital business Chinese materials [J]. SAGE Open, 2021(3):1-16.
[6]曾晨剛. 全球專門用途中文教材出版狀況調查研究(1990~2020)[J]. 云南師范大學學報(對外漢語教學與研究版),2021(5):24-30.
[7]劉兵. 情感分析:挖掘觀點、情感和情緒[M]. 劉康,趙軍,譯. 北京:機械工業出版社,2018.
[8]FELDMAN R. Techniques and applications for sentiment analysis [J]. Communications of the ACM, 2013(4): 82-90.
[9]李建華, 劉功申, 林祥. 情感傾向性分析及應用研究綜述[J]. 信息安全學報,2017(2):48-62.
[10]AGARWAL B,MITTAL N. Semantic feature clustering for sentiment analysis of English Reviews[J]. IETE Journal of Research,2014(6):414-422.
[11]管新潮. Python語言數據分析[M]. 上海:上海交通大學,2021.
[12]PANG B, LEE L, VAITHYANATHAN S. Thumbs up? Sentiment classification using machine learning techniques[EB/OL]. [2025-06-15]. https://aclanthology.org/W02-1011/.
[13]OLIVERIA D J S, DANIEL J S, SANTOS P A D. Can social media reveal the preferences of voters? A comparison between sentiment analysis and traditional opinion polls [J]. Journal of Information Technology amp; Politics,2016(1):34-45.
[14]RANI S, KUMAR P. A sentiment analysis system to improve teaching and learning [J]. Computer, 2017(5):36-43.
[15]張璐. 從Python情感分析看海外讀者對中國譯介文學的接受和評價:以《三體》英譯本為例評價[J]. 外語研究,2019(4):80-86.
[16]馮正斌,唐雪. 網絡翻譯書評視域下路遙《人生》英譯本的接受研究[J]. 外文研究,2020(4):80-86.
[17]陳曉霞. 基于大數據的漢語國際教育碩士教材研究:以《漢語國際教育碩士系列教材:核心課教材》在線評論為例 [J]. 云南師范大學學報(對外漢語教學與研究版),2020(6):15-23.
[18]鄭群, 徐瑩. 多模態呈現方式對英語詞匯學習焦慮的影響研究[J]. 西安外國語大學學報, 2020(2): 49-53.
[19]黃立鶴,張德祿. 多核并行架構:多模態研究的范式、路徑及領域問題之辨[J]. 外語教學,2019(1):21-26.
[20]LI M M. Multimodal pedagogy in TESOL teacher education: Students'perspectives [J]. System, 2020(94):1-13.
[21]顧曰國. 多模態感官系統與語言研究[J]. 當代語言學,2015(4):448-469.
[22]章成志,童甜甜,周清清. 整合不同評論平臺的圖書綜合影響力評價研究[J]. 情報學報,2018(9):861-873.
[23]俞瑋奇,韓進拓. 國際中文教育圖書的海外出版傳播對策研究[J]. 科技與出版,2021(11)34-39.