王晶
(重慶郵電大學 外國語學院,重慶 400065)
近年來,我國的信息通信技術(ICT)產業高速發展,但我國公民的科學素養與發達國家相比差距甚大,與產業發展不相匹配,這對當下的ICT科學傳播及其研究提出了挑戰。第四次工業革命使得新媒體成為現代科學傳播的重要媒介,然而新媒體中的ICT科學傳播文本數量龐大、分布廣泛,傳統的話語分析方法難以對其展開全面的研究。因此,本研究采用語料庫與話語分析相結合的方法,收集2015年1月1日至2016年12月31日之間我國最具代表性的科學傳播網站中的ICT科學傳播文本,建立ICT科學傳播語料庫,包含7 276個文本,類符(types)約12.32萬個,形符(tokens)約588.85萬個。將該語料庫文本分為六個類別,并在此基礎上展開橫向對比話語分析,對比六個子語料庫在主題、共現關系、特殊主題詞等方面的異同,深度剖析各領域科學傳播的側重點和話語特征,并結合社會語境展開分析,客觀呈現ICT的科學傳播現狀。
基于2015年中國信息通信研究院提出的信息通信技術的軟科學研究八大領域,我們參照ICT產業流程,將ICT科學傳播文本按照以下標準分為六個大類:
1) ICT原理與研發:涉及ICT領域的科學技術原理介紹,科學家介紹,學術前沿,科技活動以及最新科技成果(未量產);
2)ICT硬件及制造:ICT領域已量產的硬件及其介紹,ICT制造業;包含整機設備、元器件、儀器儀表三大領域,其中具體有:集成電路、智能硬件、芯片、元器件、智能手機制造、平板制造、PC制造、機器人制造、Sip封裝、封測等;
3)信息網絡建設及ICT服務業:包含涉及三個方面的文本:(1)ICT基礎設施建設,光纖技術,網絡架構,陸纜與海纜建設,網絡操作系統,互聯網交換中心,數據中心,國際出口寬帶,海外POP節點,國際通信網絡,骨干網(DNSCNDIDCICPCAP,SDNNFV,Tier1),丟包率,國際通信網絡 ;(2)運營商,移動寬帶,移動終端,光纖寬帶,網絡移動數據業務,提速降費,網速流量經營,App掌上營業廳;(3)公眾wifi,商業wifi、政府wifi,智慧城市,4G4.5G5G及其網絡建設,空天互聯網研究(如谷歌氣球、facebook 無人機、軌小衛星等),LTE寬帶集群,高鐵無線通信,頻譜管理;
4)互聯網及互聯網+:包括消費互聯網與產業互聯網兩種,主要關注互聯網與服務業或工業相結合的領域。大數據、云計算、開源、云服務、軟件與App、可穿戴智能終端(智能硬件)、智能家居、人工智能、機器人、無人車、無人機、基于分享經濟的創新企業(涉及教育、醫療、交通、住宿、家政、教育、金融、傳媒、印刷出版等),互聯網企業或者電商(如:小米、滴滴、騰訊、百度、阿里巴巴、谷歌、facebook、微軟)、工業互聯網(industrial internet),域名產業,VR/AR,3D打印,手游,等等;
5)網絡與信息安全,法律與監管:安全漏洞,數據泄露,病毒和惡意程序,電信詐騙,數據安全,數據保護,網絡違法行為,信息傳播監管,網絡立法等;
6)ICT與人和社會:探討和反映ICT技術對人與社會的影響,具體體現在輻射/人際關系/情感/倫理/智力/審美/身體健康等方面。
鑒于本語料庫的文本數量龐大,純粹使用人工逐篇分類的方法耗時耗力,因此筆者借助計算機的模型分類器來實現大數據文本的分類。每個類別的文本個數以及各類別在科學傳播網站上的分布情況,參見表1。

表1 各個網站的分類分布情況統計表
從分類結果來看,不同類別中包含的文本數量差異較大。2015—2016年最為熱門的ICT科學傳播話題為互聯網及互聯網+話題,該話題占據了語料庫中58%的文本數量,超過了其余話題文章數的總和。近幾年,“互聯網”的范疇加速擴張,可以解釋這一壓倒性的熱門話語現象。其中有國家政策導向的推動作用,2015年,國務院出臺了10余份以互聯網促創新的重要戰略性文件,將互聯網及互聯網+確立為“十三五”時期我國經濟增長的重要推動力量,這彰顯了互聯網在我國創新中的重要載體和核心作用。尤其是2015年7月發布的《關于積極推進“互聯網+”行動的指導意見》(國發[2015]40號),更是掀起了“互聯網+”發展的熱潮。也是在2015年,云計算進入了2.0階段,基礎設施領域的運營能力提升,呈現了向政府、金融等市場大規模延伸的態勢。互聯網公司的大數據引擎開始為社會和各產業服務,通過整合重構資源,打破了原有的商業規則,在交通出行、房屋租賃、家政、餐飲等領域誕生了一大批基于分享經濟的創新企業。分享經濟成為當下資本市場上最受歡迎的初創企業。與此同時,人工智能在2015年也取得了里程碑式的進展。臉部識別、無人駕駛、機器學習、云服務等等新科技都逐漸地進入公眾的視野,引發了公眾極大的興趣。可以說,2015年的這一系列事件成就了互聯網及互聯網+話題熱的大社會語境。與此相對地,ICT與人與社會、信息網絡建設及ICT服務業是較為冷門的話題。
在結束所有ICT科學傳播文本的分類工作之后,我們將這六個類別設定為變量之一,隨后導入T-LAB軟件并將語料庫按照類別變量分割為六個子語料庫,并展開進一步的橫向對比話語分析。
社會是語言運用的環境,“認知語境分析”方法主張將話語置于大的社會語境中進行考察,探索語言使用者對語境的認知方式和程度以及這種認知對語言運用的影響。田海龍(2009:29)指出:“社會語境包括機構語境和社團語境,前者體現權力關系,與話語實踐的目的相聯系,后者體現社會團體的價值取向,與話語再現的意識形態相關聯。”將以上的分類結果放置于科學傳播的社會語境中,可以充分解釋各類別中的文本數量差異現象。
本研究首先進行的是基于聚類主題(cluster analysis)的橫向對比。文本聚類分析是指在無任何先驗知識的情況下, 從下而上的、根據文本內容自動實現文本類別的劃分。對于大規模的、高維的文本數據,聚類分析能從大量文本集中發現隱含的知識,為研究者了解研究對象文本,發現研究問題,設計研究方法等提供幫助。圖1顯示了在設定的六個分類中,各個聚類主題的分布狀態。可以看出,各個主題在六大類別中的分布并不均衡,需要特別留意的有以下幾個分布:
首先,有關“人工智能”的內容主要分布在第1類與第6類中,這說明科學傳播中一方面致力于對人工智能科學原理的介紹,對人工智能的前沿學術展示了極大的興趣,另一方面也開始反思人工智能與人和社會之間的關系。通過檢索“人工智能”一詞在第6類子語料庫中的前后詞匯搭配,可以發現在“人工智能”之前共現頻率最高的六個詞匯是“人類、未來、強、擔憂、發展、擔心”,在其之后共現頻率最高的六個詞是“技術、機器人、發展、取代、人類、系統”。“詞語像人類一樣聚群”(梁茂成 等,2010:86),在語言運用的橫向序列中,一些詞總是與其他詞共同使用,具有很高的共現頻率。以上搭配詞匯反映出當下的科學傳播文本中對于人工智能的發展關注度很高,因為“發展”一詞在其前后都有超高的共現頻率,但是在人類與人工智能的關系上,對人工智能在未來對人類可能產生的影響上,語料庫反映出人們對此的憂慮,“擔憂、擔心、取代”都傳遞出一種消極負面的情緒。

圖1 六大分類中的聚類主題分布圖
其次,可以看到“量子通信”的主題內容主要分布在第1類與第2類中,而在每個類別中的比重幾乎是呈遞減的狀態分布。量子通信是相對比較專業的學術術語,而我們做出分類的依據是ICT的產業流程,也就是說第1類是純理論研究和學術前沿,第2類屬于將第一類的研究成果進行量產的制造階段,第3類屬于ICT的基礎建設和運營商,這是互聯網得以實現的保障,第4類是ICT與普通公眾融合最緊密的應用產業領域,第5類屬于網絡安全與監管,ICT產業相關規則制定的范疇,最后的第6類則是ICT技術與人類關系的反思階段。量子通信是近20年發展起來的新型交叉學科,是量子論和信息論相結合的新的研究領域,能實現安全高效的信息傳輸,它主要屬于基礎的理論研究范疇,因此在第1類出現的次數最多,而在ICT的應用和商業階段,自然占比就越來越低了。
第三, “運營商與監管”這一主題集中出現在了第3類與第5類當中。這與該主題的兩個關鍵詞“運營商” “監管”是完全對應的。第3類的分類標準的第二點,就是有關運營商的內容,而第5類的分類標準也包括監管的部分。“網絡安全”的主題,最多的也出現在了第5類當中,這也與第5類的另一個分類標準關鍵詞“網絡與信息安全”對應。由此可見,文本的主題聚類與分類結果,都具有相當高的精準度,才能在內容分布的分析中呈現如圖的一致性。
最后,“市場”這一主題主要出現于第2類與第4類當中。但出人意料的是,“市場”在第2類,即ICT的硬件及制造類別中出現的比例甚至高過了第4類,也就是互聯網及互聯網+產業。可見當下的ICT科學傳播文本中,更多地關注硬件制造業的市場規模及銷售情況,這說明對于整個ICT基礎產業的市場關注,甚至超過了對與人們生活更接近的應用市場領域。這與我們的預期大相徑庭,Baker(2013)曾指出,在聚類分析中,那些與之前對語料庫文本的原始預測不一樣的語言現象尤其需要引起研究者的重視和解釋。這種方法能迫使研究者面對真實的話語文本,能有效降低批評話語分析中的主觀性和偏見。新媒體的科學傳播話語對我國ICT基礎產業而非應用市場的關注,展現了國家對基礎理論和基礎產業的鼓勵和傾斜,為我國科學的自主創新、可持續發展做出了保證。
其次,選取各個子語料庫中的特殊主題詞進行分析。也就是說,將某一子語料庫與其余五個子語料庫進行橫向對比,發現該語料庫中出現頻率顯著高于其他五個子語料庫的關鍵詞,這種關鍵詞被稱為特殊主題詞。T-LAB軟件的特性分析功能(Specificity Analysis)可以實現這一對比研究。對于特殊主題詞的分析能反映各個子語料庫不同的內容關注點。因為“重復的話語結構能證明某種評價性信息不僅僅是個人的判斷,也不是乖僻的論斷,而是在話語社區中具有廣泛的共識。一個單詞、短語或句式可以引發一種文化定型(cultural stereotype)”(Stubbs,2001:215)。值得注意的是,特殊主題詞不是只出現在某一個子語料庫中,也不是某一個子語料庫獨有的詞匯。它可能也出現在其他的子語料庫中,但它在其他子語料庫中的出現頻率顯著低于這一個子語料庫。

表2 各分類子語料庫的特殊主題詞分析
通過使用特性分析功能,選取各個子語料庫排位前十的特殊主題詞進行對比分析,可以客觀呈現各個科學傳播類別中所關注的重點。Fairclough(1989:25)認為“話語的社會實踐性要求話語的生產和解釋具有一定的社會條件”。Fairclough(2009)也強調CDA不僅要關注話語符號,更要關注它和其他社會因素之間的關系。我們嘗試將這些特殊主題詞與社會因素聯系起來,充分展示科學傳播話語在新媒體這一特殊的語境中如何參與、再現,同時向公眾構建ICT這一科學概念。
從表2可以看出第1類的科學傳播文本關注的重點在“量子”/“光子”通信以及“計算機”模擬“大腦”“神經網絡”進行“學習”的前沿科學技術“研究”上,其中“ALPHAGO”一詞值得注意。在2016年初,谷歌研發的圍棋人工智能ALPHAGO與韓國棋手李世石進行較量,并最終取得勝利,這一事件受到廣泛關注并引發了人工智能可能取代、威脅人類的恐慌和討論。按照我們的判斷,與ALPHAGO有關的科學傳播內容極有可能更多地出現在第6類,即ICT與人的關系探討類別中,但特殊主題詞表卻顯示ALPHAGO一詞在第1類的出現頻率遠高于其他類別。通過檢索ALPHAGO的原文索引,可以看出,第1類中與ALPHAGO相關的文本集中探討ALPHAGO的工作原理與程序細節以及國內人工智能的研究發展現狀。這樣的科學傳播文本抓住了科學熱點事件,及時進行相關科學原理的普及,從相對專業的角度對ALPHAGO進行祛魅,幫助公眾了解看似高深的前沿科技。有了對ALPHAGO程序原理的認知,公眾對人工智能的恐慌自然就不復存在,通過提高公眾的科學素養,才是最好的消除謠言、祛除盲信的解藥。尤其需要注意的是,ALPHAGO的工作原理屬于相對前沿的科技,與ALPHAGO相關的科學傳播文本作者大多來自科學共同體,這表現了科學人走出學術圈,融入大眾的意愿和行為。由此可見,在如何幫助公眾學習認識前沿科技這一點上,新媒體以其自身獨有的方式,開辟出一條實際可行的道路。
在第2類ICT硬件及制造中,特殊主題詞事實上圍繞著兩個范疇展開:“手機”與“平板”。在這十個主題詞中,出現了三大手機平板的制造商(三星、蘋果、華為),根據中關村在線發布的《2016上半年中國智能手機市場研究報告》,這三家占據了目前市場上大部分的份額與關注度,分別是蘋果22.2%排在第一,三星以微弱差距屈居第二,為21%,本土品牌華為以15.2%排在第三。其余的是與手機平板性能緊密相關的四個詞:“GB” “英寸” “處理器”以及“芯片”。這十個主題詞清晰地反映出了第2類別在ICT領域中科普最多的兩種硬件。
第3類的核心關注點同樣非常清晰,圍繞著我國三家“運營商”(中國聯通、電信、移動)以及“寬帶提速降費”的熱點事件展開。可以看出,“流量” “資費” “套餐”都是與提速降費相關度極高的詞匯。這一主題成為第3類的內容熱點與我國高速的信息化進程有關。
第4類互聯網及互聯網+領域中,主要的關注點集中在了商業化的領域,“公司”“美元”“投資”“融資”“創業”都是將互聯網與其他產業深化結合的思路。隨著2015年云計算進入2.0時代,國家發布《關于促進云計算創新發展 培育信息產業新業態的意見》,互聯網的發展為國家提倡的萬眾創業提供了諸多的契機和可能,也使得互聯網+產業蓬勃發展起來,成為風險投資青睞的行業。
第5類的特殊主題詞展示了一種不平衡的內容現象,十個主題詞中,有九個都是與網絡與信息安全有關,只有一個詞“規定”與法律監管有關。圖2顯示,十個主題詞中,除了“規定”“加密”兩個詞與其他詞匯的關系疏遠一些,其余八個主題詞的互信值(MI)都較高。可見目前的科學傳播對于網絡安全的內容關注度更高,而法律監管則涉及較少。近年來,我國的信息通信法律監管工作也取得了重大的進展,“十二五”期間我國制定出臺互聯網相關法律法規、規范性文件共76部,同比增長262%④;2016年《網絡安全法》《未成年人網絡保護條例》也相繼出臺,然而,新媒體的科學傳播主體顯然對這一些進展關注不夠,并未使用過多的篇幅對此進行介紹。
最后一類ICT與人和社會的特殊主題詞主要關注的是ICT與人們日常生活中引發“倫理”討論的一些熱點問題。“人工智能”“機器人”以及“家庭”應該指向的是被網民熱議的家用機器人的研發與生產,這一企圖用機器人取代人類的做法自然引發公眾對于倫理和家庭關系的探討。“武器”和“玩家”指向的是網絡游戲,而網絡游戲最有可能影響的是自控能力不強的“孩子”的健康成長。據《中國互聯網絡發展統計報告2017》顯示,目前我國“新增網民年齡呈現兩極化趨勢,19歲以下40歲以上人群占比分別為45.8%和40.5%,互聯網向低齡高齡人群滲透明顯”。新媒體中的科學傳播更多地關注ICT帶來的負面的、有爭議的影響,展示了公眾對這一技術的擔憂,同時也展示出新媒體科學傳播幫助公眾答疑解惑的重要功能。
對以上六個類別的詳細分析之后,我們發現,民間網站與第四類的關聯度最高,與第一類的關聯度最低,而政府網站則與第一類、第六類以及第三類保持著相對高的關聯度。這說明民間的科學傳播網站最關注的是ICT技術應用,即其商業化的階段,而對于ICT的原理和研發——即基礎科學的興趣不大。政府科學傳播網站的關注點則與民間網站呈現出極大的差異,更注重對ICT領域基礎科學的普及(ICT原理和研發、基礎網絡建設與運營商),并對ICT與人和社會的關系做出思考。對于ICT給人們生活方式、行為方式和思維方式等帶來的巨大改變,政府傳媒更多關注的不是經濟導向,而是其可能產生的倫理影響和社會沖擊。從這個方面來說,它比民間傳媒呈現出更多的社會責任感和使命感。
六個子語料庫的聚類主題對比與特殊主題詞對比分析清晰地呈現了各個類別中最關注的內容,而對于以上六個類別,民間與政府的科學傳播網站也表現出不同的興趣點與責任感。Habermas(1999)曾說,一個科學化的社會,作為成熟的社會,似乎只有隨著科學和技術通過人的頭腦而與生活實踐相溝通時才能建成。在當下的中國,新媒體中的科學傳播話語正是通過與社會語境的緊密結合,充分服務于科學發展和科學普及的需要,展現出巨大的話語欲望和話語潛力。