○鄭文標
(華僑大學 華僑華人研究院,福建 廈門 361021)
海外華文網站指的是以海外華人為服務對象,以中文為界面的互聯網網站。隨著全球互聯網的日益普及,海外華文網站不斷涌現并獲得大量網民的訪問,為華人的信息交流建立了便捷的平臺。只要有華人聚集的地方,就會有針對當地華人的互聯網網站,如英國地區的英華園、北美地區的北美華人E網、澳洲地區的喂喂網、泰國地區的泰華網等。這些網站內容主要包括地方新聞、商業資訊及社區論壇等,聚集了當地華人及想要前往當地的準移民,逛網站泡社區已經成為其生活中不可缺少的一部分。另外,華僑華人通過互聯網的使用,消除了地區間溝通的障礙,使跨地區甚至全球性的華人交流平臺的建立成為可能。社區化、跨國化的海外華文網站搭建起了華人在互聯網時代工作生活的嶄新環境,對這一環境的跟蹤研究,將有助于更好地掌握華人社會的現狀及發展趨勢。
同時,互聯網也為海外華人研究提供了良好的技術條件,以華人互聯網為主題的研究正受到研究者越來越多的關注,不少論文探討了以互聯網為工具開展海外華人研究的方法。如新加坡國立圖書館李金生先生的《海外華人研究的新工具:互聯網》[1]一文,將海外華文網站分為電子數據庫、資訊網站、網站指南導航等三類,探討傳統的研究工具與互聯網工具的優缺點。另外,暨南大學發表的華僑華人文獻信息資源建設的系列文章,也探討了互聯網在華僑華人研究中的應用,如徐云副教授的論文《網絡環境下華僑華人文獻信息的開發與共享》[2],提出并嘗試運用互聯網技術整合全球華僑華人文獻信息資源。以華人互聯網使用及華文網絡媒體為研究對象的論文較少,已發表的論文主要集中在新加坡《聯合早報》網站的研究上,如溫曄發表的論文《解讀聯合早報網下的<中國早點>》[3],該文以聯合早報網《中國早點》欄目中發表的涉及中國內地的文章為研究對象,分析其敘事角度及言論特質。另外,美國華裔學者李大玖出版的《海外華文網絡媒體——跨文化語境》[4],較為系統地介紹和分析了海外華文網站的歷史與現狀,并探討了海外華文網站的興起對全球華文媒體發展的影響。
從已有的研究成果看,運用互聯網技術開展華僑華人研究大致有兩種類型的方法,一種是結合網絡技術開展傳統調查研究方法,如電子問卷法、網絡遠程訪談法、網站內容觀察法等。另一種是在線數據分析法[5],是運用網絡流量監測系統及瀏覽跟蹤系統,獲取網民的行為數據,對網民的網絡行為進行統計分析的方法。其中,第一種方法運用較多,運用網絡技術對散居在世界各地的華人開展問卷、訪談等,可以提高效率,減少成本,在短期內獲得大量跨區域的華人樣本數據,并且在自動統計軟件配合下,迅速完成標準化的統計分析工作。在線數據分析方法則是基于互聯網技術的數字化特點,對華文網站及華人網民行為數據進行收集與分析,相對于通過問卷獲得的數據更真實,更容易掌握華人的真實想法和僑情動態。
本文主要介紹運用在線數據開展華僑華人研究的幾種方法,并以海外華文網站的研究為例,收集流量排名前60名的華文網站數據,在對這些網站的基本數據進行分析整理的基礎上,形成對海外華文網站的現狀概述,并探討運用互聯網技術研究華僑華人的方法所面臨的問題。
互聯網的數字化特征,使數據的收集與分析工作更容易進行,網民在網絡上的所有行為,都可以以數字的形式進行跟蹤記錄。不論是華文網站,還是華人網民,都有大量數據記錄存在,這些數據記錄對華人動態的研究,具有重要的參考價值。從已使用的在線數據跟蹤技術來看,網絡數據主要可從三個位置獲得:首先是網民所訪問的網站,由網站記錄網民的訪問行為;其次是網民所使用的客戶端,包括瀏覽器或者電腦等終端設備;再次是網民所經常使用的搜索引擎,由搜索引擎記錄網民行為數據。按獲取數據位置的不同,可以將在線數據分析法分為網站流量監測法、網民行為跟蹤法及搜索引擎關鍵詞統計法三種主要方法。
網站流量監測是在網站服務器端安裝統計分析軟件,對來訪網民的網絡行為進行監測。通過流量監測可以獲得訪問者概況及其訪問內容的數據,包括訪問者的來源地、訪問瀏覽量、訪問時長、訪問網站的具體內容等。通過安裝在華文網站上的流量監測代碼,可以獲得華人網民的基本數據,并且能對華人網民的行為進行全面的記錄和統計,其性質屬于非參與式觀察,有利于獲得可靠的數據。如美國華文網站錦繡中華網(http:∥www.chinapage.com/)在網站上公布了2003年以來統計的網站每月訪問數量,其中2009年的頁面總訪問量達1千7百萬,每月的訪問量均超過百萬。該網站的訪問數據還顯示,每年的春節所在月,網站的訪問量也達到最高,體現了春節期間海外華人對中國文化的濃厚興趣。
網民行為跟蹤法是利用網民安裝在瀏覽器或客戶端電腦上的第三方統計軟件,對網民的網絡訪問行為進行跟蹤記錄。目前不少互聯網數據分析公司都運用此類方法開展調研,如Alexa運用網民安裝在瀏覽器上的插件對網民行為數據進行收集統計分析,統計數據公開可查。以下海外華文網站的排名表,即根據Alexa的流量排名獲得,可以看到排名前十的華文網站在世界的平均排名為5000名左右,每萬人次的訪問到達率為4.16,具備較高的影響力。網民行為跟蹤法比網站流量監測法的應用范圍更廣,運用這些數據,可以對不同行業和不同網站進行數據對比分析,因此受到更多的關注。本文第二部分將以Alexa提供的數據,對流量排名前60的華文網站的數據開展分析。

表12010年12月海外華文網站Alexa排名前十名
搜索引擎關鍵詞統計法是百度、谷歌等搜索引擎提供的網民搜索關鍵詞的統計分析,如百度指數、谷歌趨勢和熱榜等。以谷歌趨勢(http:∥www.google.com/trends)為例,通過分析Google全球用戶海量搜索行為的記錄與統計分析,可以直觀地展現人們關注熱點的變化。圖1顯示了2004年至2010年全球網民使用“留園網”作為搜索關鍵詞的變化情況。從圖中可以看到創辦于2003年的英國華文網站留園網受全球網民關注的逐年變化情況。同時Google Trends提供的數據還顯示,關注留園網的網民來自世界各地,新加坡使用留園網作為搜索關鍵詞的網民數量最多,其次為中國,排在前十名的國家和地區依次還有韓國、中國香港地區、新西蘭、日本、馬來西亞、澳大利亞、俄羅斯和加拿大。

圖1 2004年至2010年全球網民以“留園網”作為搜索關鍵詞的變化曲線*資料來源:Google Trends, http:∥www.google.com/trends.
以上三種方法是目前較為常見的幾種在線數據分析方法,除此之外,一種基于搜索引擎技術的輿情分析方法也正在受到關注,這種技術對現存的網頁頁面的數字信息進行收集分類和整理,以形成一個面向僑情的互聯網主題信息采集系統[6]95-101。互聯網以數字形式存儲和運行的特點,使人們以數字的方式獲得研究資料成為可能,從而為華人研究提供了新的工具。隨著海外華文網站的進一步普及,華人互聯網使用的不斷深度化,網絡研究方法也將成為華人研究的重要方法。
上述三種在線數據方法中,網民行為跟蹤法是較受關注的方法,以下以此方法為例,介紹其在華僑華人研究中的具體應用。根據Alexa提供的全球網站的流量數據,對華文網站按流量進行排序,可以獲得前60位的海外華文網站排名。在Alexa提供的訪問量、訪問來源地區、訪問人群等詳細數據基礎上,配合網站的基本狀況的數據收集和分析,形成海外華文網站的現狀描述。這60個網站是海外華文網站中最主要的網站群,分布于北美、西歐、亞洲及大洋洲的13個國家和地區中,其訪問量占據全球網民每日訪問量的0.06%,即全球每萬次網絡訪問將有6次到達這些網站。由于全球華文網站的數量成千上萬,無法統計這60個網站在全球華文網站中所占的準確份量,但保守估計這60個網站獲得的華人訪問比例占全部華文網站流量的80%以上。這60個網站在Alexa世界流量排名平均在5萬名以內,相對于全球數量達幾千萬的網站來說,可算具備較高影響力。網站創建的時間以2000年及2000年以后為主,占網站總數的80%,網站提供的信息服務最主要的形式為論壇,其次是本地商務信息,其后依次分別為新聞信息、購物信息、博客服務、移民留學信息以及交友信息。
從60個主要華文網站的分布狀況來看,華文網站出現在華人聚集的地區,當地華人聚集的人口密度越高,華文網站的人氣越盛。數據顯示,60個海外華文網站中,主要為北美及西歐地區華人提供服務的網站數量達38個,所占比例高達63.3%。另外,從各個網站的定位及訪問群體的狀況來看,60%的網站以所在國的華人為主要服務對象,40%的網站則具有跨國性的區域化及全球化特點,其服務對象超出了國界,以區域性華人甚至全球華人為服務對象。如歐洲華人及留學生之家網站分別設立了東歐、西歐、北歐、南歐等地區分站,用戶通過該網站可以獲取歐洲華人相關信息,網站促進了歐洲各國家間華人的交往。因此,從華文網站的分布狀況來看,海外華文網站具有全球化的特征,便利的網絡工具和共同的語言去除了溝通障礙,塑造了遍布全球的華人互聯網網絡環境。
從網站的類型來看,海外華文網站的形式主要以提供新聞、博客、論壇、本地廣告商務服務等綜合類網站為主,此類網站占比為56.7%,由海外華文媒體主辦的華文網站也占據部分比例,達30%。華文網站中提供網絡論壇服務的網站占比達73.3%,大部分論壇都活躍著海外華人網民,表達海外生活的見解和交流意見,形成互動頻繁的網絡社區。另外,83.3%的網站為海外華人提供了當地化的社區服務,如超級多倫多網為當地華人提供了組團、居家、搬運、理財、法律、保健等全方面服務項目,既獲得了商業收益,也方便了當地華人,有助于華人網絡社區的形成,并通過組織線下的活動,進一步推動了當地華人社區的成熟。從網站的類型特點來看,網站為華人網民提供全面的信息服務,促進了網民對華文網站的深度使用,網站的便利性造成了網民對網站的依賴性,訪問網站成為華人生活中不可缺少的部分,這也決定了這些華文網站能夠反映當地華人的現狀。
從網站與中國的關系角度來看,網站的訪客來源中,主要以海外華人為主,超過一半的網站擁有比例高于90%海外華人訪問流量比例,說明了海外華文網站對當地華人的吸引力和影響力。同時,中國大陸地區的網民也占據一定比例,平均占比為29.4%,新加坡聯合早報網訪客中,更有近90%來自中國大陸,顯示了聯合早報對中國大陸地區較強的影響力。另外,55%的網站向中國網民提供了留學移民咨詢與代理服務,如新西蘭天維網專設一個留學移民欄目,設置留學動態與移民資訊等板塊,提供了租房、打工、醫保、教育等類型的信息,使網民能夠一站式地全面獲取相關資訊。除此之外,在排名前60的華文網站中,有2個網站總部設在中國大陸,它們分別是服務海歸人員的海歸論壇、為全球華人提供大陸地區商品代購的商務網站,這些網站扮演著海內外華人信息交流的重要角色。因此,從網站與中國的關系角度看,海外華文網站搭起了大陸與海外華人之間溝通的橋梁,成為全球華人信息交流的重要途徑。
總體而言,海外華文網站的興起與海外華人生活社區的成熟相互推動,共同造就了海外華人共同分享的網絡交流平臺。通過Alexa提供的網站流量數據,在對網站基本數據的收集分析與整理基礎上,可以形成對海外華文網站基本狀況的描述,為了解海外華人的生活現狀提供了便利。
從已有的研究來看,運用互聯網技術開展華僑華人研究,特別是海外華文網站的研究,目前仍處于起步階段,面臨著諸多困難和問題,主要有以下幾個方面:
首先是效度問題,即華文網站的訪客能否代表華人群體?從目前的網絡普及現狀來看,不同地區的網絡普及率不同,也決定了不同地區華人接觸華文網的比率不同。另外,不同網站類型的訪客特征不同,如一些以新聞為主的華文網站,其訪客年齡偏高,如華夏文摘網的訪客中,45歲以上的用戶占大多數,而時尚社區類的華文網站則訪客年齡偏低,如旅游類網站窮游網的訪客中,18-35歲的用戶比例超過90%。此外,樣本的代表性也受制于網站的流量,相對于流量較小的華文網站,網站的流量監測數據不一定具備代表性,往往只能反映某一地區某一群體的華人信息,難以反映全體華人網民的行為特征。通過電子問卷開展調查也面臨回收率較低的問題,難以有效控制樣本的分布。可見,開展華文網站的研究,需要對樣本進行有效性的甑別,使其更具有代表性。
其次是信度問題,即經過網絡獲取的信息能否保證準確性?網絡發布的信息具有的匿名性和隨意性,這與傳統媒體不同,傳統媒體經過撰稿人、編輯、主編的重重把關,其真實性能夠得到其采編及發布機制的保障。網絡媒體中尤其是網絡論壇,訪客可以不經過審核直接發布信息,信息發布者可能有意或無意發布虛假信息,一些未經驗證的信息容易得以發布,并經由各網站相互轉載,造成虛假信息快速傳播,極有可能掩蓋事實。數據顯示,在排名前60的海外華文網站中,專業性的媒體網站有18個,占比為30%,而提供新聞信息服務的網站比例則是80%,也就是說,有50%的非媒體類的網站提供了新聞信息服務,這些網站通常沒有職業的采訪人員,新聞來源渠道匱乏,往往不加審核地發布一些具有“轟動效應”的新聞,這些新聞有助于提升點擊率,其可靠性卻難以保障。因此,對網絡獲取的信息進行真假鑒別具有必要性,也是開展華文網站研究的一個難題。
除此之外,海外華文網站的研究還面臨著一個不確定性的問題,不少網站的主辦者為公司甚或個人,網站的興辦與撤銷經常帶有不可預測性,從排名前60名的網站數據中可看到,有12個網站是2007年之后創辦的,這些網站能夠在短時間內迅速崛起,相對地,也有部分網站突然消失,在追蹤排名前60名的華文網站過程中,有不少在2009年排名較前的網站目前已經徹底無法訪問,相關資料無據可查,這些不確定性為持續性的研究帶來了些困難。總之,海外華文網站的研究的開展,面臨困難也蘊含著價值,機遇總是伴隨著挑戰,網絡時代的來臨,為華人研究提供了新的研究對象和方法,而真正獲得有價值的研究成果,需要不斷的積累和創新。
參考文獻:
[1] 李金生.海外華人研究的新工具:互聯網[EB/OL]. (2002-01-18)[2009-11-10].http:∥www.lib.nus.edu.sg/chz/chineseoverseas/oc_research_materials.html.
[2] 徐 云.網絡環境下華僑華人文獻信息的開發與共享[J].學術研究,2003,(11).
[3] 溫 曄.解讀聯合早報網下的《中國早點》[J].東南傳播,2009,(11).
[4] 李大玖.海外華文網絡媒體——跨文化語境[M].北京:清華大學出版社,2009.
[5] 鄭文標.基于在線數據的網絡調查研究方法[J].重慶郵電大學學報:社會科學版,2010,(3).
[6] 許 鑫,黃仲清,鄧三鴻.互聯網僑情信息采集系統設計與實現[J].現代圖書情報技術,2010,(7/8).