





摘要:采用共詞分析方法對中國網站評價研究的主題進行分析,構建研究主題及其結構的可視化圖譜。研究結果表明:(1)網站評價研究的熱點領域是政府網站評價、電子商務(網站)評價、評價指標與體系,尤其是政府網站與績效評估研究得到了廣泛的關注;(2)網站評價研究中存在大量邊緣性研究領域,且尚不成熟;(3)網絡計量學方法在網站評價中的應用,應當注重與其他主題研究相結合;(4)網站評價標準與評價方法,是未來值得關注的研究方向之一。
關鍵詞:網站評價;共詞分析;研究熱點;研究趨勢
中圖分類號:C31 文獻標志碼:A 文章編號:10085831(2012)03008707
一、引言
信息技術的不斷發展與推進,使得萬維網(網站)成為互聯網上應用最為廣泛的服務。各類網站所提供的各種服務與應用,已經完全滲入到人類的生活與工作中。另一方面,大量涌現的網站也帶來了非常棘手的問題:對良莠不齊的各類網站進行評估,以此更好地服務受眾。由此,網站評價這一非常有意義的研究領域開始得到廣泛關注。政府網站評價[1]、企業網站評價[2]、圖書館網站評價[3]、大學網站評價[4]、網站評價指標與體系[5-7]等研究主題得到了較為深入的研究。
網站評價研究在如火如荼開展的同時,對其自身的研究結構進行較為全面的概述,有助于把握其研究熱點與發展動向。可喜的是,目前已有一些學者開始對特定行業的網站、網站評價方法、評價指標等進行了綜述。朱慶華和杜佳從評價方法、評價指標體系兩個方面對國內外政府網站評價研究的現狀進行了概括和總結[8]。張小栓等人對電子商務網站評價的方法進行了匯總、分類與比較,討論了評價方法的發展趨勢[9]。白銀和曹梅對中國教育網站評價研究的文獻進行了總結分析,討論了教育網站評價的特點和發展趨勢[10]。賀婷婷和閆永君通過統計相關文獻,對國內外網站評價研究進行了比較和分析,指出該研究領域存在的不足,并提出了有關建議[11]。
總體上而言,當前網站評價研究的綜述類文獻呈現出如下特點:大多集中在對評價方法與評價指標的綜述;研究對象多限定在特定行業網站;對網站評價研究的主題以及主題間的聯系進行分析的文獻較少。筆者利用共詞分析方法對網站評價研究文獻進行分析,旨在探索中國網站評價研究的主題結構以及主題間的聯系,嘗試發掘當前網站評價研究熱點與發展動向。
二、材料與方法
(一)共詞分析
與引文分析類似,共詞分析的假設前提是:文獻的關鍵詞可以足夠反映出文獻的內容。兩個關鍵詞在同一篇文獻中出現,表明這二者所涉及的主題間具有某些關聯性[12]。共詞分析的主要特點是,利用戰略坐標、社會網絡分析等,通過測量關鍵詞間的聯系緊密度,以可視化的方式展現特定學科領域的結構[13]。很多學者將共詞分析作為一個重要的工具探索不同研究領域的概念網絡,如生物學[14]、教育[15]、圖書信息學[16]等。
(二)戰略坐標
Law等人于1988年提出的戰略坐標,被用來描述特定研究領域內部的聯系和研究領域間的相互作用[17]。戰略坐標是一個二維坐標,其橫軸與縱軸將學科研究領域劃分為四個象限,可以用來描述各主題的研究發展狀況[18]。橫軸代表向心度(centrality),用來度量各類別主題詞與其他類別主題詞之間的緊密程度,表示某研究領域與研究領域之間的相互影響的程度,其聯系的強度越大,該研究領域在整個研究工作中就越趨于中心地位;縱軸代表密度(density),用于度量研究領域內部主題間的聯系緊密度,表示該類維持和發展自己的能力[19-21]。
(三)數據來源及處理
中國知網(CNKI)是目前國內最大的全文數據庫,收錄期刊種類多,學科覆蓋面廣。因此,筆者將其作為研究的數據來源。文獻檢索中發現,關鍵詞“評價”的同義詞“評估”也被較多使用,因此利用表達式“SU=(‘評價’+‘評估’)*‘網站’”進行主題檢索以獲取相關文獻信息。在獲取數據時,有相當部分的文獻為通訊、啟事等,因此將此類文獻剔除。
利用腳本語言Ruby設計相關程序對獲取的原始數據進行處理,以便之后的研究。將關鍵詞進行兩兩配對,生成關鍵詞共現矩陣。兩個關鍵詞間的共現頻次越高,表明聯系越緊密。然后將共現矩陣利用相關系數轉化為相關矩陣,本文采用salton系數Sij[22]。
Sij=C2ij/CiiCjj
(1)
同樣地,Sij值越大,表明兩個關鍵詞間的聯系度越緊密。
三、結果與討論
(一)詞頻的描述性統計
對最終獲取的1 826篇文獻信息進行預處理,并進行詞頻統計,共得到6 817個關鍵詞。去除重復后得3 278個,其中,僅出現一次的關鍵詞個數為2 569個(占比784%)。將關鍵詞的詞頻按照降序進行排列,選擇詞頻大于10的關鍵詞作為高頻關鍵詞(總頻次為2 320次),約占關鍵詞總數量的3403%,代表著“網站評價”研究的熱點。高頻關鍵詞列表如表1所示(由于標引不統一,筆者將同義詞語進行了合并處理,如“互聯網”、“因特網”、“Internet”統一為“互聯網”)。
(二)聚類分析
本文采用當前使用廣泛的系統聚類(Hierarchy Cluster)方法。其基本原理是:首先將所有n個變量作為不同的N類,然后把屬性最接近的兩類合并為一類;再從N-1類中找出最接近的兩類加以合并,重復上述過程,直到將所有n個變量合并為一個大類;最后再將整個分類系統生成一張譜系圖,將所有變量間的親疏關系予以展現[23]。
上述高頻關鍵詞中,剔除檢索詞“評估”、“評價”、“網站”、“網站評估”、“網站評價”。同時,由于關鍵詞“對策”、“分析”、“建設”、“開發”、“現狀”、“應用”和“中國”等7個關鍵詞所表達的意義過于寬泛,因此,本文將這7個關鍵詞予以排除。將標準化后的57*57相關矩陣導入SPSS200,聚類方法采用“組間聯接(Between-groups linkage)”,區間的度量標準采用“歐式距離平方(Squared Euclidean Distance)”,聚類結果如圖1所示。
由圖1可見,“網站評價”研究主題大體上可以聚為10類,分別是:聚類1(評價的統計學方法)、聚類2(電子政務<網站>評價)、聚類3(網站評價方法與標準)、聚類4(圖書館網絡數據庫評價)、聚類5(綜合評價)、聚類6(評價指標與體系)、聚類7(教學及專題學習網站評價)、聚類8(C2C電子商務及信用評價)、聚類9(門戶網站及企業網站評價)、聚類10(網絡計量學在評價中的應用)。整體上而言,當前網站評價研究的主題較為全面,評價中涉及的方法應用、評價指標體系的建立等均有所涉及。此外,在研究對象方面,涵蓋了門戶網站、企業網站、政府網站、電子商務網站、圖書館網站、教育網站、旅游網站,以及專題學習網站等,表明當前網站評價研究越來越注重對細分行業的研究。
(三)戰略坐標圖
筆者計算各聚類的向心度及密度值,結果如表2所示。
同時,利用計算的相應值繪制戰略坐標圖,如圖2所示。
圖2 網站評價研究的戰略坐標圖 由圖2可見,第一象限(右上角)中包含有聚類2(電子政務<網站>評價)、聚類6(評價指標與體系),它們同時具有較高的向心度和密度。這表明,這兩個聚類中的主題研究內部具有緊密的聯系,同時,研究主題與其他聚類的研究主題也有著廣泛的聯系。電子政務<網站>評價、網站評價指標與體系這兩大研究領域是網站評價研究的熱點,并且趨于成熟。
第二象限(左上角)中包含聚類10(網絡計量學在評價中的應用),具有較高的密度。這一聚類主題研究的內部聯系緊密,形成了相對穩定的研究范疇。但是,此主題研究與其他外部主題研究的聯系并不緊密,表明這一聚類的研究處于整個研究網絡的邊緣位置。
第三象限(左下角)中包含的聚類數量最多,有聚類1(評價的統計學方法)、聚類4(圖書館網絡數據庫評價)、聚類5(綜合評價)、聚類7(教學及專題學習網站評價)、聚類8(C2C電子商務及信用評價)、聚類9(門戶網站及企業網站評價)。此象限中的研究領域同時具有較低的向心度和密度,換言之,無論是研究的內部聯系,還是與其他研究領域的外部聯系,均不緊密。這些研究領域處于整個研究網絡的邊緣位置,并且還不成熟。
第4象限(右下角)中包含一個聚類:聚類3(網站評價方法與標準)。此聚類的特點是密度低、向心度高,表明這一研究領域雖然內部聯系松散,但是卻得到了較多的關注,具有很大的發展空間,是未來值得關注的研究領域。
(四)社會網絡分析
利用Ucinet與Netdraw繪制出兩種類型的網絡(基于原始共詞矩陣的共詞網絡、K-core網絡)展現研究主題間的聯系。每一種類型的網絡中,節點表示關鍵詞、連線表示節點間的聯系。
1.網站評價研究的共詞網絡
首先將原始共詞矩陣導入NetDraw,生成可視化共詞網絡,如圖3所示。
圖3中,節點的大小與其頻次成正比,節點越大,出現頻次越高;連線的粗細與節點的共現頻次成正比,連線越粗,節點間共現頻次越高,換言之,兩個節點間的聯系越緊密。由圖3可見,最大的節點是“政府網站”,緊接著是“電子商務”、“指標體系”、“評價指標”等,這些研究主題的出現頻次較高,是廣泛受到關注的研究主題。這表明,中國當前網站評價研究的對象主要集中在政府網站、電子商務網站方面;同時,評價指標與體系也是受到廣泛關注的重點內容。
圖3 網站評價研究的共詞網絡 研究主題之間的緊密程度方面,“政府網站”與“績效評估”之間的連線最粗,表明二者在網站評價研究中具有很強的關聯性。政府網站績效評估是績效評估理論在政府電子化建設進程中的具體應用,國內外有關評估機構和專家學者從不同方面、不同角度和不同視閾對政府門戶網站績效評估進行了縱深研究,形成了方興未艾的學術潮流[24]。
2.K-core分析
將原始共詞矩陣轉化為二元矩陣,并導入NetDraw。通過K-cores分析得到8個核心,為了方便展示與說明,將每個核心中的節點用不同形狀予以展現,詳見圖4。
圖4 網站評價研究主題的K-cores分析 35個圓形節點(K值=8)所代表的研究主題是研究網絡的核心主題,如政府網站、評價指標、評價體系等(由于節點數量多,故不一一列出);1個菱形節點(K值=7,節點為“網絡”);5個圓角正方形節點(K值=6,節點為“高校”、“教學網站”、“精品課程”、“評價模型”、“圖書館網站”),是次核心研究主題;5個倒三角形節點(K值=5);5個含有十字的正方形節點(K值=4);3個正三角形節點(K值=3,節點為“Web20”、“網站可用性”、“信用評價”),可以看作是介于核心與邊緣之間的研究主題;1個正方形節點(K值=2,節點為教學設計);2個十字形節點(K值=1,節點為“數據庫”、“數據挖掘”)是邊緣研究主題。
四、結論
筆者利用共詞分析方法(包括聚類分析、戰略坐標、社會網絡分析等)對中國網站評價研究主題的內外部結構和聯系進行了分析,得出如下結論。
之一,通過詞頻統計、戰略坐標、共詞圖譜以及K-cores分析發現,中國網站評價研究的熱點領域是電子政務(政府網站)評價、電子商務(網站)評價、評價指標與體系,尤其是政府網站與績效評估研究得到了極為廣泛的關注。
之二,目前中國網站評價研究中存在大量邊緣性研究領域,且尚不成熟,主要包括網站評價中的統計學方法應用、圖書館網絡數據庫評價、網站綜合評價、教學及專題學習網站評價、C2C信用評價、門戶網站與企業網站評價。
之三,網絡計量學方法(如網絡影響因子、鏈接分析等)在網站評價中的應用,雖然已經趨于形成相對穩定的研究范疇,但是仍處于研究網絡的邊緣,應當注重與其他主題研究相結合。
之四,網站評價標準及評價方法目前雖然得到了關注,但是研究主題內部松散,仍有很大的研究空間,是未來網站評價研究值得關注的領域之一。
基于共詞分析方法對網站評價研究進行分析,未來的研究可以考慮從時間縱向維度進行,全方位把握中國網站評價研究的發展歷史及研究的發展狀況。
參考文獻:
[1] 劉剛,婁策群.政府網站評價研究與應用分析[J].圖書情報知識, 2006(3):104-109.
[2] 張琳,徐莉莉.基于鏈接分析的企業網站評價指標的有效性分析[J].圖書情報工作,2010(16):86-89,129.
[3] 柯平,陳昊琳.圖書館網站評價的基本理論問題[J].國家圖書館學刊,2009(3):30-36.
[4] 段宇鋒,邱均平.中美大學網站評價的比較研究[J].中國圖書館學報,2005,31(5):22-28 .
[5] 解素芳,王朋,焦淑靜.基于信息構建的高校檔案館網站評價指標體系設計[J].檔案學通訊,2010 (6):53-56.
[6] 李先國,張茜.C2C綜合拍賣網站評價指標體系研究[J].管理世界,2009(5):178-179.
[7] 陳雅,鄭建明.網站評價指標體系研究[J].中國圖書館學報,2002,28(5):57-60 .
[8] 朱慶華,杜佳.國內外政府網站評價研究綜述[J].電子政務,2007(7):31-39.
[9] 張小栓,高明,張健.電子商務網站評價方法研究綜述[J].情報雜志,2007,26(6):2-5.
[10] 白銀,曹梅.國內教育網站評價研究概述[J].現代教育技術,2011,21(1):107-111.
[11] 賀婷婷,閆永君.國內外網站評價研究比較及分析[J]. 圖書與情報,2006(3):28-33.
[12] CAMBROSIO A,LIMOGES C,COURTIAL J P.Historical scientometricsmapping over 70 years of biological safety research with coword analysis [J].Scientometrics,1993,27(2):119-143.
[13] DING Y,CHOWDHURY G G,FOO S.Bibliometric cartography of information retrieval research by using coword analysis[J].Information Processing Management,2001,37(6):817-842.
[14] AN X Y,WU Q Q.Co-word analysis of the trends in stem cells field based on subject heading weighting [J].Scientometrics,2011,88(1):133-144.
[15] RITZHAUPT A D,STEWART,M,SMITH P.An investigation of distance education in North American research literature using coword analysis[J].International Review of Research in Open and Distance Learning,2010,11(1):37-60.
[16] MILOJEVIC S,SUGIMOTO C R,YAN E J.The cognitive structure of Library and Information Science:Analysis of article title words[J].Journal of the American Society for Information Science and Technology,2011,62(10):1933-1953.
[17] LAW J,BAUIN S,COURTIAL J P.Policy and the mapping of scientific change:a coword analysis of research into environmental acidification[J].Scientometrics,1988,14(3/4):251-264.
[18] 馬費成,望俊成,張于濤.國內生命周期理論研究知識圖譜繪制——基于戰略坐標圖和概念網絡分析法[J].情報科學,2010,28(4):481-487,506.
[19] CALLON M,COURTIAL J P ,LAVILLE F.Coword analysis as a tool for describing the network of interaction between basic and technological research:The case of polymer chemistry[J].Scientometrics,1991,22(1):155-205.
[20] BAUIN S,MICHDET B,SCHWEIGHOFFER M G.Using bibliometrics in strategic analysis:understanding chemical reactions at the CNRS[J].Scientometrics,1991,22(1):113-137.
[21] 崔雷,楊穎,王孝寧.重點學科發展戰略情報研究(二)[J].情報理論與實踐,2009(7):29-31.
[22] NEFF M W,CORLEY E A.35 years and 160,000 articles:A bibliometric exploration of the evolution of ecology[J].Scientometrics,2009,80(3):657-682.
[23] 邱均平,丁敬達,周春雷.1999-2008年我國圖書館學研究的實證分析(上)[J].中國圖書館學報,2009(5):72-79.
[24] 徐衛.政府門戶網站績效評估:意義、研究現狀與趨勢[J].上海行政學院學報,2009,10 (5):28-37.
(責任編輯 彭建國)