張曼曼 張丹 朱光亞 何雨
[摘 要] 情報學是一門新興的綜合性學科,在信息化發展的社會中其發揮的作用日益突出。以CNKI為數據源,以2010-2014年發表的情報學領域的文獻為研究對象,以共詞分析法為理論依據,以SPSS19.0為分析工具,研究了近5年來情報學領域的研究熱點及演進趨勢。經研究分析歸納出情報學領域的四大研究熱點:基礎理論研究、社會網絡分析法研究、共詞分析法研究、文獻計量學研究。并預測情報學未來的研究方向是以理論研究為主、圖書館學研究和定量的分析法。
[關鍵詞] 情報學;研究熱點;演進趨勢;分析
[中圖分類號] F79 [文獻標識碼] B
一、引言
隨著信息化社會的到來,情報學已經滲透到我們的生活中,其社會重要性日益增強。情報學的研究熱點隨社會的不斷發展而變化,因此對其研究熱點及演進趨勢的分析,有利于我們了解情報學領域的關注重點及其未來的發展方向。詞頻分析法能夠利用文獻關鍵詞或者主題詞在某一研究領域文獻中出現的頻次高低來確定該領域的研究熱點及發展方向。本論文即采用共詞分析法來探析近五年來情報學領域的研究熱點及其演進趨勢,為科研人員選擇研究課題提供借鑒方向。
二、數據收集和整理
(一)原始文獻的選定
本研究的文獻源于CNKI數據庫,檢索主題為“情報學”,年限為“2010.1-2014.12”,期刊為“《情報學報》、《情報科學》、《情報雜志》、《情報理論與實踐》、《情報資料工作》”。結果得到397篇文獻,去除如無著者的,主要包括征稿啟事﹑來稿須知等,經整理之后共得到文獻數321篇。將其按作者、題名、文獻來源、年份、關鍵詞順序導出到excle表格中。
(二)高頻關鍵詞的選定
一篇論文的關鍵詞能夠大致反映出該論文的研究內容及其研究方法,是整篇文章的縮影。同樣一個研究領域文獻的高頻關鍵詞在一定程度上能夠折射出本領域的研究熱點及發展趨勢。基于此本研究將原始文獻表中的關鍵詞列復制到一張新表中,對其進行處理:一是對其進行分列處理,將所有列的關鍵詞合并為一列,即A列,共得到有效關鍵詞1406個,刪除一些與本研究無關的非實質性的關鍵詞,如創新﹑分析﹑內涵等。處理后共得到關鍵詞1329個;二是將A列復制到B列,并對B列的關鍵詞刪除重復項,共得到612個單一關鍵詞。用COUNTIF函數計算B列關鍵詞在A列中出現的次數,即C列。將C列的詞頻按照降序排列,選取頻次大于10的關鍵詞,一共是14個,繪制高頻關鍵詞表。
三、情報學領域研究熱點分析
(一)構造高頻關鍵詞矩陣
高頻關鍵詞表中“情報學”出現的頻次最高,但是其與本研究的內容完全重合,故舍棄;圖書情報學與圖書館學情報學的意義相同,故將它們合并為圖書情報學。在此基礎上共計得到12個高頻詞作為共詞分析的原始數據。
將這12個高頻關鍵詞進行兩兩組合,統計出它們同時出現在一篇文獻中的次數,形成共詞矩陣。該矩陣為對角矩陣,對角線上的數字代表任一關鍵詞自身出現的頻次,非對角線上的數字代表兩個關鍵詞同時出現的次數。為了更清晰地表示關鍵詞之間的關系,我們將用Ochiia系數計算關鍵詞相似矩陣,“Ochiia系數等于AB兩詞共同出現的頻次除以AB各頻次乘積的開方[1]。”“此相關矩陣中0值太多,以后做統計分析時容易造成較大誤差,因此為了方便統計,將相似矩陣轉化為相異矩陣,即用1與相似矩陣中所有值相減[1]。”
(二)因子分析
因子分析簡單地說就是用少數幾個因子來描述原始多個變量因子之間的聯系,能反映原始資料的大部分信息。“因子分析有以下5個特點:提取的因子個數小于原有變量數;因子可代替原有變量參與數據建模,減少了計算量;因子能夠反映原有變量的大部分信息;因子之間的線性關系不顯著;因子具有命名解釋性[2]。”
本研究用SPSS19.0對共詞矩陣進行因子分析,具體操作步驟為:將高頻關鍵詞的相異矩陣導入到SPSS19.0中,選擇分析——降維——因子分析,在出現的對話框中把左邊的所有要分析的變量選入右邊變量處,依次按照提示設置分析內容及方法,即描述統計﹑抽取(本次采用主成分抽取法并且特征值大于1)、旋轉(最大方差法)、得分、選項。最后點擊確定即可生成因子分析的各類圖表。
相關系數矩陣圖中多數高頻關鍵詞的相關系數較高,并且每個變量都具有較強的線性關系,因此我們能夠從中提取公共因子,進行因子分析。
1.提取公因子
本研究采用的是主成分分析法提取公因子,并要求選取的因子特征根大于1。
公因子方差表中多數因子的方差都比較高,說明這些因子能夠反映原始變量的大部分信息,如引文分析的因子方差為86.9%,說明提取的公因子對關鍵詞引文分析的方差作出了86.9%的貢獻,表明原有矩陣轉化為公因子矩陣后保留了原始數據的大部分信息,因此因子分析的效果整體比較好。因子變量的總方差圖中旋轉后的公因子累計方差貢獻率為63.078%,表明公因子能夠涵蓋原有變量63.078%的信息,信息丟失較少。碎石圖清晰地描述了因子特征值的變化情況,圖中前四個因子特征值的變化較為明顯并且都大于1,之后因子特征值的變化趨于平緩。根據以上分析,我們將提取的公因子數定為四個。
2.因子的命名解釋
因子載荷矩陣表示的是提取的公因子對原有變量的解釋比例,該矩陣中公因子變量在多數變量上都有較高的載荷值,所以公因子代表的含義就比較模糊,故我們按照方差極大法對因子載荷矩陣進行旋轉,旋轉后的每個公因子的含義大致清晰,因子1基本反映了研究熱點、知識圖譜、共詞分析;因子2基本反映了圖書館學、文獻計量學、核心期刊;因子3基本反映了社會網絡分析、合著研究;因子4基本反映了被引分析、圖書情報學、引文分析。這些因子的關鍵詞代表了他們的研究內容概況,可以用來總結出情報學研究領域的幾個主要部分及其相互關系。endprint
(三)聚類分析
聚類分析是研究“物以類聚”這類問題的一種有效方法,“它的實質是建立一種分類方法,將一批樣本數據按照它們在性質上的親密程度在沒有先驗知識的情況下自動進行分類,同類間較為相似,不同類之間區別較大[3]。”具體操作步驟為:一是將相異矩陣導入SPSS19.0中,選擇分析——分類——系統聚類(即是層次聚類);二是將所有變量選擇到右邊的變量列表中,依次設置聚類分析的選項,包括統計量﹑繪制﹑方法,輸出內容為統計量和圖。
生成的聚類表中第一列表示聚類分析的第幾步;第二、三列表示本步聚類中哪兩個變量或者小類聚為一類;第四列表示變量距離或者小類距離;第五﹑六列表示本步聚類中參與的是變量還是小類,0表示變量,非0表示由第幾步聚類生成的小類參與本步聚類;第七列表示本步聚類結果將在以下第幾步中用到。如:首先進行合并的是第九和第十二個變量,他們之間的相關系數為0.886,此聚類結果將在以下第四步聚類中用到。
樹狀圖更加客觀清晰地展現了聚類分析中每一次類合并的情況,首先合并為一類的是研究熱點和知識圖譜,依次按照距離大小合并為一類的是圖書館學和文獻計量學,圖書情報學和被引分析,合著網絡和社會網絡分析,各變量合并之后,就是變量與小類及小類與小類之間的合并,最終所有小類合并為一類,此時類間的距離已經非常大了。
(四)多維尺度分析
“多維尺度分析和因子分析一樣都是
降維分析,在多維尺度分析中,各數據點在空間中的位置是分析解釋的重要內容,聚類分析可以確定組別,但是無法在空間中標出觀測值,因此可以用多維尺度分析對聚類分析進行補充說明[4]。”具體操作步驟為:將相異矩陣導入SPSS19.0中,選擇分析——度量——多維尺度;將所有變量選擇到右邊的變量列表中,對模型,選項依次進行設置。
二維圖中這12個變量分布于四個象限,大致分為四類:研究熱點﹑知識圖譜﹑共詞分析;圖書館學﹑文獻計量學﹑核心期刊;社會網絡分析﹑合著研究;被引分析﹑圖書情報學﹑引文分析。需要指出的是理論研究這個因子,其與其他因子間幾乎沒有任何關系,自行一類,結合原始的數據表可以發現基礎理論研究與情報學聯系最為緊密,共現的頻次也較高,由于數據處理時將情報學舍棄,故而導致理論研究成為孤立的一個關鍵詞。為整體研究的合理性,將在下文研究熱點及趨勢的分析中添加上情報學理論研究。
經以上研究本文將情報學領域的研究熱點分為以下四類,一是基礎理論研究。理論研究是其學科確立的根本,5年來,情報學基礎理論研究成果不斷豐富。二是社會網絡分析法研究。社會網絡分析法通過定量分析方法,擴散到社會的各個領域中,目前合著網絡的研究是情報學領域的研究熱點。三是共詞分析法研究。共詞分析法屬于內容分析法的一種,其原理為統計一組詞兩兩出現在一篇文獻中的次數,對其進行聚類等分析,得到研究領域的主題。四是文獻計量學研究。引文分析及被引分析都屬于文獻計量分析法,引文分析一直以來都是文獻計量學方法的一個重要研究方向,隨著計算機網絡的快速發展,為其提供了可視化支持,使研究結果更加科學直觀。
四、情報學領域演進趨勢探析
結合以上研究熱點的分析及計算機網絡的發展,本文預測情報學未來的研究方向。一是以理論研究為主。理論是實踐的基礎,對理論的深入研究能夠促進該學科的長久發展。因此廣大情報學工作者重視對情報學理論的研究,并且有的學者將其他領域的理論知識與情報學相結合,使得情報學的內容更加豐富。二是圖書館學研究。圖書館學一直以來都是情報學研究的重點內容之一,從高頻關鍵詞表可以看出,其居于第三位。基于此可以預測圖書情報研究依然是未來情報學研究的熱點。三是定量的分析法。無論是文獻計量法還是社會網絡分析法都是定量研究法,當前隨著計算機網絡的發展,越來越多的分析軟件被廣泛應用于情報學的研究之中,鑒于此定量的研究方法與計算機技術的結合必將成為日后研究人員的主要科研領域。
[參 考 文 獻]
[1]劉濤.關于我國圖書館學研究熱點分析[D].東北師范大學,2012
[2]余建英,何旭紅.數據統計分析與SPSS應用[M].北京:人民郵電出版社,2003
[3]邱均平,呂紅.近五年國際圖書情報學研究熱點、前沿及其知識基礎——基于17種外文期刊知識圖譜的可視化分析[J].圖書情報知識,2013(3):4-15+58
[4]儲節旺,郭春俠.共詞分析法的基本原理及EXCEL實現[J].情報科學,2011(6):931-934
[責任編輯:王鳳娟]endprint