摘 要:利用SPSS軟件,對CNKI數據庫中關于物聯網技術的的期刊文獻進行共詞分析。并借助聚類分析與多維尺度分析功能,研究各關鍵詞之間的關系,從而為以后相關內容的進一步研究提供借鑒。
關鍵詞:物聯網;共詞分析;聚類分析;SPSS
中圖分類號:G353.1;F203 文獻標識碼:A 文章編號:1674-7712 (2013) 18-0000-01
一、引言
2009年“物聯網”在世界范圍內獲得了前所未有的關注度,它被稱為繼計算機、互聯網與移動通信網絡之后的又一次信息產業革命。物聯網產品的應用將大大提高資源配置的合理性,確保生產質量,實現高效、有序的流通,加快調整物聯網產業結構,促進了國民經濟的快速發展。筆者嘗試以CNKI數據庫中的期刊論文為基礎,以物聯網為關鍵詞進行搜索,將獲得的文獻信息選取1000多篇采用共詞分析及可視方法進行分析,得出了一些結論。共詞分析法屬于內容分析法的一種,主要是對能表達某一學科領域內研究主題或研究方向的專業術語共同出現在同一篇文獻中的情況的分析,兩個專業術語的共現次數越高,則這兩個詞的關系越緊密,以展現該物聯網領域的發展現狀及研究熱點。
二、數據的獲取與預處理
(一)數據的采集以及分析
1.采集數據
樣本數據來自中國知網數據庫(CNKI)期刊全文庫,以關鍵詞“物聯網”為檢索策略,得到有效論文1330篇。從而對文獻的“SrcDatabase-來源庫”,“Title-題名”,“Author-作者”,“Source-文獻來源”,“Keyword-關鍵詞”,“Summary-摘要:”6個字段進行分析。
2.分析方法
共詞分析方法的主要原理是對一組詞兩兩統計它們在同一篇文獻中出現的次數,以此為基礎對這些詞進行數學化分析,從而反映出這些詞間的親疏關系,進而分析這些詞所代表的學科和主題的結構變化。其分析的第一步就是從相關文獻數據庫中抽取關鍵詞或主題詞,一般是出現頻次超過一定閾值,并且能夠代表該學科研究方向的高頻詞。其次,兩兩統計這些高頻詞在同一篇文章中同時出現的次數,形成共詞矩陣。最后圍繞著這個共詞矩陣進行分析。共詞分析法利用文獻集中詞匯對或名詞短語共同出現的情況,來確定該文獻集所代表學科中各主題之間的關系。一般認為詞匯對在同一篇文獻中出現的次數越多,則代表這兩個主題的關系越緊密。
(二)分析過程
1.統計高頻關鍵詞以及對高頻關鍵詞的預處理
使用BICOMB提取關鍵詞,得到關鍵詞共計1540個。對其進行統計,并生成共詞矩陣(借助BICOMB的統計功能進行詞頻統計處理,從中選擇出詞頻不小于10次的關鍵詞,從而確定了共有27個高頻關鍵詞作為共詞分析的基礎)。
2.構造相異矩陣
形成共詞矩陣后,為了消除頻次懸殊造成的影響,筆者用 Ochiia系數將共詞矩陣轉換成相關矩陣。Ochiia系數等于A、B兩詞同時出現的次數除以A、B兩詞方根的乘積,即將共詞矩陣中的每個數字都除以與之相關的兩個詞總頻次開方的乘積,對角線上的數字表示某詞自身的相關程度,經過上述公式計算均為1,由于相關矩陣中0值過多,統計時容易造成誤差過大,為了方便進一步處理,用“1”與全部相關矩陣上的數據相減,得到表示兩詞間相異程度的相異矩陣。
3.共詞聚類分析
將上述相異矩陣導入SPSS軟件中,采用聚類分析中的系統聚類法進行聚類分析,最后生成凝聚狀態表和與之對應的樹狀圖,由此可以推斷出高物聯網論文內容的研究熱點。在凝聚狀態表中,第一列表示聚類分析的第幾步;第二、三列表示本步聚類中哪兩個樣本或小類聚成一類;第四列是個體距離或小類距離;第五、六列表示本步聚類中參與聚類的是個體還是小類,0表示樣本,非0由第幾步聚類生成的小類參與本步聚類;七列表示本步聚類的結果將在以下第幾步中用到。
樹狀以躺倒樹的形式展現了聚類分析中的每一次類合并的情況。SPSS軟件自動將各類間的距離映射到0至27之間,并將凝聚過程近似地表現在圖上。在分類閾值約為24的水平上共聚為6個大類,具體聚類結果如下:
第一個類團:包括11,16,27,28,22,19號關鍵詞,對應EPC,供應鏈,信息化,對策,物流,物聯網技術。
第二個類團:包括8、24號關鍵詞,對應應用,供應鏈管理。
第三個類團:包括6,7,2,17,21,5號關鍵詞,對應傳感器,傳感器網絡,射頻識別,產業鏈,商業模式,互聯網。
第四個類團:包括10,12,4,20,24,1號關鍵字,對應關鍵技術,體系結構,傳感網,泛在網,智慧地球。
第五個類團:包括3,23號關鍵詞,對應云計算,智能電網。
第六個類團:包括18,25,14,14,9號關鍵字,對應ZigBee,智能家居,RFID技術,電子標簽,無線傳感器網絡。第15號關鍵詞信息安全在本次聚類中未被歸入任何類團。
三、結論
結合高頻關鍵詞和共詞聚類的樹狀圖結果,并對其共現的文獻進行深入分析,可以初步揭示近期對物聯網的熱點研究主要集中在物聯網的關鍵技術,物聯網外在設備,以及物聯網的體系結構等方面。
參考文獻:
[1]鐘偉金,李佳,楊興菊.共詞分析法研究(三)——共詞聚類分析法的原理與特點[J].情報雜志,2008,7:118-120.
[2]郭春俠,葉繼元.基于共詞分析的國外圖書情報學研究熱點[J].圖書情報工作,2011,55(20):19-22.
[3]李長玲,翟雪梅.我國情報學碩士學位論文的共詞聚類分析[J].情報科學,2008,1:73-76.
[作者簡介]黃歡歡(1987.10.15-),女,河北藁城市人,中央財經大學學生,碩士,研究方向:信息經濟。