,,
信息作為重要的資源,其所具有的價值性、依附性、時效性和分享性對人類有著特別重要的意義。為了能夠最大限度滿足廣大用戶對信息的需求,并有效地改善信息系統部門對信息的宏觀調控,實現信息的價值,對用戶信息行為進行深入研究,清晰地了解用戶信息行為的模式、特點,為用戶提供針對性的信息服務,顯得尤為重要,信息行為通常是指用戶對特定信息的獲取、查詢、交流、加工及利用等一系列的表現行為。近些年來,從國內關于信息行為研究的具有參考價值的論文成果中可以發現,對信息行為的研究輻射到不同學科。主要研究的學科包括以下幾類。在教育學科中,學者重點關注對不同人群在網絡環境下的信息需求、檢索、查詢利用及個性化服務,尤其是高校教師[1]和大學生群體[2];在圖書情報學[3-4]學科中對信息行為的主題研究側重于為了滿足圖書館用戶對信息需求的一系列行為,包括信息瀏覽、咨詢、服務等。
本文以2006-2016年中國知網、萬方及維普數據庫中對信息行為相關研究的中文期刊文獻中1 266條有效題錄為對象,用文獻調研和共詞聚類分析相結合的方法對主題進行分析,探測信息行為領域的研究熱點,更好地了解近些年國內信息行為研究的熱點主題。
以中國知網CNKI學術網絡出版社總庫、萬方數據知識服務平臺、維普中文科技期刊數據庫為數據源,檢索2006-2016年間與信息行為相關中文期刊文獻。在知網和萬方數據庫中使用檢索式“between(2006-01-01,2016-12-31)and 主題=信息行為 and (精確匹配)”,檢索相關文獻量分別為3 501篇和1 424篇;在維普中文科技期刊數據庫按檢索式“題目或關鍵詞=信息行為 并且 年份=2006-2016”檢出相關文獻量2 802篇。將來自以上3個數據庫來源的相關7 727條期刊文獻題錄(含重復記錄)導入文獻檢索與管理系統軟件Note Express中,利用“查找重復題錄”功能去重并通過人工判讀,刪除不相關文獻。最終得到信息行為相關的研究文獻題錄1 266條。
主要運用了共詞聚類分析和文獻調研法,并將分析結果可視化。
1.2.1 共詞聚類分析
即采用聚類的計算方法將文章中共現的詞對(主題詞或關鍵詞)的關聯性進行運算,將關系密切的詞聚集歸類,從而達到挖掘隱含信息的目的[5]。本文借助統計軟件SPSS 22.0對信息行為相關文獻中高頻關鍵詞進行聚類。通過聚類分析圖,揭示2006-2016年來信息行為的研究熱點。
1.2.2 文獻調研法
借助網絡資源,以“信息行為”為關鍵詞,通過大量研究學習國內信息行為有關文獻,利用文獻綜述對信息行為的研究熱點主題逐一深刻解析。
借助書目共現分析系統 Bicomb 2.0 對1 266條信息行為相關文獻題錄進行數據清洗、統計和共現矩陣的構建。
將1266條記錄從Note Express中以文本格式導出,然后導入Bicomb 2.0進行數據清洗,主要包括同義詞合并、統一大小寫、刪除無效數字和字符等操作,以確保數據的有效性和準確性。
即對文獻中字段數據進行統計。主要操作步驟: 在Bicomb 2.0中對所有字段數據進行統計匯總后,將統計數據全部或部分導出到Microsoft Excel 格式的文件中,方便以下的共詞聚類分析。
借助于Bicomb 2.0 構建矩陣,根據關鍵詞是否被對應來源文獻所引用,選取共現次數大于一定閾值的關鍵詞,構建出關鍵詞詞篇矩陣并以.txt格式導出。
對所構建的關鍵詞詞篇矩陣進行聚類分析,以探明信息行為研究領域的主要研究主題和結構。
首先利用SPSS 22.0的聚類分析功能將信息行為研究領域的高頻關鍵詞視為選取指標,以判斷是否適合做因子分析所具備的結構效度,以便為之后的聚類提供科學的依據。其次進行聚類,并在每個生成的類團關鍵詞粘合度值計算結果的基礎上確定每個類團的主題。最后結合原始文獻對每個主題的研究內容進行詳細分析。
3.1.1 關鍵詞聚類
3.1.1.1 選取高頻關鍵詞
Bicomb統計的信息行為相關研究文獻中關鍵詞共有2 557個。去掉高頻關鍵詞“信息行為”及類似“研究”“分析”等一些對揭示主題內容無意義的關鍵詞,截取其中頻次≥10的49個關鍵詞(表1)為該領域的高頻關鍵詞,對其在每篇文獻中出現情況進行統計,生成形成如表2所示的49*49的高頻關鍵詞詞篇矩陣。
其中,行為高頻關鍵詞列為每篇文獻記錄的號碼(在表2中為2、4、5、10、11);矩陣中的數字(“0”和“1”)代表高頻關鍵詞在對應的文獻是否出現,若出現則用“1”表示;否則,用“0”表示。

表1 高頻關鍵詞詞頻列表(前20個)

表2 高頻關鍵詞詞篇矩陣(部分)
3.1.1.2 關鍵詞因子分析
因子分析要達到的目標是用盡可能少的因子去描述眾多的指標或因素之間的聯系,其基本思想是根據關鍵詞之間的相關性大小把研究對象的變量分組使同組內變量之間的相關性較高,而不同組的變量相關性較低。
本文運用“主成分分析法”首先對高頻關鍵詞數據進行KMOS檢驗和Bartlett球形檢驗,以判斷選取指標是否具有結構效度并是否適合進行因子分析。如果KMO檢驗的值>0.5,且Bartlett球形檢驗的選項中,顯著性值<0.05,則說明選用的數據指標結構效度適宜做因子分析。其次,將高頻關鍵詞詞篇矩陣導入SPSS 22.0中,采用因子分析功能,抽取49個高頻關鍵詞數據指標并以協方差矩陣分析方法進行KMOS檢驗和Bartlett球形檢驗,檢驗結果見表3。由表3可見:KMO值為0.501,大于0.5;Bartlett球形檢驗中顯著性值為0.000,小于0.05。由此可見,對信息行為主題研究的高頻關鍵詞采用因子分析的條件全部具備。最后,利用SPSS 22.0計算得出的各指標相關矩陣特征值和方差累積貢獻率見表4,表中顯示12個因子的累積方差貢獻率約為61.473%,說明將49個高頻關鍵詞分為12類,,可以充分解釋國內信息行為相關研究的61.473%的信息。

表3 KMO檢驗和Bartlett球形檢驗結果

表4 名指標相關矩陣特征值和方差累積貢獻率
注:提取方法為主成分分析。
3.1.1.3 關鍵詞聚類
把高頻關鍵詞詞篇矩陣導入SPSS 22.0,將49個高頻關鍵詞采用組間平均聯接方法和ochiai系數構造相似矩陣,設定聚類數目為12類,得到聚類結果。將聚類結果中的聚類樹狀結構圖與聚類類目成員列表信息綜合,得到圖1所示的聚類樹及類目成員圖譜。
圖1中,0~25表示各類之間的距離,距離的大小反映著各高頻關鍵詞之間聯系的緊密程度,距離越近,聯系越緊密。

圖1 基于SPSS的關鍵詞聚類樹及類團成員圖譜分析
3.1.2 各類團研究主題的確定
①依據技能型人才培養方案及目標、臨床工作崗位能力需求,以臨床崗位工作過程為導向,確定教學大綱,將教學內容整合成14個工作任務領域、43項典型工作任務及完成相應任務應具備的職業核心能力。如入院護理工作任務領域包括實施入院護理、病人運送、生命體征觀察及護理技術、醫療與護理文件書寫、標本采集技術5項典型工作任務,每項工作任務又對應不同職業核心能力。②將教學內容基于工作過程和認知規律轉化為臨床情景,并將每個臨床情境分解為以工作任務為中心的教學單元,確定包含知識、技能、態度在內的三維教學目標。
3.1.2.1 關鍵詞粘合度
關鍵詞粘合度是用來衡量類團內各關鍵詞對聚類成團的貢獻程度,表達每個主題在類團的聚集過程中所起作用的程度。在類團中,粘合力最大的關鍵詞被稱為中心詞,中心詞在確定類團主題中起著至關重要的作用,能夠表達某一類團的核心概念。本文采用了鐘偉金[5]對類團中心詞的粘合度計算方法:
其中,N(Ai)表示關鍵詞Ai的粘合度,F(Ai→Bj)表示關鍵詞Ai與同一類團中其余關鍵詞的共現頻次。
3.1.2.2 各類團的研究主題
以類團D為例,列出該類團中關鍵詞粘合度的計算結果(表5),其余類團按照相同的原理計算類團中關鍵詞的粘合度并總結其核心研究主題。

表5 類團中關鍵詞粘合度值列表(類團D)
根據表5中類團D各個關鍵詞的粘合度值大小順序可以判斷出,此類團所研究的主要主題是信息查詢行為。
3.1.3 研究主題內容分析
按照以上方法,確定其他類團的核心概念,最終分析得出類團A-L的研究主題依次為:信息素養、Web 2.0環境下的信息檢索與信息交流行為、移動互聯網用戶的信息行為、信息查詢行為、網絡信息行為、用戶信息行為、大數據時代下的圖書館、圖書館信息服務、信息行為模型、信息行為影響因素、信息共享、信息傳播。對每個主題內容詳細分析如下。
類團A包含的關鍵詞按其粘合力大小依次為信息素養、大學生、信息能力和問卷調查。信息素養是指合理合法借助信息工具,對信息進行獲取檢索、評價判斷、協作交流、加工處理、發揮效益、生成創造信息的能力[6]。評價個體信息素養水平的高低可通過以信息檢索、信息獲取、信息識別和信息利用為核心的信息行為能力來體現,同時,了解個體信息行為的現狀、特點、規律以及影響因素等,可為改進信息素養培養模式和提高個體信息素養水平提供決策依據。對大學生信息素養的培養是當前高等學校教育的基本內容之一,大學生群體是該主題的主要對象之一。
3.1.3.2 類團B: Web2.0環境下的信息檢索與信息交流行為
類團B包含的關鍵詞按其粘合力大小依次為信息檢索、信息檢索行為、用戶行為、Web2.0、消費者、信息交流、信息和互聯網。以Blog、RSS、標簽等為代表的Web2.0技術的應用,使用戶可以通過信息關注、檢索式定制、訂閱等便捷和個性化的方式高效地檢索到所需要的網絡信息資源,并可實現與網站和其他網絡用戶的信息互動,增加信息資源獲取渠道。該主題研究以Web2.0環境下用戶的信息檢索行為與網絡社區用戶的非正式信息交流行為的模型、現狀特點、不同背景人群的差異為主要內容,以推動網絡信息資源管理系統和網絡社區服務的發展,提高網絡信息資源的利用效率。
3.1.3.3 類團C: 移動互聯網用戶的信息行為
類團C包含的關鍵詞按其粘合力大小依次為移動互聯網、實證研究。隨著移動互聯網的發展,智能手機、掌上電腦等移動終端的廣泛應用,我國的移動互聯網用戶數量越來越龐大。數字圖書館、移動圖書館、圖書館微信平臺已經成為用戶獲取圖書館資源和服務的主要方式,研究移動互聯網用戶訪問、檢索、獲取、利用和交流信息的行為已經成為新媒體形式下信息行為領域研究的主要內容。現有研究多采用實證研究的方法分析用戶的信息需求、信息行為特點、模式等,為更好地開展信息服務提供依據。
3.1.3.4 類團D:信息查詢行為
類團D包含的關鍵詞按其粘合力大小依次為信息查詢、高校教師、信息利用、農民。信息查詢是為了解決并完成信息內容需求任務中自我定位的各種獲取信息活動行為,而信息檢索最常見的獲取信息活動行為類型之一,其主要是指信息用戶在對計算機情報檢索系統檢索時的各種行為。該類團以高校教師和農民為實證調查研究對象,通過對其信息查詢的途徑、渠道、方式等方面進行分析研究,為提高用戶的信息查詢能力提出可行性的建議。系統地調查農民日常生活信息的查詢行為,可以為相關政府部門和信息服務機構提供改進信息服務的建議。
3.1.3.5 類團E:網絡信息行為
該類團以網絡環境為背景,研究大學生相關的信息行為,尤其是網絡信息搜索行為。該類團側重研究的是信息搜索行為中信息查詢行為和信息瀏覽行為。通過分析用戶網絡信息搜索行為的特征,就影響用戶網絡信息搜索行為的相關因素展開基礎性研究,并針對性地提出一些合理地建議。
3.1.3.6 類團F:用戶信息行為
類團F包含的關鍵詞按其粘合力大小依次為用戶研究、網絡用戶。該類團主要是通過問卷調查法、文獻調查法、文獻計量法等方法對網絡用戶的信息行為進行理論和實踐的框架性研究。網絡用戶作為信息用戶重要組成部分,學者們對其研究涉及到不同類型的信息用戶群體信息行為。
3.1.3.7 類團G: 大數據時代下的圖書館
類團G包含的關鍵詞按其粘合力大小依次為圖書館、大數據、微信。該類團主要研究大數據在圖書館中的應用。隨著網絡信息技術的空前發展,大數據是繼云計算、移動互聯網之后新產生的網絡信息數據。在網絡化數字化和海量信息的雙重沖擊下,圖書館也面臨著新的挑戰和機遇。
3.1.3.8 類團H:圖書館信息服務
類團H包含的關鍵詞按其粘合力大小依次為信息服務、信息需求、用戶、高校圖書館、數字圖書館、網絡環境、信息資源、信息環境、信息時代、用戶需求、信息技術、信息組織和信息系統。該類團側重高校圖書館基于用戶信息行為的信息服務研究,通過分析數字環境下用戶對信息資源的訪問、檢索、瀏覽、下載等行為,了解用戶對信息資源和服務方式的需求,旨在為用戶提供更好的信息服務。研究內容包用戶信息需求、信息服務模式、信息技術等。
3.1.3.9 類團I:信息行為模型
類團I包含的關鍵詞按其粘合力大小依次為信息行為模型、模型。盡管在信息行為科學領域研究中,信息行為模型相關的文獻量較少,但在文獻記錄中顯示對它的研究起步較早且從未中斷。該類團通過對用戶信息行為中的查詢、選擇、交流、利用等方面進行分析研究,構建適合不同領域的用戶信息行為模型,提出提升用戶信息行為的策略。但至今為止,卻沒有一個通用的信息行為模型符合所有領域用戶信息行為研究的需求,研究還不夠成熟。
3.1.3.10 類團J:信息行為影響因素
類團J包含的關鍵詞按其粘合力大小依次為影響因素、信息查詢行為、健康信息、個性化服務。該類團主要研究影響健康信息的查詢行為因素,健康信息查詢行為的影響因素主要包括從查詢動機、獲取途徑等方面進行分析;為提高用戶對健康信息的查詢能力以及個性化服務水平提出可行性的建議。
3.1.3.11 類團K: 信息共享
類團K包含的關鍵詞按其粘合力大小依次為信息共享、虛擬社區、研究方法。該類團主要研究基于不同研究方法與視角的虛擬社區信息共享行為,如基于信息生態視角、社會認知理論視角等,以此提高公共信息服務水平。
3.1.3.12 類團L:信息傳播
類團L包含的關鍵詞按其粘合力大小依次為微博、信息傳播、信息尋求行為。該類團以微博這種較流行的信息傳播載體為研究對象,通過實證研究分析其對用戶信息傳播行為的影響,并提出提高信息傳播效率的有效建議。
通過上述共詞聚類分析及研究熱點主題的解析,發現國內信息行為研究和科研合作分析存在著研究對象多樣化、研究主題分散化、研究熱度均衡化等特征。
3.2.1 研究對象多樣化
國內信息行為研究和科研分析的對象包括圖書館、高校圖書館、大學生、數字圖書館、網絡用戶、微博及高校教師等。由前20個高頻關鍵詞詞頻列表(表1)可知,“圖書館”出現頻次最高,為78次,“高校圖書館”“大學生”“數字圖書館”“網絡用戶”和“微博”其頻次排序僅次其后,“高校教師”出現頻次最低,為17次。在每個熱點研究主題中,所圍繞的研究對象不同,其研究主題也就有所不同。因此,信息行為研究熱點的對象存在著多樣化的特征。
3.2.2 研究主題分散化
由表4可知,對49個成分進行提取,各成分方差均小,說明關鍵詞之間存在著較強的獨立性。同時,通過聚類分析所得的12個研究熱點主題,均有各自的獨立研究主題內容,主題之間的關聯度較低。因此,信息行為研究熱點的主題呈現分散化的特征。
3.2.3 研究熱度均衡化
信息行為的研究熱點主題中,均存在著高頻關鍵詞排序中靠前和靠后的關鍵詞,說明各研究的熱點相近,沒有明顯或特別地集中在一個主題中。因此,信息行為研究熱點的熱度存在著均衡化特征。
通過對信息行為主題研究高頻關鍵詞聚類和計算各類團主題關鍵詞粘合度值發現,目前國內信息行為研究主題集中在信息素養、網絡信息行為、信息行為模型、信息傳播、圖書館信息服務等12個方面。此外,利用資料與文獻綜述對信息行為的研究熱點主題進行逐一深刻的解析,以了解其最新的研究成果。根據共詞聚類和研究熱點分析,發現國內信息行為研究熱點分析存在著研究對象多樣化、研究主題分散化、研究熱度均衡化等特征。
本文對2006-2016年國內數字化資源有效文獻的分析結果,有助于了解近11年國內信息行為研究現狀,且對該領域今后的研究發展具有重要的借鑒意義與參考價值。不足之處是本文分析了國內數字化資源,研究結論可能存在一定的局限性,今后將進一步分析國外相同時間段的研究文獻,以便全面更好地了解中外信息行為研究的不同和進展。