【摘要】以2002-2011年我國圖情領域關于用戶研究的文獻為對象,從關鍵詞共現分析、聚類分析、社會網絡分析等幾個方面對文獻中的高頻關鍵詞進行定量研究,并將其歸類為六大主題。
【關鍵詞】用戶 共詞分析 社會網絡分析 主題歸類 核心主題
引言
隨著信息化和網絡化時代的來臨,人們的信息交流日益頻繁,信息用戶日漸龐大。對用戶進行研究已成為我國圖情領域研究的前沿和熱點,其研究成果可以為信息服務機構開展以用戶為中心的服務提供依據。在這一趨勢的引領下,圖情界同仁迫切希望了解近10年來關于用戶研究的熱點領域和動態信息,為未來完善用戶研究提供有用的借鑒。因此,筆者采用共詞分析法和社會網絡分析法對2002-2011年我國圖情領域關于用戶研究文獻中的高頻關鍵詞進行分析,以揭示用戶研究的主題,把握其發展趨勢。
共詞分析法主要是利用文獻集中關鍵詞對共同出現的情況來確定該文獻集所代表學科中各主題之間的關系。一般做法是統計一組文獻的關鍵詞兩兩之間在同一篇文獻中出現的頻率,便可形成一個由這些詞對關聯所組成的共詞網絡。利用聚類、因子分析等多元統計分析方法對共詞網絡進行分析,進而展現該學科的研究結構[1]。
社會網絡分析法原本是社會學用于研究社會成員之間關系的一種定量方法,后來被引入到了圖情領域的相關研究。它在關鍵詞分析中應用的主要原理是將關鍵詞作為網絡的節點,關鍵詞之間的共現關系則構成節點之間的連線,構建社會網絡關系圖譜,然后應用中心度、小世界效應等方法進行分析,進而發掘出關鍵詞之間的關系 [2]。
2.1 數據來源
為了盡可能保證查全率,筆者以“用戶”、“信息用戶”為題名和關鍵詞,對中國知網和維普網收錄的19種圖情領域核心期刊進行檢索。共得到2002-2011年發表的論文2 632篇,剔除非學術論文、重復等無效部分后,最終有效篇數為2 115篇。
19種核心期刊分別是:《情報學報》、《圖書情報工作》、《國家圖書館學刊》、《圖書與情報》、《圖書館學研究》、《圖書館工作與研究》、《圖書館理論與實踐》、《情報雜志》、《情報科學》、《圖書館雜志》、《圖書館建設》、《圖書館論壇》、《圖書館》、《圖書情報知識》、《情報理論與實踐》、《中國圖書館學報》、《大學圖書館學報》、《情報資料工作》、《現代圖書情報技術》。除了《情報學報》上發表的文獻來自于維普網外,其他均來自于中國知網。
2.2 數據預處理
由于關鍵詞是論文作者自行選擇的自然語言,因此會存在一些不規范、不統一的現象。為了讓研究結果更加準確,筆者采用歸并、吸收和丟棄三種方法對關鍵詞進行逐一的人工處理。
歸并法是指對同一內容用不同詞語來表達或者同一詞語用不同語種來表示的情況,歸并為統一的詞語。如用戶、讀者和信息需求者等,歸并為用戶; Lib2.0、Library2.0和圖書館2.0,歸并為圖書館2.0。
吸收法是指針對同一研究內容,但卻采用上下位關系來表示的關鍵詞,如用戶、圖書館用戶和信息用戶,采用上位類代替下位類的方式進行吸收,即采用用戶來表示。有些詞需要采用下位類吸收上位類的方式,如模型和用戶模型,這需要結合文獻的具體內容而定。
丟棄法是指針對一些與用戶研究無關或者太寬泛的關鍵詞,如學校機構的名稱(中央財經大學)、趨勢、google工具欄、21世紀等,將這些關鍵詞丟棄而不納入統計分析范疇。同時,由于本文研究的文章都是來源于圖情領域,這些文章包含“圖書館”這個關鍵詞的頻率較高,為了使得研究結果更加準確和客觀,把這個關鍵詞也剔除。
按照上述方式,采用自編的C語言程序進行統計,共得到關鍵詞3 256個。結合齊普夫第二定律以及關鍵詞頻次變化曲線,選取頻次大于20的34個高頻關鍵詞,如表1所示:
2.3 構建共詞矩陣
為反映關鍵詞之間的關系,筆者統計高頻關鍵詞兩兩共現的情況,構建出34×34的共詞矩陣(見表2)。由于關鍵詞共現的頻次直接受到各自詞頻大小的影響,因此原始共詞矩陣難以反映關鍵詞之間真正的依賴程度。為了消除這種現象,筆者采取常用的Ochiia系數對關鍵詞對進行了包容化處理,將原始共詞矩陣轉換為相似矩陣。Ochiia系數計算公式為: ,其中 表示關鍵詞 和 共現的頻次, 分別表示關鍵詞 和 的頻次。
由于構建的相似矩陣為0值過多的稀疏矩陣,為方便后續處理,用1與全部相似矩陣中的數據相減,得到表示關鍵詞對的相異矩陣(表3),作為后面分析的矩陣變量。相異矩陣中的值越大表示兩個關鍵詞對聯系越不緊密,值越小表明聯系越緊密。
2.4 研究方法
因子分析法。該方法的目的是用少數幾個因子去描述眾多指標或因素之間的聯系,其基本原理是把比較密切的幾個變量歸在同一類中,每一類變量就成為一個公共因子,然后以較少的幾個公共因子反映原資料的大部分信息。運用這種方法,可以確定本論文研究的高頻關鍵詞的類數,為聚類分析中類數的確定提供依據[3]。
聚類。該方法是直接比較各事物之間的性質,將性質較相近的聚為一類,將性質差別較大的歸入不同類的分析方法。運用此方法,可以將高頻關鍵詞按照距離的遠近聚集成不同的類別,使類內屬性相似性最大, 類間屬性相似性最小[4]。
多維尺度分析。該方法是通過低維空間(通常是二維空間)展示多個研究對象之間的聯系,利用平面距離來反映研究對象之間的相似程度。通過高頻關鍵詞的多維尺度分析結果,可以直觀形象地展現關鍵詞之間的相近程度[5]。
社會網絡關系圖譜。該方法能夠直觀地揭示各個元素之間的緊密程度和所處地位。通過構建高頻關鍵詞的圖譜,可以分析出高頻關鍵詞在整個網絡中所處的地位 [6]。
3.1 總體趨勢
論文的數量能夠直接反映圖情領域對用戶研究的關注度,2002-2011這10年間共有2 115篇相關論文,年均211.5篇。刊文量從2002年的98篇增長到了2011年的309篇,增長了近3.15倍,年均增長率達到12.2%。上述數據表明,近10年來我國學者對于用戶的研究越來越關注和重視。正如普賴斯文獻指數增長規律所反映的現象,圖情領域關于用戶的研究正處于發展階段,會引起許多不同學者進行思想交流,不同學科內容的相互滲透、交叉,推動了用戶研究的蓬勃發展。
同時,筆者對關鍵詞進行規范化處理之后,共整理出頻次大于20的34個高頻關鍵詞。其中信息服務、用戶需求、數字圖書館、高校圖書館、個性化服務這5個關鍵詞的頻次都大于100,說明在網絡越來越發達的今天,圖書館等信息服務機構更加關注用戶的個性化需求,根據不同用戶的需求特征,有針對性地提供信息服務。
為了更加清楚、形象地展現近10年我國圖情領域關于用戶研究的主題和核心領域,筆者對得到的高頻關鍵詞進行共詞和社會網絡分析,并繪制相應的關系圖。
3.2 主題歸類
3.2.1 主題類數的確定
利用SPSS17.0 進行因子分析, 結果見表4。按照提取因子的方差累積百分比要超過60 %的原則, 從關鍵詞矩陣中提取符合條件的因子個數為6。這6個因子的方差累積貢獻率達到63.503%,即能夠解釋全部信息的63.503%。由此可以確定用戶研究的主題類數為6類。
3.2.2 歸類結果
根據因子分析的結果,將關鍵詞采用系統聚類的方法聚為六大主題(見表5),分別是新形勢下高校圖書館用戶教育研究、網絡環境下圖書館用戶需求研究、數字圖書館用戶個性化服務研究、網絡模式下用戶服務滿意度研究、網絡信息資源的用戶體驗研究、信息組織中的用戶參與研究。為了更加直觀形象地展示歸類主題結果,筆者采用多維尺度分析法構建了主題圖譜(見圖1)。
新形勢下高校圖書館用戶教育研究。由于高校圖書館是高校的文獻信息中心,是教師、科研人員、學生查找資料的主要場所。因此,國內外對于高校圖書館的用戶教育研究歷來都很重視,將之貫穿于圖書館各個工作環節中。隨著Web 2.0和圖書館2.0的發展,高校圖書館在文獻載體、信息構建、服務手段等諸多方面都發生了巨大的變化。如何將Web 2.0和圖書館2.0的一些元素應用于用戶教育,提高用戶信息檢索能力以及有效利用信息的能力,已成為高校圖書館一項十分緊迫而重要的任務[8]。
網絡環境下圖書館用戶需求研究。隨著網絡的不斷發展,用戶對信息的需求也處于不斷變化中。用戶不再滿足于簡單地獲取文獻信息,而是希望利用快捷、豐富的網絡資源全方位獲取各種相關的信息。圖書館傳統的服務模式已經跟不上網絡環境下用戶的需求,用戶流失現象日益嚴重。在這種形勢下,學者對網絡環境下用戶需求的特點進行了大量的研究,以期圖書館等信息服務機構創建與之相適應的服務方式,為用戶提供綜合化的信息服務[9]。
數字圖書館用戶個性化服務研究。數字圖書館是隨著網絡技術的成熟而蓬勃發展起來的,用戶通過檢索就能夠獲取所需信息。由于需要用戶的參與,因此這種信息獲取往往是被動的,獲得的信息質量不盡如人意。在這樣的情況下,個性化服務應運而生,并已經成為數字圖書館信息服務研究的主要問題。圍繞這個問題,學者對用戶信息行為、信息偏好、用戶模型、用戶咨詢、搜索引擎等方面進行了大量的研究,以便系統、全面地獲取用戶興趣特點,主動推送其所關注的信息資源。
網絡模式下用戶服務滿意度研究。網絡環境下圖書館的用戶滿意度是從用戶角度出發,即用戶在獲取網絡信息資源時是否達到或者超過預期滿足程度的一種心理狀態。學者對用戶滿意度研究有利于優化網絡檢索系統,提高查全率和查準率,提升信息的服務質量。
網絡信息資源的用戶體驗研究。對圖書館等信息服務機構而言,用戶體驗是指用戶在使用信息產品過程中所獲得的心理感受。根據用戶體驗結果可以有效地進行網絡信息資源整合、基本術語規范以及創新服務模式等。用戶體驗對于圖書館等信息服務機構來說是一種全新的觀念,近年來對其關注度不斷加大。但是相對其他主題來說,用戶體驗研究的內容寬泛而且沒有一個相對統一的標準,導致該領域的研究深度有限。
信息組織中的用戶參與研究。信息組織是信息資源開發利用的關鍵環節,由于當前以博客、微博、社交網絡等為代表的微內容不斷興起,用戶越來越多地參與到信息組織中來。用戶參與圖書館信息組織一方面有益于改善圖書館信息資源組織與服務,同時也給圖書館信息組織帶來了挑戰。因此,圖書館將來必須變革傳統的信息組織模式,創新信息組織模式與方法[10]。
3.3 核心主題
3.3.1 核心主題的確定
在確定了近10年來關于用戶研究的主題后,接下來筆者將進一步分析這6類主題的聯系程度及所處地位。為此,筆者借鑒社會網絡分析方法,繪制主題的社會網絡關系圖譜(見圖2)。圖譜中節點的大小代表在整個網絡中的地位,節點越大越接近中心地位,屬于核心主題。據此可以看出“數字圖書館用戶個性化服務研究”和“網絡環境下圖書館用戶需求研究”是整個主題網絡中的核心節點,其中前者與所有的主題都有聯系,核心地位更突出。這表明在互聯網的沖擊下,傳統圖書館在向數字圖書館邁進的過程中,更加注重以用戶需求為導向的個性化服務模式的運用。
3.3.2 核心主題的分析
社會網絡關系圖譜中兩節點間的連線情況反映兩個節點的聯系強度,如果存在連線,代表兩個節點有聯系;連線越粗,表示兩者關系越緊密。根據這個原理,筆者對核心主題——“數字圖書館用戶個性化服務研究”所囊括的高頻關鍵詞進行圖譜分析(見圖3)。從圖中可以看出,個性化服務與數字圖書館、用戶模型、搜索引擎以及知識服務聯系緊密。可見在數字圖書館背景下,用戶模型的建立、搜索引擎的優化以及原始資料的知識抽取對個性化服務的開展至關重要。同時,數字圖書館與用戶研究、用戶服務聯系緊密,表明數字圖書館與傳統圖書館相比,更加注重以用戶為中心的服務理念。
結論
筆者利用共詞和社會網絡分析技術,對2002-2011年我國圖情領域以用戶研究為主題的論文進行了研究。結果表明,學者對用戶研究的主題主要集中在六個方面。其中,數字圖書館用戶個性化服務研究和網絡環境下圖書館用戶需求是目前關注的重點領域。現有的用戶研究主題都與互聯網技術密切相關,這表明將網絡技術引入到對圖情領域用戶的信息服務已成為這一學科的未來發展趨勢。
[參考文獻]
[1] 鐘偉金,李佳.共詞分析法研究(一)——共詞分析的過程與方式[J].情報雜志,2008,27(5):70-72.
[2] 朱慶華,李亮.社會網絡分析法及其在情報學的應用[J].2008(2):179-183.
[3] Dhanarai C,Lyles M A.Managing tacit and explicit knowledge transfer in IJVs:The role of relational embedded mess and the impact on performance[J].Journal of International Business Studies,2004,35(3):428-442.
[4] 韓永青,黃科舫.基于聚類技術的政務信息資源整合研究[J].圖書情報工作,2010,54(8):11-15.
[5] 韓璐,謝俊奇.基于多維尺度分析的土地科學決策支持系統研究現狀分析[J].中國土地科學, 2009,23(7):37-42.
[6] 劉軍.整體網分析講義:UCINET軟件使用指南[M].上海:格致出版社,2009.
[7] 林聚任.社會網絡分析:理論、方法與應用[M].北京:北京師范大學出版社,2009.
[8] 由敬春.網絡環境下高校圖書館的用戶需求特點與服務模式[J].現代情報,2008(12):78-83.
[9] 鄧小昭,阮建海,李健,等.網絡用戶信息行為研究[M].北京:科學出版社,2010.
[10] 司莉,邢文明.Web 2.0環境下用戶參與的圖書館信息組織模式及其影響研究[J].圖書館論壇,2011,31(6):199-206.