王克平,蘇艷麗
(山東理工大學 科技信息研究所,山東 淄博 255000)
我國高校數字圖書館研究現狀與趨勢
——基于碩博士學位論文的統計分析
王克平,蘇艷麗
(山東理工大學 科技信息研究所,山東 淄博 255000)
以碩博士學位論文為數據源,利用社會科學統計軟件,結合文獻計量學相關理論,研究發現:我國高校數字圖書館研究近幾年呈現下降趨勢,相關研究集中在圖書情報與檔案管理、計算機科學與技術等學科;吉林大學、湘潭大學等重點大學成為主要研究機構;有關高校數字圖書館研究主題熱點為數字資源建設、數字圖書館技術、信息服務。實踐中可以從加強跨學科交流、加大宣傳力度、開展產學研結合等多種培養模式入手,以促進高校數字圖書館的發展。
高校數字圖書館;學位論文;統計分析
數字圖書館(Digital Library) 是以數字形式存儲和處理信息的新型圖書館,通過計算機技術進行圖書館各種信息資源的采集、數字化加工處理、信息的存儲和管理、信息的發布和服務、信息利用與挖掘等處理工作,向讀者提供智能檢索和下載服務,實施知識的增值和快速傳播,代表了圖書館發展的必然趨勢[1]327-331。碩士、博士學位論文是高等學校專業人才培養方案的重要組成部分,是高校研究生教育實現培養目標最重要的教學環節,反映了學生綜合知識水平、實踐應用能力及相關科研成果[2]218-223。
基于“高校數字圖書館”的相關學位論文,采用社會科學統計方法,認識我國高校數字圖書館的研究現狀并預測發展趨勢,對高校數字圖書館的發展具有指導意義。
在對比中國知網、維普、萬方等數據庫的基礎上,本文選取CNKI的碩博士學位論文數據庫作為數據源,以保證數據的完整、質量高和新穎性①參見中國知網“博碩士學位論文”,網址鏈接為:http://epub.cnki.net/kns/brief/result.aspx?dbPrefix=CDMD.。為了盡量全面收集國內關于高校數字圖書館研究的碩博士學位論文,本文選取“高校數字圖書館”“大學數字圖書館”作為檢索詞,詞間邏輯關系為“或”;檢索字段選擇能反映文獻主題內容的主題、題名和關鍵詞字段,字段間邏輯關系為“或”;檢索時間范圍為2001—2014年;匹配模式均為模糊匹配。對CNKI的碩博士學位論文數據庫進行高級檢索,共獲得508篇學位論文,其中包括20篇博士學位論文,488篇碩士學位論文。
借助CNKI及E-study工具導出學位論文的作者、篇名、時間、機構等相關題錄信息,采用統計軟件SPSS22.0及文獻題錄信息統計分析工具SATI3.2進一步分析。
(一)學位論文年代分布
通過年代分布可以了解我國數字圖書館近幾年的發展趨勢,包括起始研究、研究的峰值和轉折點等。通過CNKI及E-study工具可以直接導出碩博士學位論文每年的論文數,使用SPSS對數據進行整理并繪制分布圖如圖1所示,從圖形來看,碩博士研究生從2001年開始進行我國高校數字圖書館的研究,隨著關注熱度的增加相應的學位論文數呈現遞增的趨勢,直至2012年達到峰值,自2013年開始呈現下降趨勢;國內博士研究生對高校數字圖書館的研究與碩士研究生相比相對較少,且多年來未有較大變化,說明博士研究生學位論文在高校數字圖書館方面關注較少。由于博士學位論文數量較少,以下內容采用總體學位論文數據進行研究分析。

圖1 高校數字圖書館學位論文數量與年代關系分布圖
(二)學位論文學科分布
依據《授予博士、碩士學位和培養研究生的學科、專業目錄》①參見《授予博士、碩士學位和培養研究生的學科、專業目錄》(1997年頒布),網址鏈接為:http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/moe_834/201005/xxgk_88437.html.和CNKI對508篇文獻的學科分類,使用SPSS工具繪制得到統計結果如圖2所示。從圖2可以看出高校數字圖書館方向碩博士學位論文主要分布于圖書館情報與檔案管理、計算機科學與技術、信息與通信工程、教育學、法學、新聞傳播學、應用經濟學、中醫學和基礎醫學等學科領域。圖情學科與數字圖書館關系最密切,也是研究高校數字圖書館的重要領域;數字圖書館的發展離不開技術的支撐,計算機科學與技術、信息與通信工程等學科為數字圖書館的發展提供了技術支持和保障。隨著公共數字文化建設進程的推進,版權問題越來越突出,數字圖書館在公共數字文化建設中占有舉足輕重的地位,遇到的版權侵權問題具有較強的代表性[3]27-33。圖書館作為科研工作者獲取知識的重要渠道,在信息化的時代背景下,教育學、新聞傳播學、應用經濟學等領域也改變了往日獲取、傳播信息的渠道,加強了對數字圖書館的利用,因此法學學科碩博士學位論文從法律和版權角度對數字圖書館做了有效界定、管理和研究,這也使法學在數字圖書館的研究中占有較高比重。同時很多院校的醫學院有診斷治療和科研人員項目申報、選題、結項等方面的教學科研需要,從而開發了專門的醫學數字圖書館,使得中醫學、基礎醫學等醫學學科在數字圖書館研究中占有一席之地。

圖2 高校數字圖書館學位論文學科分布
(三)研究機構分布
由于每個研究單位有研究的側重點,通過統計數字圖書館的研究機構,可以了解該領域的主要研究機構,后續研究中可集中精力關注主要研究機構的研究成果。使用SPSS按照發文數量大小繪制機構分布條形圖,并截取發文篇數大于7的機構分布如圖3所示。從所有研究機構發表碩博士學位論文的統計數據來看,占比14.75%的共有18家培養單位,發表學位論文數占全部學位論文的50.20%.這種論文產出關系體現了情報學中“二八”定律[4]5-8。

圖3 學位論文研究機構分布圖(發文篇數大于7)
二八定律是最省力的法則,可以集中力量把時間、精力、金錢等花在刀刃上,即最受關注的20%上[5]68-69。從圖3可以看出,發文量較多的機構幾乎全部為“211工程”及“985工程”院校,其中吉林大學、湘潭大學、南京農業大學、電子科技大學、黑龍江大學發文量最多,由此可知綜合實力較強的211、985院校在數字圖書館研究上也具備相當大的優勢。根據“二八定律”, 若研究人員在
研究高校數字圖書館過程中計劃進行實證研究,用20%的院校作為研究對象,就基本可以達到概括高校數字圖書館研究現狀的目的,這將在很大程度上節約人力物力,幫助研究人員更加高效地開展研究工作。
(四)學位論文研究主題分布
聚類分析,能把關系密切的主題聚集在一起形成類團,表達某一領域分支的組成[6]118-120。本文采用SPSS22.0關鍵詞聚類的方法,在眾多碩博士學位論文中歸納出高校數字圖書館的研究主題,為高校數字圖書館準確界定研究范圍,并為下一步分析其研究熱點奠定了研究基礎。
SATI是一種文獻題錄信息統計分析工具,可以抽取題錄信息中的多項指標,如關鍵詞、作者、機構、文獻來源、年份等,然后通過統計頻次,生成共現矩陣、相似矩陣等[7]7-12。本文使用SATI工具獲取高頻關鍵詞相似矩陣如圖4所示。

圖4 基于高頻關鍵詞的相似矩陣
將相似矩陣導入SPSS進行“分析—分類—系統聚類”分析,結果25個高頻關鍵詞被分成六類:第一類關鍵詞可概括為數字化,第二類關鍵詞可概括為數字資源,第三類關鍵詞可概括為圖書館技術,第四類關鍵詞可概括為數字資源建設,第五類關鍵詞可概括為信息服務,第六類關鍵詞可概括為數據挖掘。與前述人工合并結果比較,兩者基本一致,從而較為準確地得出高校數字圖書館領域的研究熱點為數字資源、信息服務領域和圖書館技術。

圖5 多維尺度分析圖
多維尺度分析圖把反應變量之間相似程度的坐標在平面上排列出來,通過觀察哪些散點比較接近,將變量進行分類,并尋找散點之間相關性的合理解釋[8]288。將相似矩陣導入SPSS進行“分析—度量—多維尺度(ALSCAL)”分析,得到多維尺度分析圖,如圖5所示。從圖5中可以看出,第一象限集中的信息服務、知識服務等關鍵詞,可概括為信息服務類;同樣第二、三、四象限可依次概括為圖書館技術、數字資源和數字化大類。
通過SPSS系統聚類分析和多維尺度分析結果可知,兩種分析方法得到的有關高校數字圖書館研究熱點的結果類似。經過歸納可知,現在高校數字圖書館的研究主題為數字資源的建設、有關數字圖書館技術的提升以及信息服務。
(五)學位論文研究熱點分布
一篇文獻的關鍵詞是文章核心內容的濃縮和提煉,如果某一關鍵詞在其所在領域的文獻中反復出現,則可反映出該關鍵詞或主題詞所表征的研究主題是該領域的研究熱點[9]163-171?;诖?,本文選用學位論文的關鍵詞來研究高校數字圖書館的研究熱點。在本研究采用的508篇碩博士學位論文中,經過同義合并,保留關鍵詞1335個,詞頻數最高的關鍵詞“數字圖書館”“高校圖書館”“圖書館”(共計229頻次)與本文研究題目一致,不能表征研究熱點,對此類關鍵詞進行剔除處理。由于在本次研究中,頻次大于7的18個關鍵詞(稱為高頻關鍵詞)分布較為集中,能較好地反映研究內容;而頻次小于7的關鍵詞分布離散,不能清晰地說明碩博士學位論文關于高校數字圖書館的研究熱點。故繪制高頻關鍵詞及其詞頻對應關系如表1所示。
通過對比表1中的關鍵詞可以發現:頻次為30的“信息服務”、頻次為19的“個性化服務”、 頻次為14的“數字參考咨詢”等雖然在研究中有不同的側重點,但總體研究都基本圍繞“圖書館服務”開展;類似同義詞詞匯在低頻關鍵詞中也有出現。筆者分析,這一方面是由于部分作者對“數據”“信息”“知識”“情報”等概念化詞匯認識不清;另一方面是由于不同詞匯確實表征不同的核心概念,很多作者為了更清晰地描述,斟酌選擇了不同詞匯造成的。而“數字參考咨詢”作為圖書館服務的一部分,也被列入此類。
如上文所述,“圖書館服務”成為碩博士在完成有關高校數字圖書館的學位論文時研究的最大熱點,不同作者從“信息”“知識”等方面展開研究,體現了當今社會以用戶為核心的服務模式,這不僅是服務行業的重要認知,圖書館作為服務部門,更應該加強以用戶為核心的理念,積極探索新方法新思路,以在“互聯網+”的時代背景下保持和增強其吸引力。
以“數字資源”“數據挖掘”“信息資源”為關鍵詞的研究關注了圖書館資源的獲取,主要分析了在保證提供傳統紙質資源的同時,對電子圖書、數據庫等資源的獲取和使用。較多論文從技術層面研究資源的組織建設等,鮮有研究關注這些數字資源的使用情況,尤其是很多高校花重金購入數據庫,以方便在校生查詢獲取較多學習資源,但實際上這些數據庫的利用率較低,許多本科生只有在撰寫學士學位論文時才開始使用;碩博士研究生中,文科類專業利用率相對較高,許多工科專業仍不重視數據庫的使用,總體利用率較低。針對這種現象,筆者認為,一方面,研究人員應多關注數字資源的利用情況,提供研究成果供高校和學生反思;另一方面,高校應加大對各種數據庫的宣傳和指導使用,可以考慮在課程作業中加入相關要求,以提高數字資源的利用率。

表1 高頻關鍵詞詞頻表(頻次大于7)
以“XML”“關聯規則”“元數據”“J2EE”為關鍵詞的研究關注了計算機技術在高校數字圖書館建設中的重要作用,主要論述了資源組織、整合、建設、推廣等方面的技術支撐。XML和J2EE等技術體現了當下計算機技術研究和應用的熱點。筆者在研究中發現,高校數字圖書館的建設固然以計算機技術為支撐,但技術應以理論為基礎,理論通過技術發展,很多學科如管理學、傳播學、社會學的理論已較為完善,研究人員可以通過借鑒不同學科的理論來發展和完善高校數字圖書館的理論,采用理論與技術結合的方式推動高校數字圖書館的研究。
本研究以碩博士學位論文為數據來源,以社會科學統計分析軟件為研究工具,結合文獻計量學相關理論基礎,對“我國高校數字圖書館”現狀進行梳理,并借助關鍵詞聚類分析了研究熱點,從多個角度展示了研究特點,并揭示了一些現象。
我國高校數字圖書館的研究自受到關注以來,整體上研究數量呈現增長趨勢,而且參與高校數字圖書館研究的學科日益增多,研究范圍逐漸增大。其中, 圖書館情報與檔案管理、計算機科學與技術、信息與通信工程三個一級學科的學位論文數量居多,圖書館情報與檔案管理仍是高校數字圖書館研究的主要學科,而圖書館情報與檔案管理、計算機科學與技術兩個學科在全部有關高校數字圖書館的學位論文研究中占據了較大比重,一方面肯定了其作用,另一方面也促使后來者從這兩個學科入手對高校數字圖書館進行深入研究。吉林大學、湘潭大學、南京農業大學、電子科技大學、黑龍江大學等五家單位已成為高校數字圖書館的主要研究機構。研究熱點相對突出,數字資源、信息服務和數據挖掘等技術成為高校數字圖書館的主要研究熱點和方向。數字資源的建設、有關數字圖書館技術的提升以及信息服務成為高校數字圖書館的研究主題。
雖然總體看來我國高校數字圖書館碩博士學位論文數量增長較快,但自2013年以來呈現出下降趨勢,這說明有關高校數字圖書館的研究進入到一個成熟階段,接下來可根據前文所述從相關研究熱點如數字圖書館技術和信息服務等領域尋求突破,以取得更新的研究成果。有關高校數字圖書館的研究廣泛分布于多種學科,跨學科之間的學術、技術交流可以相互促進。同時,目前參與高校數字圖書館研究的均為高等院校,這在一定程度上限制了該項研究的進步,各研究單位可以考慮與研究院所及各大公立圖書館合作,例如采用產學研聯合培養研究生模式等,在不同研究模式的結合中尋找突破。
[1]王元.高校數字圖書館信息安全保障研究[J].圖書情報工作,2010,(S2).
[2]唐琳.從碩士、博士學位論文看北京大學人文地理學研究熱點和發展趨勢[J].圖書情報工作,2013,(S2).
[3]韋景竹,董寶蕾.圖書館版權侵權案例研究[J].圖書館論壇,2015,(11).
[4]李蔭濤.情報學的權威法則淺論[J].情報理論與實踐,1992,(6).
[5]徐志彬.基于長尾理論效應構建圖書館新型信息服務模式[J].內蒙古科技與經濟,2012,(16).
[6]鐘偉金,李佳,楊興菊.共詞分析法研究(三)——共詞聚類分析法的原理與特點[J].情報雜志,2008,(7).
[7]趙蓉英,李飛.基于社會網絡分析方法的國內外信息計量比較研究[J].情報科學,2013,(2).
[8]杜強,賈麗艷,嚴先鋒.SPSS統計分析從入門到精通:第2版[M].北京:人民郵電出版社,2014.
[9]馬費成,張勤.國內外知識管理研究熱點——基于詞頻的統計分析[J].情報學報,2006,(2).
(責任編輯 李逢超)
2017-02-23
國家社科基金項目“復雜動態環境下產業集群創新中的群體知識協同行為與機制研究”(13CGL012);山東理工大學青年教師發展支持計劃項目“科技型小微企業技術創新風險管理中競爭情報保障研究”(SDLG4052)。
王克平,男,山東淄博人,山東理工大學科技信息研究所副研究館員、碩士生導師,情報學博士;蘇艷麗,女,山東菏澤人,山東理工大學科技信息研究所研究生。
G350
A
1672-0040(2017)04-0083-05