王 曉
(廣東培正學院圖書館,廣東廣州 510830)
?
基于共詞分析的編目研究主題與未來熱點分析
王曉
(廣東培正學院圖書館,廣東廣州 510830)
[摘要]以CNKI數據庫為來源,基于2010-2014年間公開的1691篇編目論文,利用BICOMB和SPSS 20.0軟件作為研究工具,在共詞分析的基礎上,通過聚類分析與多維尺度分析,總結與歸納了編目領域的四大研究主題。這四大主題分別是編目工作管理、編目業務外包及質量控制、編目員與讀者服務、編目規則與聯機聯合編目。并在此基礎上,展望了未來編目研究的熱點和方向。
[關鍵詞]編目;主題;共詞分析;聚類分析;多維尺度 是從論文的題名、摘要和正文提煉出來的,能反映某一學科領域的發展方向,高頻關鍵詞更能體現某一領域的研究熱點。利用BICOMB對1813篇論文的關鍵詞進行統計,得到了2877個關鍵詞,篇均關鍵詞1.587。其中,頻次最多的關鍵詞是“圖書館”,共出現308次;第二位是“編目”,共出現234次;第三位是“編目工作”,共出現186次;第四位是“高校圖書館”,共出現182次。本文選取排名前35位的關鍵詞作為高頻關鍵詞,頻次大于等于21,累計比例達到了31.0513%,如表1所示。
近幾年RDA(資源描述與檢索)的研究熱潮正推動編目工作進入一個新的領域,編目規則也正朝向國際化、全球化的融合方向發展,不同類型的圖書館也開始受到新理論、新規則的影響,傳統編目工作、編目管理產生變革與創新,編目界正面臨一場前所未有的沖擊與挑戰。
隨著圖書館外包業務的不斷發展,從事具體編目業務與實踐工作的人員相應減少,編目研究的論文數量也在減少,這與編目國際化、全球化的發展產生了一些矛盾,即編目規則的統一化意味著需要大量的實踐工作去解決中國編目規則與國際編目規則的差異,而編目人員與編目論文的減少意味著統一的過程的漫長,這與網絡時代、信息時代快速獲取知識的需要存在矛盾。因此,在現有條件下,編目實踐者以及研究者應當對近年來的研究主題與未來熱點有一個準確、清晰的認識,從而明確自身的研究方向,為我國編目的理論與實踐創造有價值的研究成果,進而使編目適應時代需要,為我國的科學技術與綜合國力發展提供應有的知識力量。
本文從最近5年的期刊論文中,通過高頻關鍵詞、共詞分析、聚類分析與多維尺度分析等方法對編目領域的研究主題進行歸納與總結,在此基礎上探尋未來的研究熱點,以期給編目領域的研究人員與管理人員一個清晰的概念與圖譜,從而更好地開展編目工作與編目研究。
1數據來源與研究工具
1.1數據來源
本研究以中國知網(CNKI)作為數據來源,在學科領域中選取信息科技中“圖書情報與數字圖書館”, 然后再選擇包含期刊、特色期刊、博士、碩士、國內會議、國際會議、報紙、學術期刊、商業評論等數據來源的9個數據庫,以“編目”為主題進行檢索,數據的起止時間段設為2010-2014年,共5年,檢索時間為2015年3月21日,共檢索出期刊論文1813篇,論文的時間分布及相關信息見圖1。由圖中的數據變化可以看出,編目研究呈現持續降溫的過程,特別是從2013年開始,論文數量、作者數量以及作者所在機構的數量明顯減少。筆者認為這是由于圖書館編目業務外包導致編目人員的減少,從而導致編目研究論文數量減少。
1.2研究工具
要對研究熱點及主題進行分析,必須要獲得高頻關鍵詞的共現矩陣,因此需要采用相關的計量分析軟件。

圖1 2010-2014年論文數量及相關信息的變化
本文采用BICOMB(書目共現分析系統)軟件進行關鍵詞頻次的統計、關鍵詞共現矩陣的產生。此外,還要對共現矩陣進行聚類分析與多維尺度分析,所以還需要采用SPSS軟件。最后,要對相關數據進行統計分析并產生圖表,因此還需要最基本的圖表軟件EXCEL。
2論文關鍵詞及研究熱點分析
2.1高頻關鍵詞的統計分析

表1 2005-2014年編目論文高頻關鍵詞統計
由表1可以看出,除了前4位關鍵詞外,“業務外包”“質量控制”“書目數據”“網絡環境”“RDA”“聯合編目”“編目員”“公共圖書館”等也是編目研究領域的主要高頻關鍵詞。從這些主要高頻關鍵詞中,可以看出編目領域的研究熱點主要集中在高校圖書館的業務外包、質量控制以及RDA等領域。另外,“聯機編目”“編目規則”“讀者服務”“資源共享”“管理”等次要高頻關鍵詞也反映了編目研究還關注編目規則、資源共享與讀者服務等主題。
2.2高頻關鍵詞的共詞分析
盡管從高頻關鍵詞的變化能對研究熱點與重點進行初步估計,但要準確判斷5年間的研究熱點與主題,還需要科學的統計與分析方法。共詞分析方法是一種內容分析技術,即以高頻關鍵詞共同出現的次數為基礎進行聚類分析,從而將大量的關鍵詞縮減為幾個大類,再根據某個大類的關鍵詞來確定研究的熱點與主題。
利用BICOMB軟件中的共現矩陣功能,可以得到35*35的共現矩陣。表2是關鍵詞共現矩陣的部分數據,其中,對角線上的數字是關鍵詞出現的頻次,而非對角線的數字是兩個關鍵詞共現的次數,表示兩個關鍵詞有多少次出現在同一篇論文中。例如,“圖書館”的頻次是308, 它與“業務外包”同時在39篇論文中出現,表示有39篇論文中同時出現過這兩個關鍵詞。“圖書編目”與“文獻編目”的共現次數為0,表示沒有一篇論文中同時出現這兩個關鍵詞。

表2 編目論文高頻關鍵詞共現矩陣(部分)
注:為了節省篇幅,第一行中的數字分別與第一列的關鍵詞一一對應。例如,1代表圖書館,2代表編目,依次類推。
盡管表3給出了高頻關鍵詞的共現次數,但還是無法給出這些關鍵詞之間的內在關系,還需要對共現矩陣進行深入處理。由于關鍵詞的頻次與共現次數的差異較大,直接利用SPSS軟件進行聚類分析難以獲得準確的結果。為了消除頻次懸殊造成的影響,需要將共現矩陣轉化為相關矩陣。在相關矩陣中,相關系數的大小表示兩個關鍵詞之間的距離遠近,值越接近1,關鍵詞之間的相似度越大,反之亦然。由于在相關矩陣中,自相關系數與相關系數間的差異還是較大,進行聚類分析會產生誤差,因此還需要將相關矩陣進一步轉換為相異矩陣。在相異矩陣中,數值越大,表明關鍵詞之間的相似度越小;數值越小,相似度越大。表3是關鍵詞相異矩陣的部分數據。

表3 編目論文高頻關鍵詞相異矩陣(部分)
2.3高頻關鍵詞的聚類分析
在某個研究領域的眾多關鍵詞中,通過聚類分析可以把關系密切的關鍵詞聚集在一起形成不同的類別,從而形成研究的主題。本文使用SPSS 20.0對表4中的相異矩陣進行聚類分析。在聚類分析中,使用系統聚類的方法,聚類方法選擇最遠鄰元素,度量標準中選擇區間中平方Euclidean距離。聚類分析的結果中會出現冰柱圖與樹形圖,分別見圖2和圖3。

圖2 關鍵詞相異矩陣聚類分析冰柱圖
根據冰柱圖與樹形圖的聚類結構,可以把編目領域的研究主題大致劃分為四類。第一類是關于圖書編目管理方面的問題與對策的相關研究,包含的關鍵詞有對策、問題、編目、管理、圖書等。第二類是關于圖書館編目業務外包及質量控制的相關研究,包含的關鍵詞有編目外包、編目業務外包、圖書編目、質量控制、高校圖書館、編目業務、外包、圖書館、業務外包等。第三類是關于網絡環境下編目員及讀者服務的相關研究,包含的關鍵詞有網絡環境、編目人員、編目工作、文獻編目、編目員、讀者服務等。第四類是關于編目規則、編目格式以及聯機聯合編目的相關研究,包含的關鍵詞有RDA、編目規則、著錄、機讀目錄、CNMARC、西文編目、圖書館編目、聯合編目、資源共享、公共圖書館、數字圖書館、書目數據、聯機編目、編目數據、中文圖書等。
2.4高頻關鍵詞的多維尺度分析
多維尺度分析法是一種將多維空間的研究對象簡化到低維空間進行定位、分類和歸類,同時又保留對象間原始關系的數據分析方法。對相異矩陣進行多維尺度分析,距離設置為“從數據創建距離”,度量標準選擇區間中的塊,度量水平選擇序數。在分析結果中,Stress和RSQ分別表示多維尺度分析的信度與效度估計值:Stress是擬合度量值,值越小表示擬合度越好,一般在0.2以內;RSQ是判定系數,值越大越好,一般在0.6以上。本研究的多維尺度分析結果中,Stress=0.13726,RSQ=0.90668,完全滿足多維尺度分析的信度與效度要求。多維尺度分析的可視化結果如圖4所示,根據關鍵詞在圖中的距離遠近,產學研領域的研究主題可以劃分為四類。具體來說,研究主題分別為:主題域1——編目工作管理,主題域2——圖書館編目業務外包及質量控制,主題域3——編目員與讀者服務,主題域4——編目規則與聯機聯合編目。將聚類分析的結果與多維尺度分析的結果進行比較,兩種分析得到的編目研究主題完全一致。

圖3 關鍵詞相異矩陣聚類分析樹形圖
2.5對三大研究主題域的解讀
2.5.1主題域1——編目工作管理
這個主題域中包含的主要關鍵詞有對策、編目、管理、問題與圖書。該主題的研究屬于一般性業務研究,涉及的范圍包括高校圖書館合并后的編目工作問題[1]、網絡電子期刊編目的問題[2]、小語種圖書建設與編目的問題[3]以及編目數據套錄[4]等問題。
2.5.2主題域2——編目業務外包及質量控制
這個主題域中包含的主要關鍵詞有編目外包、編目業務外包、圖書編目、質量控制、高校圖書館、編目業務、外包、圖書館、業務外包等。總的來說,這個領域的研究還是集中于高校圖書館編目業務外包的質量控制。質量控制是一個比較大的概念,在這個大概念下還可以細分質量控制模式[5]、績效評價[6]、評價機制與評價模型[7]等。此外,編目業務外包還涉及外包的決策方法[8]、外包模式[9-11]等方面的研究。
2.5.3主題域3——編目人員及讀者服務
這個主題域中包含的主要關鍵詞有網絡環境、編目人員、編目工作、文獻編目、編目員、讀者服務等。網絡環境下,編目業務對編目員提出了更高的要求,編目員的素質直接影響到編目質量、讀者服務與圖書館可持續發展[12]。特別是編目業務外包出去后,編目員還需要進行角色轉換與職能更新[13-14],迎接新崗位的挑戰。因此,編目員與編目人員的素質建設[15-16]、角色轉換、職能更新以及如何更好為讀者服務[17]都是研究的重要方面。

圖4 編目論文關鍵詞的多維尺度分析
2.5.4主題域3——編目規則與聯機聯合編目
這個主題域中包含的主要關鍵詞有RDA、編目規則、著錄、機讀目錄、CNMARC、西文編目、圖書館編目、聯合編目、資源共享、公共圖書館、數字圖書館、書目數據、聯機編目、編目數據、中文圖書等。盡管這個領域有眾多關鍵詞,從整體上可以歸納為編目規則與資源共享的主題,即RDA、編目規則、機讀目錄、CNMARC等關鍵詞側重于編目規則與編目格式的研究,而聯合編目、資源共享與聯機編目側重于合作編目與資源共享的研究。例如,《中國文獻編目規則》與RDA在編修機制、地圖資源、連續出版物、電子資源著錄、樂譜規則等方面的對比、比較、異同分析[18-22]就是學者們對編目規則與實踐進行的研究。
3未來研究展望
通過對關鍵詞頻次分析、關鍵詞頻次的時間分布、聚類分析、多維尺度等方法,可以將產學研研究的主題劃分為圖書館編目工作管理、編目業務外包即質量控制、編目員與讀者服務、編目規則與聯機聯合編目。但隨著編目規則的標準化、統一化、國際化、全球化的發展趨勢,聯機聯合編目與資源共享范圍的擴大,編目領域的未來研究方向很值得探究。
隨著編目數字化、網絡化的發展,聯機聯合編目與編目業務外包等合作編目形式的擴大,編目規則與編目格式的修訂與統一,圖書館編目會面臨很多新的問題與挑戰,這也意味著編目管理工作也會不斷更新。未來的編目工作管理研究會隨著編目業務外包、編目規則、聯機聯合編目的發展而變動。
聯機聯合編目在我國已經實踐了多年。最早的全國圖書館聯合編目中心(OLCC)于1997年10月成立,之后相繼出現了CALIS聯機合作編目中心(CUCC)、地方版文獻聯合采編協作網(CRLNet)、上海市文獻聯合編目中心(SIUCC)、中國科學院數字圖書館聯機聯合編目服務系統(UNICAT)等聯機聯合編目機構。盡管這些機構在聯合編目與資源共享方面發揮了重要價值與作用,但也帶來了標準與規范、質量控制、數據庫建設、協作與共享、運行機制等方面的問題。隨著聯機聯合編目的全國化、國際化的發展,未來的聯機聯合編目研究會在統一標準、云計算、知識管理、數據庫建設等方面展開。
隨著編目業務外包與聯機聯合編目的不斷發展,編目員會細分為兩種類型:普通編目員與專業編目員,普通編目員從事套錄編目工作,而專業編目員從事原始編目、著錄、標引和上載工作。但不管如何,編目員的素質建設都是編目質量的基礎,這也是提高讀者服務質量的關鍵。新的編目規則與編目格式的出現,也對編目員的業務素質提出了考驗。如何對編目員素質進行提升,將是未來編目質量與讀者服務質量研究的重點與熱點。
美國、加拿大、英國、澳大利亞、德國、新加坡、馬來西亞、日本、中國臺灣等國家和地區已經開展了廣泛的RDA實踐,我國也開始了這方面的理論研究與實踐工作。中國國家圖書館于2012年7月舉辦了第一次RDA培訓班,上海圖書館率先進行了RDA編目的研究與實踐。隨著RDA在國內圖書館的實踐應用,中國編目規則將會持續修訂,與RDA進行配合,并盡可能實現標準化與統一化[23]。
[參考文獻]
[1]丁羽.合并高校圖書館編目工作的困惑與對策——以南京郵電大學圖書館為例[J].農業圖書情報學刊,201(11):103-105.
[2]邱萍,邵晶,周琴.網絡電子期刊編目的難點及對策[J].圖書館建設,2011(7):34-37.
[3]李燦元,麥林,鐘建法.高校圖書館小語種圖書建設的問題與對策[J].圖書館建設,2011(9):18-20.
[4]林迪.中文圖書編目數據套錄問題分析及對策[J].圖書情報工作,2011(S1):93-96.
[5]余恒鑫.高校圖書館編目業務外包質量控制模式——外包組長專人負責制探析[J].圖書館學研究,2011(20):28-30.
[6]陳新潔.圖書館編目外包質量控制與績效評價研究[J].圖書館論壇,2011(4):132-134.
[7]高源,李亞君,朱淑南,等.圖書館采編業務外包評價機制與評價模型的建立[J].圖書館建設,2011(11):88-91.
[8]莫振軒.基于SWOT和AHP的編目業務外包決策方法探討[J].圖書館論壇,2011(2):98-100.
[9]曾榮玉.高校圖書館編目業務外包模式探討及實踐——以江西理工大學圖書館為例[J].江西圖書館學刊,2011(4):66-68.
[10]杜欣明.技術干預模式:編目業務外包的一種新嘗試[J].圖書館建設,2011(3):108-110.
[11]段鵬莉.網絡環境下圖書館編目模式選擇探析[J].太原大學學報,2012(2):75-77.
[12]宋蕓芳,鄭儉華,李雪梅.編目員信息素質與圖書館可持續發展關系探析[J].圖書館界,2010(6):1-3.
[13]董燕.網絡環境下編目員角色轉換研究[J].農業圖書情報學刊,2012(6):204-206,221.
[14]趙紅.談網絡環境下高校編目員的職能更新[J].農業圖書情報學刊,2010(9):345-348.
[15]徐淑秋,郭曉丹.從古籍普查工作看編目人員的素質建設[J].圖書館學刊,2013(12):24-26.
[16]瞿玲玲.網絡環境下西文編目人員素質新論[J].黑龍江史志,2010(9):101-102.
[17]蔡玲.淺議編目質量與讀者服務工作的關系[J].科技信息,2012(31):315,367.
[18]吳雷.《中國文獻編目規則》與《資源描述和檢索》編修機制比較研究[J].圖書館建設,2010(7):69-73.
[19]高紅,胡小菁.《中國文獻編目規則》與RDA在地圖資源著錄中的對比分析[J].圖書館論壇,2013(5):130-134.
[20]霍艷蓉.RDA與《中國文獻編目規則》在連續出版物著錄中的對比分析[J].圖書館雜志,2013(2):34-38.
[21]莊蕾波,胡小菁.《中國文獻編目規則》和RDA對電子資源著錄的異同分析[J].圖書館建設,2012(11):33-38,41.
[22]胡小菁.《中國文獻編目規則》與RDA樂譜規則的對比分析[J].上海高校圖書情報工作研究,2013(4):16-20.
[23]周德明. RDA:從理論到實踐[M].北京:海洋出版社,2014.
[作者簡介]王曉(1979- ),女,館員,從事文獻編目、圖書管理研究。
[基金項目]廣東培正學院資助項目“基于共詞分析的編目研究主題與未來熱點分析”(16pzxmyb15)。
[收稿日期]2015-12-20
[中圖分類號]G254.3
[文獻標識碼]A
[文章編號]2095-7602(2016)02-0152-07