〔摘要〕探討以文獻管理軟件NoteExpress來做文獻計量學研究。應用文獻管理軟件NoteExpress對大量源于不同數據庫的文獻信息進行有效歸總,并利用其信息統計和分析功能對特殊主題文獻進行計量學統計和分析,是一種關于文獻計量學研究的簡便工具。
〔關鍵詞〕文獻管理軟件NoteExpress;文獻計量學;研究工具
〔中圖分類號〕G250.252〔文獻標識碼〕A〔文章編號〕1008-0821(2013)02-0101-04
文獻計量學研究源自1969年,是美國目錄學家Alan Pritchard提出的將數學和統計學的方法運用于圖書及其他交流介質的研究的一門學科[1]。它是以文獻體系和文獻計量特征為研究對象,采用數學、統計學等的計量方法,研究文獻情報的分布結構、數量關系、變化規律和定量管理的一門新興的邊緣學科[2]。通過文獻計量學分析可定量地、深入地揭示學科動態發展變化規律,是科研人員和信息服務人員深入研究學科或專題的好方法。
進行文獻計量學研究過程中,為保證統計文獻全面系統[3],需要對源于不同數據庫文獻進行檢索、匯總,因而會產生大量的文獻數據,以往國內由于缺乏文獻數據歸總和統計的簡便工具,導致文獻計量學研究工作中存在著文獻匯總困難、統計的文獻數據不全面、統計方法繁瑣等問題。基于上述困難,目前我國公開發表的文獻計量學研究文章所研究數據來源僅是單種期刊[4-6]或少量期刊或單個數據庫[7-16],少量源于多個數據庫。文獻收集齊全的文獻計量學分析研究所用的數據歸總后還要借助其它軟件[17-20]才能進行文獻計量學分析,操作過程比較繁瑣。
本文介紹了在文獻計量學研究中,如何巧妙利用文獻管理軟件NoteExpress[21](簡稱NE,下同)對源于多個數據庫的大量文獻進行歸總、統計和分析,解決了以往文獻計量學中存在的文獻匯總困難、統計的文獻數據不全、統計方法繁瑣等問題,為文獻計量學研究探索了一種簡便、有效的新工具。
1文獻管理軟件NE及其文獻計量學分析功能的介紹NE是北京愛琴海軟件公司開發的文獻檢索與管理系統,其核心功能涵蓋“知識采集、管理、應用、挖掘分析”等知識管理的環節。利用NE平臺可把源于不同數據庫的信息集中起來進行管理,保證了統計信息的全面性、系統性。在對文獻信息進行全面匯總的基礎上,再利用NE提供的信息統計功能對所采集的大量文獻信息進行分析統計。
2如何利用NE進行文獻計量學分析
2.1建立專題數據庫
本文以“基于NE的文獻計量學研究”為例闡述專題數據庫的建立過程。在新建NE數據庫前,先在電腦磁盤中建立一個文件夾,用于保存所有關于文獻計量研究文獻信息資料。然后利用NE的“新建數據庫”功能建立了一個名為“基于NE的文獻計量學分析”專題數據庫,將其保存至磁盤中的“基于NE的文獻計量學研究”文件夾中。為了防止操作過程中的數據丟失,研究者既可利用NE的“數據庫備份”功能備份自己建立的專題數據庫到目標文件夾中,也可選擇“打開數據庫時備份”或者“關閉數據庫時備份”進行備份。
NE題錄信息的采集有3種方式:一是過濾器導入方式;二是聯機檢索方式;三是手工建立方式。“過濾器導入方式”是指將數據庫中檢索出來的題錄信息通過NE“導入題錄”功能進行批量采集,該方式信息采集速度快、內容全面,適合大批量的文獻題錄信息采集。“聯機檢索方式” 指利用NE內置的常用數據庫檢索連接文件直接在線檢索數據庫,批量生成題錄信息,該方式簡單、省事,但受網絡環境影響較大,適合在網速較快的情況下進行大批量題錄信息采集。“手工建立方式”是指用手工輸入的方式建立題錄信息,該方式效率低、繁瑣,不推薦使用。
由于從各大數據庫導出的文獻信息格式不盡相同,使用“過濾器導入方式”采集題錄信息時,不僅要選擇適當的題錄保存格式,還要選擇與題錄保存格式相匹配的過濾器。筆者實踐經驗表明:維普中文科技期刊全文庫(簡稱維普,下同)可選擇全紀錄格式保存;CNKI在總庫中信息保存時選擇“自定義”字段全選格式,在信息導入時選擇“CNKI-Export(custom)\"過濾器;萬方學術期刊庫(簡稱萬方,下同)以NE格式保存較好,導入題錄時用NE-萬方過濾器;SciFinder(CA)在信息保存時選擇“Tagged Format.txt”格式,導入時選擇“SciFinder”過濾器;三大農業數據庫(Agris,Agricola,CABI)、EI、SCI在保存時選擇RIS格式,在信息導入時選擇RIS過濾器。研究者若熟悉過濾器的編寫規范,最好在數據庫中選擇最全的數據保存格式,并根據需要利用NE中的過濾器管理功能編輯出與全紀錄格式相匹配的過濾器,這樣導入NE后的信息內容比較全,不用在題錄信息導入后還考慮缺失字段補全等問題,簡化數據處理過程。
2.3文獻的除重
文獻的惟一性是正確進行計量學分析的基礎。由于不同數據庫收錄的文獻范圍既有交叉又有不同,因而源于不同數據庫的NE中的信息也會有重復的內容。在NE中可直接利用“查找重復題錄”功能對所有的信息進行除重,保證單一信息的惟一性。在查重的過程中,待查重的字段可根據用戶需要而個性設定,NE默認的字段有題錄類型、作者、年份、標題4個字段。選擇好目標文件夾、查重字段及選項內容后,直接點擊“查找”即可對目標文件夾內容進行查找,見圖1,而后直接一次性刪除重復內容即可。
11圖1NE中文獻的除重11
2.4文獻題錄信息的適當修正、補全
主題統計和分析是文獻計量學研究的重要指標之一。導入NE中的所有文獻題錄均無主題字段,進行文獻計量學分析時,可通過關鍵詞詞頻統計,或者通過閱覽全文自行對研究內容做人工判定,對主題字段進行補全后才能進行主題分析。建議研究者先用NE對關鍵詞進行詞頻統計,觀察統計結果中同義詞情況,再用NE的批量替換功能把所有同義詞均替換成其中的一個同義詞,而后利用NE統計功能進行統計,在整個統計過程中,盡量減少人工逐條修正工作,多利用計算機及NE各種功能對信息進行處理,既減少了操作的繁瑣度,提高了工作效率,也減少了信息信息處理的失誤率。為了便利研究者對全文進行閱覽以便準確把握文獻主題,也為了以后更方便管理和查找文獻,NE中的每條文獻最好都有鏈接有PDF或CAJ等格式的全文。全文可通過數據庫下載后保存在“課題文件夾”中,最后利用NE“批量鏈接附件“功能來批量鏈接,但這個工作量比較大,耗時較長,過程繁瑣。在實際應用過程中,本文作者通過實踐摸索出了一個省事、省時的全文鏈接辦法,下面以CNKI為例來闡明全文直接下載、鏈接過程:全選NE中的所有需要下載全文的文獻→檢索(工具欄)→下載全文→選擇全文數據庫→CNKI→點擊下載之后,NE會自動從數據庫中批量下載、鏈接全文,而后研究者只要保證網絡暢通即可,不用再理會下載過程,等下載完全后關閉下載平臺即可,見圖2。研究者可酌情決定具體從哪些數據庫下載全文。
2.5對文獻進行文獻計量學分析
NE提供了一個“文件夾信息統計”功能,利用此功能可對文獻進行計量學統計、分析。NE中設置的可統計字段包括文獻類型、作者、年份、期刊、作者機構、主題、基金類型等共有55項,研究者在實際統計過程中可以根據分析需要選擇合適的需要的字段,也可以根據需要自行增添統計字段。在NE操作界面,選中需要進行統計分析的專題數據庫,在工具欄打開文件夾,選擇文件夾信息統計,系統會彈出一個文件夾統計信息界面,研究者在界面“字段”欄內可根據需要,選擇題錄類型、作者、年份、期刊等字段,點擊統計,NE會自動對所選的專題數據庫中的所有內容按需要分析,見圖3,利用word或EXCEL對統計結果進行表、圖表示。
文獻計量學分析通常會以圖或者表的形式把信息內容表達出來,以方便研究者或讀者進行直觀的理解和分析。在NE中,統計后的數據可以以“另存為”(見圖3)的方式保存在課題文件夾中,而后再直接導入EXCEL或word中根據研究者的需要以圖或者表的形式表示出來,示例見圖4。圖4是本研究者通過NE對源于三大中文期刊數據庫:維普、CNKI及萬方中研究文獻計量學的4 296篇期刊論文的年份統計。由圖4可以看出:我國自1981-2011年30年期間,有關文獻計量學分析的文獻發文量基本上呈逐年增長的趨勢,發文量在2010年達到歷史最高,共有488篇,說明我國研究者越來越認識到利用文獻計量學深入研究學科或專題的重要性。同理,研究者還可以通過NE對作者、期刊來源、基金類型、作者機構、主題等內容作系統而方便的統計分析,為科研工作者深入地認識和研究課題提供更高質量、更有深度的文獻信息服務。
圖4我國有關文獻計量學研究的年度發文趨勢
3展望
利用文獻管理軟件NE對海量信息進行有效歸總和統計分析是一種進行文獻計量學研究的方便的、行之有效的新工具。它的使用讓文獻計量學的研究不再是繁瑣的、屬于少數人的專利,任何研究者都可以利用它來對自己感興趣的學科、課題或專題進行高質量的文獻計量學研究。高校信息服務人員更應該充分利用NE這一功能來有效提高科技查新、專題服務、讀者培訓等信息服務,拓展信息服務深度,并借助NE便利的文獻歸總和數據統計功能撰寫出更多的有關專題或學科的文獻計量學研究的文章,在提高信息服務質量的同時為我國文獻計量學研究的發展貢獻自己一份力量。
參考文獻
[1]A P.STATISTICAL BIBLIOGRAPHY OR BIBLIOMETRICS[J].Journal of Documentation.1969,25(4):348-349.
[2]邱均平.文獻計量學[M].北京:科學技術文獻出版社,1988.
[3]董琳.學科評價之文獻計量數據準備[J].情報理論與實踐,2010,(6):49-52.
[4]唐紀元,尹衍玲,李娜.《中華實驗和臨床感染病雜志(電子版)》2007至2009年文獻計量學分析[J].中華實驗和臨床感染病雜志(電子版),2011,(1):108-111.
[5]趙瑩,張家琦,郭向飛.2008~2009年《中國健康心理學雜志》文獻計量學分析[J].農業圖書情報學刊,2011,(2):81-83.
[6]高丹.2009年《圖書館理論與實踐》的文獻計量學分析[J].科技情報開發與經濟,2011,(2):70-73.
[7]朱巧玲,李瀟捷,指導,等.1999-2009年國內神經性皮炎文獻計量學研究[J].河南中醫,2011,(3):302-303.
[8]趙慶齡,路文如.中美土壤重金屬污染超富集植物文獻計量分析——以印度芥菜為例[J].中國農學通報,2011,(4):370-375.
[9]張稚鯤,李文林.古籍數字化建設的文獻計量學研究[J].圖書館理論與實踐,2011,(2):45-51.
[10]張燕,王婷,孫成權,等.國際青藏高原及其周邊地區研究文獻計量分析報告(2003-2008年)[J].地理科學進展,2011,(3):369-378.
[11]管永昌.基于CNKI的我國圖書館信息服務平臺研究文獻的文獻計量分析[J].科技情報開發與經濟,2011,(8):25-28.
[12]孫涵雪,劉旭峰,許昌泰.PubMed數據庫中(1979~2008)飛行員與心理療法文獻計量學分析[J].醫學綜述,2011,(2):297-300.
[13]李紅閣,呂建新,倪崖.1989-2009年國內白癜風研究文獻計量學分析[J].溫州醫學院學報,2011,(1):90-92.
[14]查先進,曹晨.近20年我國信息資源配置研究文獻計量分析[J].圖書情報工作,2010,(20):6-10.
[15]周宇梅,王麗琳.2001-2005年我國保險學文獻計量分析[J].圖書情報工作,2007,(3):137-139.
[16]唐勇.我國圖書館虛擬咨詢相關研究的文獻計量分析[J].現代情報,2011,(1):97-99.
[17]馬秀文,和艷會.采用文獻計量法分析我國蝴蝶蘭研究現狀與發展趨勢[J].安徽農業科學,2011,(6):3761-3762.
[18]張曉鵬,朱曉宇,劉則淵.國際公共危機管理研究的文獻計量學分析[J].科學學與科學技術管理,2011,(3):117-121.
[19]鄭巧玲,黃漢林,黃永順,等.從文獻計量學角度評析國內三氯乙烯職業病危害防治研究狀況[J].中國職業醫學,2011,(1):17-20.
[20]張燕蕾,沈霞,陳大方.抗精神病藥與2型糖尿病相關關系的文獻計量學研究[J].中國藥物依賴性雜志,2011,(1):65-68.
[21]NoteExpress 在線教程[EB/OL].http:∥www.reflib.org/,2012-6-15.
(本文責任編輯:孫國雷)