,,
(南京交通職業(yè)技術(shù)學(xué)院,江蘇 南京 211188)
超星發(fā)現(xiàn)系統(tǒng)(http:∥ss.zhizhen.com/)是北京超星公司研發(fā)的、我國最大的文獻檢索系統(tǒng),具有強大的知識挖掘和情報分析功能。它以海量元數(shù)據(jù)為基礎(chǔ),利用數(shù)據(jù)存儲、資源整合、知識挖掘、數(shù)據(jù)分析、文獻計量學(xué)模型等相關(guān)技術(shù),進行復(fù)雜異構(gòu)數(shù)據(jù)庫的集成整合,實現(xiàn)高效、精準(zhǔn)、統(tǒng)一的檢索。其功能主要有:檢索、多維面聚類、多種排序顯示、可視化及關(guān)聯(lián)信息圖譜、全文獲取渠道鏈接、參考與引證、基于關(guān)聯(lián)規(guī)則的擴展發(fā)現(xiàn)、多主題對比、社區(qū)分享等。
超星發(fā)現(xiàn)系統(tǒng)的個性化服務(wù)模式(圖1)包含:1)個性化存儲服務(wù):在發(fā)現(xiàn)系統(tǒng)中開辟個性空間,以實現(xiàn)檢索信息保存,如以讀書、講座、課程為主的學(xué)習(xí)空間、檢索式保存、檢索結(jié)果的收藏/分享。2)個性化組織服務(wù):多維度整合發(fā)現(xiàn)系統(tǒng)信息資源,以多項組配聚類,精煉用戶所需資源信息。3)個性化檢索服務(wù):根據(jù)不同的功能,針對不同的檢索者提供的檢索目標(biāo),提供智能輔助檢索功能,如檢索詞聯(lián)想、常用檢索詞列表;針對檢索結(jié)果進行多角度個性化排序、輸出,如排序方式(館藏優(yōu)先/出版日期/學(xué)術(shù)性/相關(guān)性/引文量)多角度,題錄輸出(單個/多個/單頁/多頁)、輸出格式(文本/參考文獻/查新/參考文獻管理軟件等格式)多樣化、題錄信息二維碼掃描。4)個性化分析服務(wù)主要將用戶檢索的信息進行知識圖譜可視化分析、多主題分析、引證分析等。5)全文獲取鏈接服務(wù)是為用戶提供全文鏈接的獲取渠道,如:文獻傳遞、文章下載、電子全文、圖書試讀。

圖1 超星發(fā)現(xiàn)系統(tǒng)的個性化服務(wù)
超星發(fā)現(xiàn)系統(tǒng)的個性化分析服務(wù)功能可幫助用戶快速了解相關(guān)主題的研究發(fā)展現(xiàn)狀,分析預(yù)測其未來發(fā)展趨勢。筆者登錄超星發(fā)現(xiàn)系統(tǒng)的高級檢索界面,選取開放獲取研究文獻進行“學(xué)術(shù)輔助分析系統(tǒng)”的個性化服務(wù)體驗,解析相關(guān)詞為“開放獲取、開放存取、Open Access、OA”。檢索測試發(fā)現(xiàn)涉及檢索詞“OA”的研究成果出現(xiàn)大量“辦公自動化:Office Automation”研究,而在“全部”字段檢索下,涉及“OA”的開放獲取研究多數(shù)包含前三個主題詞。因此,本文開放獲取文獻檢索詞設(shè)定為“開放獲取、開放存取、Open Access”,設(shè)定“全部”字段、邏輯“或”匹配、“精確”模式、“所有文獻類型”進行檢索。檢索日期是2016年4月22日,檢索返回 13 148 條結(jié)果,總被引次數(shù) 18 289 次。精煉檢索限定在“只檢索學(xué)術(shù)文章”,檢索返回 7 575 條結(jié)果,總被引次數(shù) 18 228 次。從檢索結(jié)果數(shù)據(jù)看,精煉檢索排除了42.3%的文獻,保證了檢索結(jié)果的查全率和查準(zhǔn)率。
對某主題的研究年代進行分析,可反映該項主題的發(fā)展趨勢。2004年以前開放獲取概念逐漸被接受并進入實踐,如:2001年發(fā)布《布達佩斯開放獲取計劃》,2002年開放獲取資源項目的出現(xiàn),2003—2004年由知識倉儲建設(shè)引發(fā)的開放存儲的推出,說明開放獲取模式處于起步創(chuàng)新階段。因此,如圖2所示,2004年以前開放獲取研究文獻較少。之后五年是開放獲取的鞏固期,此時期多種類型資源被開放,開放獲取的使用量、影響力在逐漸增長,帶動研究成果的輸出。因此,2005—2010年開放獲取研究成果處于穩(wěn)步上升階段。而2010—2012年開放獲取研究成果比較穩(wěn)定,這與2009—2011年開放獲取穩(wěn)定的應(yīng)用現(xiàn)狀,如開放獲取聯(lián)盟/門戶的出現(xiàn)、法案的推出是相吻合的。2012年以后開放獲取研究成果量達到了一個新的高度,均在800篇以上,仍處于上升階段。此階段開放獲取組織轉(zhuǎn)變?yōu)楦顚哟蔚闹R服務(wù),進入戰(zhàn)略發(fā)展期,開放獲取仍是研究熱點。

圖2 開放獲取相關(guān)論著發(fā)文量趨勢圖
超星知識發(fā)現(xiàn)系統(tǒng)共涉及12種文獻資源類型,將“開放獲取”相關(guān)研究進行精煉檢索后,檢索結(jié)果顯示5種學(xué)術(shù)文獻類型。
2.2.1 圖書文獻統(tǒng)計。超星發(fā)現(xiàn)系統(tǒng)收錄開放獲取相關(guān)圖書有48本,總被引次數(shù)是181次,其中2014年出版量達11本。圖書相對于其他文獻類型較可靠,出版周期較長,當(dāng)研究者研究較成熟時,會將研究成果轉(zhuǎn)化為圖書。出版最早的是2006年劉廷元主編的《數(shù)字信息檢索教程》一書,其引用量是20次。2006年喬冬梅的《e印本文庫e-print archive建設(shè)與應(yīng)用—開放存取運動典型策略研究》一書,被引13次。2008年劉廷元的《信息檢索教程》也有涉及文獻獲取,其被引次數(shù)為13次。被引次數(shù)最高的是2009年王細(xì)榮等人的《文獻信息檢索與論文寫作》一書,被引27次。此四本書被引次數(shù)排名前四,說明三位學(xué)者的論著是被圖書情報界普遍認(rèn)可的,是值得學(xué)者參考借鑒的。
2.2.2 期刊文獻統(tǒng)計。超星發(fā)現(xiàn)系統(tǒng)收錄的開放獲取的學(xué)術(shù)性期刊文章共 6 595 篇,占總量的93.3%,總被引次數(shù) 17 223 次,發(fā)文量一直是穩(wěn)步上升。從文獻的相關(guān)性和學(xué)術(shù)性看,期刊是具代表性的,它出版周期短,發(fā)表迅速,一般學(xué)者研究成果會最先在期刊上發(fā)表。
其中,開放獲取研究核心發(fā)文量 3 318,被引量為 12 595 次,占總量的69%,其中主要集中在中文核心期刊、統(tǒng)計源期刊、CSCD、CSSCI四種來源中。為確保開放獲取研究的可靠性,利用超星發(fā)現(xiàn)系統(tǒng)檢索結(jié)果頁面左側(cè)的“重要期刊”,精煉檢索結(jié)果,選擇“中文核心期刊、統(tǒng)計源期刊、CSSCI、CSCD、SCI、EI、SSCI”六個來源數(shù)據(jù)庫的期刊文獻的文種、作者、機構(gòu)進行統(tǒng)計分析。
(1)核心刊種統(tǒng)計

圖3 開放獲取研究核心刊種發(fā)文統(tǒng)計圖
檢索統(tǒng)計涉及開放獲取研究期刊49種,而圖5列出的是涉及開放獲取研究發(fā)文量在40篇以上的期刊,以圖書情報類期刊為主。《世界華人消化雜志》《世界胃腸病學(xué)雜志》均以開放獲取的模式出版,實現(xiàn)了臨床醫(yī)師和公眾的利益最大化,不涉及開放獲取研究的實質(zhì)內(nèi)容。圖3中其他非圖情類的期刊均是因開放獲取的出版模式而列出。排在第三位的《圖書情報工作》刊發(fā)212篇開放獲取論文,其被引 1 697 次,其中出現(xiàn)開放獲取關(guān)鍵詞73次,開放存取關(guān)鍵詞55次,涉及一級相關(guān)詞:研究成果、虛擬組織、機構(gòu)知識庫、知識管理、按需印刷,由此可見開放獲取的研究熱點。
(2)核心作者統(tǒng)計
筆者利用超星發(fā)現(xiàn)系統(tǒng)分層聚類功能,將第一作者和作者機構(gòu)匹配,準(zhǔn)確列出排名前十作者發(fā)文數(shù)據(jù)。見表1:發(fā)文量最多的作者是中國科學(xué)院的張曉林,引文量最多的是北京大學(xué)的李武。作者發(fā)文量和引文量的統(tǒng)計,是評價該學(xué)科領(lǐng)域?qū)W術(shù)影響力的常用指標(biāo)。可見,二位學(xué)者的學(xué)術(shù)影響力和開放獲取研究成果的被認(rèn)可度。

表1 開放獲取研究核心期刊發(fā)文前十列表
(3)核心發(fā)文機構(gòu)統(tǒng)計
超星發(fā)現(xiàn)系統(tǒng)頁面左側(cè)列出了開放獲取的機構(gòu)及出現(xiàn)頻次,其可視化圖形列出了15個機構(gòu)。如圖4所示,頻次用圓圈大小表示,圓圈越大,出現(xiàn)頻次越高。共現(xiàn)關(guān)系用連線表示,越短共現(xiàn)頻次越高,相關(guān)性越強。開放獲取的研究除中國科學(xué)院、中國科學(xué)信息研究所外,其余均來自高校。表2中,筆者按以第一作者身份在核心期刊發(fā)表相關(guān)論文最多的機構(gòu)學(xué)者為代表列出,若發(fā)文量相當(dāng),取引文量最多的學(xué)者列出。借助機構(gòu)分析,可與學(xué)者建立溝通渠道,開展研究課題相關(guān)的個性化服務(wù),進行定題跟蹤。由研究機構(gòu)、代表學(xué)者的發(fā)文量、引文量可知其學(xué)術(shù)影響力。
2.2.3 學(xué)位論文統(tǒng)計。學(xué)位論文的系統(tǒng)性、成熟性、學(xué)術(shù)性、創(chuàng)新性、學(xué)術(shù)性、內(nèi)容容量、發(fā)文量、發(fā)文速度均介于圖書和期刊論文之間。超星發(fā)現(xiàn)系統(tǒng)收錄的關(guān)于開放獲取的學(xué)位論文為309篇,總被引次數(shù)716次。由超星發(fā)現(xiàn)系統(tǒng)的相關(guān)論著發(fā)文量趨勢圖,可知2010年被引峰值45次。其中,博士論文34篇,碩士論文273篇。與開放獲取研究密切相關(guān),學(xué)位論文前五的機構(gòu)及學(xué)位數(shù)量:武漢大學(xué)39篇、吉林大學(xué)21篇、中國科學(xué)院14篇、東北師范大學(xué)13篇、燕山大學(xué)12篇,被引量分別為:65、133、3、69、29次。其中,2008年吉林大學(xué)鄧君《機構(gòu)知識庫建設(shè)模式與運行機制研究》一文被引量最高,達50次。

圖4 開放獲取研究核心發(fā)文機構(gòu)統(tǒng)計圖
/

相關(guān)級別機構(gòu)發(fā)文量引文量代表學(xué)者學(xué)者發(fā)文量(篇)學(xué)者被引量(次)一級中國科學(xué)院1441 455張曉林11149一級武漢大學(xué)971 280黃如花13266一級北京大學(xué)47979李 武4574一級南京大學(xué)37151袁順波536

續(xù)表2
2.2.4會議論文統(tǒng)計。會議論文要求是就相應(yīng)學(xué)科研究的發(fā)現(xiàn)、進展和成就方面提出新的研究課題和新的設(shè)想,才能在學(xué)術(shù)會議上首次發(fā)布,然后在期刊上發(fā)表。超星發(fā)現(xiàn)系統(tǒng)收錄的開放獲取相關(guān)會議論文258篇,被引次數(shù)108次,2014年被引峰值59次。其中,國家自然科學(xué)基金委員會科學(xué)基金雜志部任勝利在“第三屆全國核心期刊與期刊國際化、網(wǎng)絡(luò)化研討會”上發(fā)表的《開放存取(Open Access):現(xiàn)狀與展望》一文被引65次,其余被引次數(shù)很少。會議論文從發(fā)文量和被引次數(shù)均落后于圖書、期刊、學(xué)位論文。這種現(xiàn)象在一定程度與學(xué)者的研究成果優(yōu)先發(fā)表在期刊上有關(guān)系。
超星發(fā)現(xiàn)系統(tǒng)采用“中國圖書館分類法”對每篇文獻進行分類,開放獲取研究涉及學(xué)科主要集中在“文化、科學(xué)、教育、體育”和“醫(yī)藥、衛(wèi)生”。其中,“文化、科學(xué)、教育、體育”學(xué)科 3 448 篇,被引次數(shù) 16 891 次,占總被引量92.7%,說明開放獲取的研究主要集中在該領(lǐng)域。“醫(yī)藥、衛(wèi)生”學(xué)科 2 218 篇,被引次數(shù)94次,主要內(nèi)容是開放獲取出版模式資源、投稿須知之類的文獻,少量提及開放獲取實質(zhì)性研究。
關(guān)鍵詞是對文章內(nèi)容的高度概括和凝練,借助關(guān)鍵詞分析主題內(nèi)容可確定研究領(lǐng)域的熱點問題。為確切掌握開放獲取研究重點,關(guān)鍵詞分析時借助系統(tǒng)的聚類分析精煉檢索結(jié)果,選取重點學(xué)科“文化、科學(xué)、教育、體育”涉及關(guān)鍵詞分析,了解該學(xué)科與開放獲取研究相關(guān)知識群的結(jié)構(gòu)。該學(xué)科開放獲取研究文獻 3 448 篇,占超星收錄開放獲取研究文獻總量的45.5%。由圖5可知開放獲取研究的一級高頻共現(xiàn)詞是圖書館、機構(gòu)知識庫、高校圖書館、學(xué)術(shù)期刊、信息資源。二級關(guān)鍵詞是資源建設(shè)、科技期刊、學(xué)術(shù)交流、學(xué)術(shù)出版、出版模式,三級關(guān)鍵詞是期刊、學(xué)術(shù)信息、中國科學(xué)院、數(shù)字圖書館、研究成果。表3是根據(jù)關(guān)鍵詞聚類分析列出共現(xiàn)詞涉及的開放獲取研究發(fā)文量和引文量,可知開放獲取的研究熱點。

圖5 開放獲取研究關(guān)鍵詞共現(xiàn)關(guān)系圖

一級關(guān)鍵詞二級關(guān)鍵詞關(guān)鍵詞共現(xiàn)頻次相關(guān)論文被引量關(guān)鍵詞共現(xiàn)頻次相關(guān)論文被引量圖書館2811 344資源建設(shè)143521機構(gòu)知識庫2771 628科技期刊137998高校圖書館2681 097學(xué)術(shù)交流1331 243學(xué)術(shù)期刊1441 441學(xué)術(shù)出版991 268信息資源143748出版模式93834
借助基金項目的可視化分析,可知開放獲取研究文獻的支撐情況,同樣代表學(xué)術(shù)影響力。開放獲取研究涉及基金389項,主要集中在省市基金項目、國家社會科研基金項目、國家教育部基金,此三項共計337篇,占總量的86.6%。其中,社科基金項目涉及文獻被引次數(shù)最高為869次。胡德華的《開放存取期刊論文質(zhì)量和影響力的評價研究》一文被引52次,源于國家社會科學(xué)基金項目“開放存取期刊質(zhì)量及其文獻保障率與圖書館因應(yīng)之策”成果;最新一篇是2015年丁大尉《科學(xué)信息開放獲取模式的STS考察》一文,源于國家社會科學(xué)基金后期資助項目“網(wǎng)絡(luò)環(huán)境下當(dāng)代科學(xué)交流體系的重構(gòu)”成果。利用基金項目分析功能,可獲取開放獲取研究熱點、科研價值。
筆者借助超星發(fā)現(xiàn)系統(tǒng)從文獻類型、學(xué)科、基金、關(guān)鍵詞、重要期刊、機構(gòu)、作者等多角度聚類統(tǒng)計分析開放獲取研究成果,發(fā)現(xiàn)開放獲取已然成為圖書情報界、學(xué)術(shù)界、出版界、政府和國際組織共同關(guān)注的熱點問題。我國以中國科學(xué)院為代表單位,在機構(gòu)知識庫、知識管理、學(xué)術(shù)交流、出版模式等方面做了大量研究,可以預(yù)測開放獲取在未來一段時間仍是圖書情報界的熱點話題。有人預(yù)測到2025年,圖書館通過機構(gòu)知識庫自我存檔等各種聚合手段提供服務(wù)的學(xué)術(shù)資源數(shù)量將超過購買的資源。因此,作為圖書館不能單純地享用開放獲取免費資源,應(yīng)積極與學(xué)術(shù)交流、圖書館戰(zhàn)略轉(zhuǎn)型結(jié)合起來。在尊重知識產(chǎn)權(quán)的基礎(chǔ)上,利用開放獲取的方式,促進學(xué)術(shù)成果的保存和傳播。
此外,知識發(fā)現(xiàn)系統(tǒng)是大數(shù)據(jù)時代衍生的用于海量資源整合、數(shù)據(jù)關(guān)聯(lián)、情報分析處理的統(tǒng)一學(xué)術(shù)檢索平臺。而超星發(fā)現(xiàn)系統(tǒng)以其特有的個性化服務(wù)功能為用戶服務(wù),結(jié)合文獻計量方法,多維度聚類文獻資源,將主題資源進行可視化分析,深入了解主題/學(xué)科資源動態(tài),實現(xiàn)了科研定題跟蹤服務(wù)。不過,筆者通過對超星知識發(fā)現(xiàn)系統(tǒng)個性化服務(wù)體驗,發(fā)現(xiàn)其缺乏個性化定制(RSS、Email)服務(wù)、基于Web 2.0的用戶參與功能不足、缺少分類號聚類分析、英文字母大小寫檢索結(jié)果不統(tǒng)一等問題。在云環(huán)境和大數(shù)據(jù)分析技術(shù)的支持下,超星發(fā)現(xiàn)系統(tǒng)應(yīng)借鑒數(shù)據(jù)關(guān)聯(lián)、語義搜索技術(shù)完善檢索功能,建立統(tǒng)一規(guī)范化元數(shù)據(jù)標(biāo)引體系,保證檢索結(jié)果的全面準(zhǔn)確性。利用Wiki、Folksonomy、FRBR等技術(shù)與用戶使用信息結(jié)合,創(chuàng)造基于關(guān)聯(lián)規(guī)則的新發(fā)現(xiàn)。以用戶需求為中心,開發(fā)更多滿足多層次、多元化用戶需求的個性化服務(wù)。