(廣西科技大學圖書館,廣西 柳州 545006)
高校科研數(shù)據(jù)是國家科學數(shù)據(jù)的重要組成部分,在國家科技發(fā)展、教育教學發(fā)展中發(fā)揮著重要作用。近年來,社會各界對高校科研數(shù)據(jù)給予了較大的關注。從2001年開始,陸續(xù)有學者對高校的科研數(shù)據(jù)進行了研究并發(fā)表相關文獻,2013—2014年刊發(fā)論文數(shù)量突增,并在隨后幾年持續(xù)走高,如圖1所示。本文以CiteSpace5.0為計量工具,在CNKI數(shù)據(jù)庫以高校、大學、科研數(shù)據(jù)、科學數(shù)據(jù)詞匯為主題詞提取數(shù)據(jù)源,以知識圖譜的形式,梳理并解析該領域的研究脈絡、熱點前沿以及發(fā)展趨勢。

圖1 高校科研數(shù)據(jù)研究領域相關研究文獻總體趨勢分析
在對檢索結(jié)果數(shù)據(jù)分析研究前,按如下步驟對原始數(shù)據(jù)進行了預處理:
(1)數(shù)據(jù)的下載:檢索時間為2019年1月21日,在CNKI數(shù)據(jù)庫設定文獻類型為“期刊”,來源類別勾選“全部期刊”,設置檢索年限為1998—2018年,以檢索式“主題=(科學數(shù)據(jù)或科研數(shù)據(jù))與(高校或大學)”進行檢索,共檢索出857條結(jié)果,其中核心期刊論文426篇,占結(jié)果論文總數(shù)的一半。
(2)數(shù)據(jù)的清洗與格式轉(zhuǎn)化:通過CiteSpace5.0軟件的CNKI數(shù)據(jù)格式轉(zhuǎn)換器,將下載的數(shù)據(jù)進行清洗、過濾、除重,轉(zhuǎn)換變成Web of Science數(shù)據(jù)格式,供CiteSpace進行分析。
(1)科學合作網(wǎng)絡分析:科學合作是指研究學者為生產(chǎn)新的科學知識這一共同目的而在一起工作(Katz J S,Martin B R,1997)。科學合作一般是指一篇論文同時出現(xiàn)不同的作者、機構(gòu)或者國家(地區(qū)),則被認為存在合作關系。CiteSpace提供微觀的學者合作網(wǎng)絡Co-Author、中觀的機構(gòu)合作網(wǎng)絡Co-institution和宏觀的國家或地區(qū)的合作Co-country/territory三個層次的科學合作網(wǎng)絡分析。本文主要對前兩者進行科學合作網(wǎng)絡分析。
(2)詞頻分析方法:詞頻是指所分析的文檔中詞語出現(xiàn)的次數(shù)。詞頻分析方法是指在文獻信息中提取能夠表達文獻核心內(nèi)容的關鍵詞或主題詞頻次的高低分布,來研究某領域發(fā)展動向。
(3)共詞分析方法:共詞分析的基本原理是對一組詞兩兩統(tǒng)計它們在同一組文獻中出現(xiàn)的次數(shù),通過這種共現(xiàn)次數(shù)來測度它們之間的親疏關系。共詞分析相比文獻的共被引和耦合,其得到的結(jié)果是更直觀。CiteSpace分析共詞的方法有兩種:一種是直接分析作者的原始關鍵詞和數(shù)據(jù)庫的補充關鍵詞,另一種則是從數(shù)據(jù)集的標題、作者關鍵詞、系統(tǒng)補充關鍵詞以及摘要中提取名詞性術語。本文使用的是前者對原始字段的共詞分析。
由于作者的發(fā)文量可從數(shù)量的角度揭示作者對具體領域研究的持續(xù)性、深度及貢獻大小,本文將經(jīng)過處理的文獻導入CiteSpace5.0中進行分析。具體參數(shù)設定為:時間為“1998—2018年”,Years Per Slice為“5”,Node Types為“Author”,Selection Criteria為“Top50”,路徑搜索算法為“pathfinder”。通過軟件運行獲取作者聚類視圖,即可統(tǒng)計出近二十年間累計發(fā)文量排名前50名的作者數(shù)據(jù)。統(tǒng)計后的可視化結(jié)果如圖2所示(部分截圖),數(shù)據(jù)只統(tǒng)計作者發(fā)文篇次,不考慮排名位次;結(jié)點大小代表發(fā)文量的頻次;結(jié)點之間的連線代表作者間的合作關系,連線的粗細代表作者之間的合作緊密程度。

圖2 高校科研數(shù)據(jù)研究領域發(fā)文量TOP50作者聚類知識圖譜
根據(jù)圖2所示的發(fā)文量TOP50作者聚類視圖,可得如下分布特征。
以司莉、衛(wèi)軍朝、沈婷婷、吳鳴、胡卉、孟祥保、黃如花、張群、張計龍等為代表的絕大多數(shù)高產(chǎn)作者已形成密切活躍的科研合作關系,論文(尤其是核心期刊論文)多以合著形式發(fā)表。跨地域、跨機構(gòu)的學者之間的合作正在逐步形成,如武漢大學的司莉分別與湘潭大學、上海大學的學者合作,東南大學的孟祥保分別與深圳大學、深圳市圖書館、西南交通大學的學者合作,江蘇大學的劉桂鋒與上海海事大學的學者合作,上海大學的沈婷婷與河北師范大學的老師合作,而上海大學的衛(wèi)軍朝與華東師范大學的蔚海燕合作發(fā)文有4篇之多。
如表1所示,在該研究領域內(nèi)發(fā)文數(shù)量排名TOP10的學者中,無一例外,全部來自于高校的圖書館、信息管理學院、信息研究所或中國科學院文獻情報中心。這些專家本身對信息數(shù)據(jù)具備高度的敏感性,對發(fā)現(xiàn)和探索大數(shù)據(jù)時代新出現(xiàn)的信息研究前沿問題(如科學數(shù)據(jù)研究)極具優(yōu)勢,既擅長于前瞻性的課題研究,又能兼顧基礎性的課題研究,對整個科研數(shù)據(jù)的研究領域起到了行業(yè)指導的引領作用。
在高校科研數(shù)據(jù)研究領域內(nèi)發(fā)文數(shù)量排名TOP40的學者中,司莉、黃如花、鄧仲華、莊曉喆、完顏鄧鄧、曾粵亮6位學者皆來自于武漢大學,且前2位都進入TOP10;宗曉華、吳向東、袁培國、馬曉軍、袁勤儉4位學者的科研單位均為南京大學;上海大學的3位學者衛(wèi)軍朝、沈婷婷、郝媛玲,其中前2位進入TOP10。

表1 1998—2018年高校科研數(shù)據(jù)研究領域發(fā)文量TOP10作者信息
研究機構(gòu)的共現(xiàn)詞分析有助于明確該領域的研究力量分布特點,是發(fā)現(xiàn)該領域核心機構(gòu)的最有效方法之一,且能為相關研究機構(gòu)合作、交流提供依據(jù)。本文再次將檢索到的文獻導入CiteSpace5.0,參數(shù)設置為:Node Types為“Institution”,Selection Criteria為“Top50”,其他設置不變。通過運行軟件獲取研究機構(gòu)的聚類知識圖譜,如圖3所示(截圖)。

圖3 發(fā)文量排名TOP50的機構(gòu)聚類知識圖譜
由圖3機構(gòu)聚類知識圖譜可看出,高校科研數(shù)據(jù)研究領域高影響力科研機構(gòu)互動合作關系密切,發(fā)展態(tài)勢較好。具體有以下特征:
多元化的跨機構(gòu)合作形式有助于科研人員知識的碰撞和創(chuàng)新,從而實現(xiàn)理論知識與研究實踐的結(jié)合及優(yōu)勢互補。主要包括3種形式:1)高校院系與本校圖書館的合作。如武漢大學信息管理學院與武漢大學圖書館的合作,北京大學信息管理系與北京大學圖書館的合作,中山大學資訊管理學院與中山大學圖書館的合作。2)高校院系與外校圖書館的合作。如武漢大學信息管理學院與上海大學圖書館的合作,南京大學信息管理學院與西北大學圖書館的合作。3)高校院系與科技情報研究所的合作。如遼寧師范大學管理學院與中國科學院文獻情報中心的合作,中國科學院大學與多家文獻情報中心(包括中科院蘭州文獻情報中心、中科院成都文獻情報中心、中科院文獻情報中心)的合作。
從圖3可以看到,在當?shù)匮芯繖C構(gòu)合作的基礎上,已經(jīng)呈現(xiàn)出了超越地理局限的跨地區(qū)機構(gòu)合作的趨勢,其中兩個大的跨區(qū)域合作網(wǎng)絡尤為引人注目:以武漢大學信息管理學院為中心、上海大學圖書情報檔案系為次中心的合作網(wǎng)絡,覆蓋了武漢、上海、河南焦作、湖南湘潭四個地區(qū)的十所科研機構(gòu);以中國科學院大學為中心、中國科學文獻情報中心為次中心的合作網(wǎng)絡,覆蓋了北京、成都、蘭州、大連四地的6所科研機構(gòu)。跨地區(qū)機構(gòu)的攜手合作有助于打破信息壁壘,實現(xiàn)數(shù)據(jù)開放與共享。
表2列舉了高校科研數(shù)據(jù)研究領域的核心期刊發(fā)文量TOP10的科研院所,可以看到,高校院系、研究所及圖書館是重要的科研主體,是研究高校科研數(shù)據(jù)的中堅力量。該10所科研機構(gòu)所發(fā)核心論文總數(shù)占該領域核心論文總數(shù)的1/3強。該領域的文獻研究涵蓋多個主題:高校圖書館、科研數(shù)據(jù)管理服務、數(shù)據(jù)監(jiān)管或監(jiān)護、機構(gòu)知識庫、科研數(shù)據(jù)共享、數(shù)據(jù)科學、科研人員、數(shù)據(jù)素養(yǎng),等等。

表2 高校科研數(shù)據(jù)研究領域科研產(chǎn)出TOP10的機構(gòu)排名
通過繪制關鍵詞共現(xiàn)知識圖譜,可將近五年高校科研數(shù)據(jù)研究領域的研究內(nèi)容以圖譜的方式直接呈現(xiàn)出來,進而反映出該學科領域內(nèi)的知識結(jié)構(gòu)演變狀況及研究熱點。在CiteSpace 5.0軟件界面中,NodeTypes選擇為“keyword”,Selection Criteria選擇“Top50”,其他設置不變,運行CiteSpace 5.0軟件,可獲取1998年至2018年高頻關鍵詞聚類視圖的總體概況,如圖4所示。
此外,為探知1998—2018年每一年研究主題的發(fā)展演進情況,在CiteSpace5.0界面,時間分別設置為“1998—2003年”“2003—2008年”“2008—2013年”“2013—2018年”,Years Per Slice的值為“5”,Node Types選擇為“keyword”,Selection Criteria選擇“Top50”,其他設置不變,通過軟件運行分別獲取每一年高頻關鍵詞的聚類視圖。本文將1998—2018年每一年出現(xiàn)頻次≥30的高頻關鍵詞表進行了匯總,如表3所示。

表3 高頻關鍵詞
每年出現(xiàn)頻次≥30的高頻關鍵詞共有12個。排名第一的關鍵詞是“高校圖書館”,加上排名第五的“高校”和第八的“圖書館”,這說明大部分學者認可高校圖書館是研究和管理科研數(shù)據(jù)的主體機構(gòu),圖書館是高校中最適合管理數(shù)據(jù)并向其他單位和用戶提供數(shù)據(jù)服務的,如同管理其他文獻信息資源一樣。

圖4 1998—2018年高校科研數(shù)據(jù)研究領域核心期刊高頻關鍵詞的聚類視圖
對于排名第二和第六的兩個高頻關鍵詞“科學數(shù)據(jù)”“科研數(shù)據(jù)”,前者是指通過實驗、觀測、調(diào)查等科技活動或其他方式所獲取的、反映客觀世界本質(zhì)、變化規(guī)律和特征的基本原始數(shù)據(jù)和相關元數(shù)據(jù),以及按照某種特定需求系統(tǒng)加工整理的各類數(shù)據(jù)集;后者是指數(shù)字形式的研究數(shù)據(jù),包括在研究過程中產(chǎn)生的能存貯在計算機上的任何數(shù)據(jù),也包括能轉(zhuǎn)換成數(shù)字形式的非數(shù)字形式數(shù)據(jù)。如調(diào)研結(jié)果、神經(jīng)圖像、實驗數(shù)據(jù)、傳感器讀取的數(shù)據(jù)、遙感勘測數(shù)據(jù)、來自測試模型的仿真數(shù)據(jù)等。從它們的定義來看,兩者基本上是屬于同義詞,在研究實踐中,高校的學者更習慣把科學數(shù)據(jù)稱為“科研數(shù)據(jù)”。同理,排名第七和第十二的“科研數(shù)據(jù)管理”與“科學數(shù)據(jù)管理”也可視為同義關鍵詞。
從表3和圖4中可知,高校圖書館、科學數(shù)據(jù)、大數(shù)據(jù)、數(shù)據(jù)管理、科研數(shù)據(jù)等是當前高校科研數(shù)據(jù)領域內(nèi)的研究熱點。
4.2.1 以“高校圖書館”為代表的高頻關鍵詞,聚類詞匯有:大學圖書館、學科館員、學科服務、數(shù)據(jù)服務。數(shù)據(jù)密集型科研環(huán)境的到來以及科研人員個性化的信息需求,使數(shù)據(jù)服務逐漸成為高校圖書館學科服務新的發(fā)展方向。早在2008年,南京財經(jīng)大學的安艷杰等就提出“數(shù)據(jù)服務是圖書館參考咨詢服務中新的領域”,并介紹說國外把提供數(shù)據(jù)服務的圖書館員稱為“數(shù)據(jù)館員”。陳定權(quán)等、沈夢軒、完顏鄧鄧等、劉澈等、吳曉靜、汪全莉等、王翠萍等、劉莉等、汪滿容等、黃如花等一批學者紛紛介紹了國外高校圖書館在科研數(shù)據(jù)服務方面的寶貴經(jīng)驗,以期對國內(nèi)高校圖書館開展數(shù)據(jù)服務提供借鑒。王丹丹探索如何識別用戶的科學數(shù)據(jù)管理服務需求,提供了三種方法及相應的應用場景。朱彩萍研究了高校圖書館提供科學數(shù)據(jù)服務的途徑和內(nèi)容,特別提到將服務嵌入到科研過程中成為科學數(shù)據(jù)服務的主要途徑。沙淑欣等從博弈論的視角出發(fā),將圖書館作為數(shù)據(jù)服務合作開展的核心角色,分析其與各利益主體的關系,提出多方共贏的合作博弈策略,并構(gòu)建實現(xiàn)數(shù)據(jù)服務順利、高效開展的保障機制。楊佳等則從實踐出發(fā),介紹了上海圖書館利用數(shù)據(jù)可視化方法對圖書館的數(shù)據(jù)資源進行數(shù)據(jù)分析與挖掘的成果,借此進行數(shù)據(jù)創(chuàng)新服務實踐并幫助圖書館洞察運營情況和未來發(fā)展趨勢。郝媛玲對數(shù)據(jù)服務模式與數(shù)據(jù)館員新角色進行了思考,認為數(shù)據(jù)館員應該具備技術能力、知識能力、行為能力、環(huán)境能力等四種能力。
相比國外,我國高校圖書館科研數(shù)據(jù)服務的實踐剛剛起步,僅有幾所高校建設了數(shù)據(jù)服務平臺,如武漢大學圖書館高校科學數(shù)據(jù)共享平臺、復旦大學圖書館復旦大學社會科學數(shù)據(jù)研究中心、北京大學圖書館北京大學開放研究數(shù)據(jù)平臺等。然而,這幾個平臺均以技術型為主,突出數(shù)據(jù)主導,忽視數(shù)據(jù)服務,容易造成技術與人文隔離,影響用戶使用效果。高校圖書館作為科研數(shù)據(jù)服務的主要責任方,應該協(xié)調(diào)多方相關機構(gòu),合力建立以圖書館為主導的協(xié)同發(fā)展管理機制,隨時根據(jù)用戶的需求提供有效的科研數(shù)據(jù)服務。
4.2.2 以“科學數(shù)據(jù)”和“科研數(shù)據(jù)”為代表的高頻關鍵詞,聚類詞匯有:科學數(shù)據(jù)管理、科研數(shù)據(jù)管理、研究數(shù)據(jù)管理、科研支持、數(shù)據(jù)服務、數(shù)據(jù)監(jiān)管。我國學者對科研數(shù)據(jù)的研究最早見于1990年,近十年來研究和實踐都進入蓬勃發(fā)展時期。用戶對數(shù)據(jù)服務與科研支持服務的需求促使高校圖書館從單一的信息資源服務中心轉(zhuǎn)變?yōu)榧蒲小⒔虒W、學習、文化服務于一體的知識中心,根據(jù)不同研究階段的信息需求,為高校、企業(yè)及社會機構(gòu)的科研人員提供支撐性的知識服務。鄂麗君等《國外大學圖書館科研支持服務內(nèi)容介紹及特點分析》《“211工程”大學圖書館科研支持服務現(xiàn)狀調(diào)查分析》、朱彩萍《高校圖書館提供科學數(shù)據(jù)服務的途徑與內(nèi)容》、完顏鄧鄧等《英美澳科學數(shù)據(jù)存儲與共享平臺建設現(xiàn)狀調(diào)查及啟示》、王翠萍《國外高校圖書館科學數(shù)據(jù)服務現(xiàn)狀與啟示:以五所高校圖書館為例》等文獻值得借鑒和學習,受到業(yè)內(nèi)學者的高度關注與認可。
科研數(shù)據(jù)管理的目的是為了數(shù)據(jù)能夠被重復利用、節(jié)約研究成本。為保證數(shù)據(jù)的質(zhì)量,需要對數(shù)據(jù)施以科學的處理及有效的監(jiān)管,也就是說,要管理數(shù)據(jù)整個生命周期的活動,充分保持數(shù)據(jù)的完整性和真實性,確保數(shù)據(jù)經(jīng)過正確的評估、選擇并得以安全存儲,以支持適時訪問,并在今后的技術環(huán)境中保持其可用性。但對于科研數(shù)據(jù)監(jiān)管的研究,我國尚處于起步階段,主要以介紹國外的經(jīng)驗及對我國相關領域的啟示研究為主。在未來的研究中,應該把更多的關注放在實證研究上,以拓展該主題的研究深度與廣度。
4.2.3 以“大數(shù)據(jù)”為代表的高頻關鍵詞,聚類詞匯有:高校、圖書館、機構(gòu)知識庫、數(shù)據(jù)素養(yǎng)教育。2012年3月,美國奧巴馬政府公布“大數(shù)據(jù)研發(fā)計劃”,由此拉開大數(shù)據(jù)研究的序幕。我國學者順應時代發(fā)展洪流,迅速加入大數(shù)據(jù)研究的陣營。研究科學數(shù)據(jù)的學者敏銳地把大數(shù)據(jù)、科研數(shù)據(jù)和機構(gòu)知識庫聯(lián)系起來。機構(gòu)知識庫的建設是近十多年來中國科學院系統(tǒng)與高校圖書館一直在探索的熱點課題,它保存、積累和共享的,不僅僅是本機構(gòu)的研究成果,還應拓展到記錄和共享科研數(shù)據(jù),使它能夠還原科研過程。鄧佳等、陳和、周宇等學者一致認為,機構(gòu)知識庫應該增加科研數(shù)據(jù)的內(nèi)容。他們?yōu)槲覈鴻C構(gòu)知識庫存儲內(nèi)容的豐富發(fā)展提供了新思路。麻思蓓指出,機構(gòu)知識庫能夠為高校圖書館提供大數(shù)據(jù)分析的平臺,挖掘海量數(shù)據(jù)的潛在價值,讓隱性知識顯性化,從中發(fā)現(xiàn)新的知識,使其服務用戶、服務科研、服務創(chuàng)新主體和決策,讓圖書館成為科技創(chuàng)新的有力支撐。鄧君等則構(gòu)建了對機構(gòu)知識庫中所存儲的科學數(shù)據(jù)價值鑒定的模型。然而,現(xiàn)階段我國的機構(gòu)知識庫建設遇到了瓶頸,制約其發(fā)展的因素有很多,但究其根源,主要是因為相關政策的缺失。迄今為止,我國還沒有嚴格意義上的國家開放存取政策,組織及機構(gòu)級別的機構(gòu)知識庫相關政策也較少,大部分機構(gòu)知識庫是由基層的圖書館獨立支撐其建設、運營、維護并制定相應的政策。期望業(yè)內(nèi)有志之士,從各方面自上而下推動國家層面的宏觀政策、機構(gòu)中觀層面以及具體落實者層面的微觀政策的制定與實施,保障機構(gòu)知識庫的可持續(xù)發(fā)展,有效發(fā)揮科研數(shù)據(jù)的作用。
鑒于提供數(shù)據(jù)服務成為高校圖書館工作的新方向,一些學者提出了服務雙方都應該具備的數(shù)據(jù)素養(yǎng)教育問題。如焦海霞分析了信息素養(yǎng)館員向數(shù)據(jù)素養(yǎng)館員轉(zhuǎn)型的驅(qū)動因素,提供了數(shù)據(jù)能力的全方位構(gòu)建、數(shù)據(jù)文化的持久性浸潤、數(shù)據(jù)用戶的貢獻力挖掘的轉(zhuǎn)型路徑。董薇、隆茜等、徐劉靖等也研究了圖書館員數(shù)據(jù)素養(yǎng)能力的培養(yǎng)途徑。另外一部分學者,如鄧李君、凌婉陽、郝媛玲等、胡洋等、楊曉瓊、隆茜則從用戶的角度出發(fā),對如何提高科研人員、教師、學生等用戶的數(shù)據(jù)素養(yǎng)進行了探索和實踐。雖然目前在數(shù)據(jù)素養(yǎng)領域取得了一定的研究成果,但在數(shù)據(jù)需求與利用行為、數(shù)據(jù)素養(yǎng)概念模型、數(shù)據(jù)素養(yǎng)影響因素、數(shù)據(jù)素養(yǎng)評價與數(shù)據(jù)素養(yǎng)教育評價等方面的研究還存在不足。這些不足將成為后續(xù)研究的重點。
在科學研究正向數(shù)據(jù)密集型發(fā)展的背景下,科研數(shù)據(jù)的價值日漸凸顯,對科研數(shù)據(jù)的管理與共享的需求也日益增長。從前述分析來看,目前對高校科研數(shù)據(jù)的研究仍然處在發(fā)展上升期,相關研究文獻的體量還不算大。其間,雖然出現(xiàn)了不少研究熱點,但在政策的制定、相關部門的協(xié)調(diào)合作、實踐的推行、管理模式與評價機制等方面還很欠缺,與快速增長的數(shù)據(jù)產(chǎn)出和數(shù)據(jù)需求不相符合。在借鑒國外先進經(jīng)驗的同時,應該著力加快我國在科研數(shù)據(jù)管理與服務方面的務實建設,以推進科研創(chuàng)新與知識再創(chuàng)造。