姜 鑫 王德莊 馬海群
(1.黑龍江大學(xué)信息資源管理研究中心,黑龍江 哈爾濱 150080;2.黑龍江大學(xué)圖書(shū)館,黑龍江 哈爾濱 150080)
·管理論壇·
詞頻變化視角下我國(guó)“科學(xué)數(shù)據(jù)”領(lǐng)域研究主題演化分析
姜 鑫1王德莊2馬海群1
(1.黑龍江大學(xué)信息資源管理研究中心,黑龍江 哈爾濱 150080;2.黑龍江大學(xué)圖書(shū)館,黑龍江 哈爾濱 150080)
本文利用CNKI數(shù)據(jù)庫(kù)通過(guò)詞頻分析法結(jié)合共詞分析法對(duì)2005-2016年我國(guó)“科學(xué)數(shù)據(jù)”領(lǐng)域的研究主題進(jìn)行演化分析。選取2005-2016年“科學(xué)數(shù)據(jù)”領(lǐng)域發(fā)表于北大中文核心期刊和CSSCI來(lái)源期刊的547篇期刊論文作為數(shù)據(jù)來(lái)源,通過(guò)對(duì)數(shù)似然值結(jié)合相對(duì)變化率判斷關(guān)鍵詞詞頻的相對(duì)增長(zhǎng)、平穩(wěn)和下降趨勢(shì),識(shí)別不同研究時(shí)段“科學(xué)數(shù)據(jù)”領(lǐng)域的核心詞、突變?cè)~和新生詞,并結(jié)合共詞分析法揭示“科學(xué)數(shù)據(jù)”領(lǐng)域相關(guān)文獻(xiàn)研究主題的動(dòng)態(tài)演化趨勢(shì)。研究結(jié)果表明:2005-2016年我國(guó)“科學(xué)數(shù)據(jù)”領(lǐng)域的相關(guān)研究從以技術(shù)層面的研究主題為主逐漸過(guò)渡到管理層面、服務(wù)層面和政策層面的研究主題,圖書(shū)情報(bào)領(lǐng)域已逐漸成為我國(guó)“科學(xué)數(shù)據(jù)”相關(guān)研究的主要學(xué)科領(lǐng)域。
科學(xué)數(shù)據(jù)(Scientific Data),也稱(chēng)科研數(shù)據(jù)(Research Data),與科學(xué)論文一樣也被視為重要的科研產(chǎn)出,也是一種具有潛在經(jīng)濟(jì)價(jià)值的戰(zhàn)略資源。開(kāi)放科學(xué)數(shù)據(jù)對(duì)數(shù)據(jù)驅(qū)動(dòng)科學(xué)研究起到了關(guān)鍵作用,越來(lái)越多的研究是建立在對(duì)已有科學(xué)數(shù)據(jù)重用的基礎(chǔ)之上的。因此,完整保存并開(kāi)放獲取先前研究的科學(xué)數(shù)據(jù),對(duì)于順利開(kāi)展后續(xù)研究、推動(dòng)科學(xué)進(jìn)步具有重要意義。通過(guò)開(kāi)放科學(xué)數(shù)據(jù)改善社會(huì)生活受到眾多投資者、出版商、科學(xué)家和其他利益相關(guān)者的高度關(guān)注,歐洲、美國(guó)以及眾多國(guó)際組織與研究機(jī)構(gòu)都積極建立開(kāi)放科學(xué)數(shù)據(jù)的政策保障與管理機(jī)制,如美國(guó)已經(jīng)形成了以“完全與開(kāi)放”為基本國(guó)策的科學(xué)數(shù)據(jù)開(kāi)放共享法規(guī)體系。我國(guó)也已出臺(tái)開(kāi)放科學(xué)數(shù)據(jù)的相關(guān)管理規(guī)定,如早在2002年就已正式啟動(dòng)了科學(xué)數(shù)據(jù)共享工程,并先后在六大領(lǐng)域共計(jì)24個(gè)部門(mén)開(kāi)展了科學(xué)數(shù)據(jù)共享工作。伴隨著科學(xué)數(shù)據(jù)的開(kāi)放與共享、組織與分類(lèi)、監(jiān)管與服務(wù)、出版與引用等相關(guān)領(lǐng)域的實(shí)踐進(jìn)展,科學(xué)數(shù)據(jù)領(lǐng)域的各相關(guān)研究主題已經(jīng)引起了國(guó)內(nèi)外圖書(shū)情報(bào)、信息科學(xué)和其他學(xué)科領(lǐng)域的研究關(guān)注。司莉等(2014)利用CNKI數(shù)據(jù)庫(kù)通過(guò)共詞分析法和因子分析法確定了2003-2013年我國(guó)“科學(xué)數(shù)據(jù)”領(lǐng)域的8個(gè)研究主題[1]。謝智敏等(2015)利用CSSCI數(shù)據(jù)庫(kù)對(duì)我國(guó)“科學(xué)數(shù)據(jù)”領(lǐng)域的研究文獻(xiàn)從發(fā)文年代、發(fā)文作者、發(fā)文機(jī)構(gòu)、載文期刊等進(jìn)行了文獻(xiàn)計(jì)量分析[2]。周志峰(2016)利用CNKI數(shù)據(jù)庫(kù)通過(guò)共詞分析法、聚類(lèi)分析法和多維尺度分析法確定了近十五年來(lái)我國(guó)大陸“科學(xué)數(shù)據(jù)”研究的7個(gè)主題領(lǐng)域[3]。王曰芬等(2016)利用Web of Science數(shù)據(jù)庫(kù)對(duì)國(guó)外的科學(xué)數(shù)據(jù)研究通過(guò)CiteSpace軟件進(jìn)行了基于關(guān)鍵詞的主題演化分析[4]。本研究利用CNKI數(shù)據(jù)庫(kù)通過(guò)詞頻分析法結(jié)合共詞分析法對(duì)2005-2016年我國(guó)“科學(xué)數(shù)據(jù)”領(lǐng)域的研究主題進(jìn)行演化分析。
由于發(fā)表于北大中文核心期刊和CSSCI來(lái)源期刊的期刊論文具有較高的學(xué)術(shù)認(rèn)可度,從而能夠較好地反映出相關(guān)研究領(lǐng)域的研究動(dòng)態(tài)和發(fā)展趨勢(shì),因此本文選擇發(fā)表于核心期刊和CSSCI來(lái)源期刊的期刊論文作為數(shù)據(jù)來(lái)源,動(dòng)態(tài)展現(xiàn)近十二年來(lái)我國(guó)“科學(xué)數(shù)據(jù)”領(lǐng)域研究主題的演化歷程。在《中國(guó)期刊全文數(shù)據(jù)庫(kù)(CNKI)》中選擇“主題詞”進(jìn)行精確檢索,檢索詞為:“科學(xué)數(shù)據(jù)”或者“科研數(shù)據(jù)”或者“研究數(shù)據(jù)”;檢索數(shù)據(jù)庫(kù)為“中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)”;來(lái)源類(lèi)別為:“核心期刊”或者“CSSCI”;檢索時(shí)間為:2017年8月10日。2002年,我國(guó)科技部正式啟動(dòng)了“國(guó)家科學(xué)數(shù)據(jù)共享工程”,國(guó)內(nèi)學(xué)者由此開(kāi)啟針對(duì)“科學(xué)數(shù)據(jù)”領(lǐng)域的相關(guān)研究,最初關(guān)注的是美國(guó)政府早在20世紀(jì)90年代初期實(shí)施的“完全、開(kāi)放、無(wú)償”科學(xué)數(shù)據(jù)共享國(guó)策,如國(guó)內(nèi)相關(guān)研究的早期代表文獻(xiàn)是孫樞等(2002)的《美國(guó)科學(xué)數(shù)據(jù)共享政策考察報(bào)告》。由于2002-2004年的相關(guān)文獻(xiàn)數(shù)量非常少,2005年之后的相關(guān)文獻(xiàn)數(shù)量逐漸增加,因此本研究將檢索時(shí)間設(shè)定為2005-2016年。刪除通知、簡(jiǎn)訊、評(píng)論等不相關(guān)的非學(xué)術(shù)文獻(xiàn),同時(shí)刪除不包括作者關(guān)鍵詞的學(xué)術(shù)文獻(xiàn),共計(jì)得到547篇發(fā)表于核心期刊或CSSCI來(lái)源期刊的“科學(xué)數(shù)據(jù)”領(lǐng)域相關(guān)文獻(xiàn)。圖1展示了2005-2016年“科學(xué)數(shù)據(jù)”領(lǐng)域相關(guān)文獻(xiàn)發(fā)文量的時(shí)間序列圖。由圖1可見(jiàn),2011年以前各年的發(fā)文量均比較少,2012年以后各年的發(fā)文量呈現(xiàn)出高速增長(zhǎng)的趨勢(shì),表明從2012年開(kāi)始“科學(xué)數(shù)據(jù)”相關(guān)研究引起了更多學(xué)者的關(guān)注。

圖1 2005-2016年我國(guó)“科學(xué)數(shù)據(jù)”領(lǐng)域研究文獻(xiàn)的發(fā)文量
學(xué)科領(lǐng)域的研究主題演化分析是指以關(guān)鍵詞或主題詞為表征的研究主題在時(shí)間維度上的發(fā)展變化過(guò)程,與研究主題的空間變化相比,時(shí)間演化體現(xiàn)的是研究主題的新陳代謝過(guò)程,體現(xiàn)了某一學(xué)科領(lǐng)域的發(fā)展態(tài)勢(shì)和未來(lái)走向,也是研究學(xué)科領(lǐng)域發(fā)展規(guī)律的重要內(nèi)容[5]。目前對(duì)學(xué)科領(lǐng)域的研究主題進(jìn)行演化分析的文獻(xiàn)計(jì)量方法主要有詞頻分析法、共引分析法和共詞分析法。詞頻分析法是利用能夠揭示或表達(dá)文獻(xiàn)核心內(nèi)容的關(guān)鍵詞或主題詞在某一學(xué)科領(lǐng)域的研究文獻(xiàn)中出現(xiàn)的詞頻高低,來(lái)確定該學(xué)科領(lǐng)域的研究熱點(diǎn)和發(fā)展動(dòng)向的文獻(xiàn)計(jì)量方法[6]。在以往應(yīng)用詞頻分析法對(duì)學(xué)科領(lǐng)域的研究主題進(jìn)行演化分析的研究中,主要是通過(guò)關(guān)鍵詞在各時(shí)段的詞頻變化來(lái)判斷相應(yīng)研究主題的演化趨勢(shì)。由于利用關(guān)鍵詞的絕對(duì)詞頻有時(shí)無(wú)法準(zhǔn)確、客觀地反映出詞頻的變化趨勢(shì),近年來(lái)也出現(xiàn)了少量對(duì)傳統(tǒng)的詞頻分析法進(jìn)行改進(jìn)的研究文獻(xiàn)。
錢(qián)峰(2008)提出通過(guò)對(duì)成對(duì)的中英文關(guān)鍵詞詞頻進(jìn)行二次卡方檢驗(yàn),來(lái)判斷該學(xué)科領(lǐng)域國(guó)內(nèi)外研究熱點(diǎn)是否存在顯著差異并發(fā)現(xiàn)其具體差異[7]。倉(cāng)宏宇等(2009)提出通過(guò)計(jì)算關(guān)鍵詞詞頻的Z分?jǐn)?shù)來(lái)對(duì)詞頻進(jìn)行標(biāo)準(zhǔn)化處理,并將Z分?jǐn)?shù)>0的關(guān)鍵詞作為高頻關(guān)鍵詞來(lái)對(duì)比該學(xué)科領(lǐng)域國(guó)內(nèi)外研究熱點(diǎn)的差異[8]。周鑫等(2016)提出通過(guò)移動(dòng)平均法對(duì)相對(duì)詞頻進(jìn)行修勻得到移動(dòng)平均值,將相鄰兩年之間移動(dòng)平均值的相對(duì)變化率逐年累加得到詞頻變化率Z值,通過(guò)對(duì)詞頻變化率Z值設(shè)定閾值將關(guān)鍵詞分為3種類(lèi)型:增長(zhǎng)型、平穩(wěn)型和下降型[9]。但上述改進(jìn)方法對(duì)于類(lèi)似于本研究的小樣本數(shù)據(jù)均不太適用。由于小樣本數(shù)據(jù)的關(guān)鍵詞詞頻較低且波動(dòng)較大,通過(guò)計(jì)算詞頻的Z分?jǐn)?shù)和移動(dòng)平均值反映變化趨勢(shì)并不適合,過(guò)低的關(guān)鍵詞詞頻也很可能不滿(mǎn)足卡方檢驗(yàn)的條件(如要求20%以上的詞頻的期望頻數(shù)不小于5)。

本研究首先對(duì)作者關(guān)鍵詞通過(guò)人工甄別進(jìn)行規(guī)范化處理:去除揭示論文內(nèi)容專(zhuān)指性不強(qiáng)、含義過(guò)于寬泛的關(guān)鍵詞,如“美國(guó)”、“英國(guó)”、“國(guó)外”、“數(shù)據(jù)”、“對(duì)策”等;合并同義、近義關(guān)鍵詞,如“科學(xué)數(shù)據(jù)”、“科研數(shù)據(jù)”與“研究數(shù)據(jù)”合并為“科學(xué)數(shù)據(jù)”,“數(shù)據(jù)監(jiān)管”、“數(shù)據(jù)監(jiān)護(hù)”、“數(shù)據(jù)管護(hù)”、“數(shù)據(jù)策展”、“數(shù)據(jù)策管”與“Data Curation”合并為“數(shù)據(jù)監(jiān)管”。在上述2005-2016年我國(guó)“科學(xué)數(shù)據(jù)”領(lǐng)域547篇相關(guān)文獻(xiàn)中共計(jì)出現(xiàn)了813個(gè)關(guān)鍵詞,關(guān)鍵詞出現(xiàn)的總累計(jì)頻次為2 384次,平均出現(xiàn)頻次約為2.93次。本研究劃分為3個(gè)時(shí)段:2005-2008年、2009-2012年和2013-2016年進(jìn)行分析,通過(guò)對(duì)數(shù)似然值確定不同時(shí)段內(nèi)關(guān)鍵詞詞頻是否具有顯著差異,并將對(duì)數(shù)似然值與相對(duì)變化率相結(jié)合來(lái)識(shí)別核心詞、突變?cè)~和新生詞,進(jìn)而判斷“科學(xué)數(shù)據(jù)”領(lǐng)域相關(guān)文獻(xiàn)研究主題的動(dòng)態(tài)演化趨勢(shì)。
借鑒馮佳(2015)和劉敏娟等(2016)關(guān)于核心詞、新生詞和突變?cè)~的定義,核心詞是在某一時(shí)段詞頻排序靠前的高頻關(guān)鍵詞,對(duì)揭示學(xué)科領(lǐng)域的核心主題具有重要作用。通過(guò)比較不同時(shí)段核心詞的變化情況,可以發(fā)現(xiàn)學(xué)科領(lǐng)域核心主題的演化趨勢(shì)。新生詞是在后一時(shí)段新出現(xiàn)且詞頻不斷增加的中、高頻關(guān)鍵詞,其在某一時(shí)段進(jìn)入中、高頻區(qū)域并在出現(xiàn)后穩(wěn)定存在,對(duì)揭示學(xué)科領(lǐng)域的新興主題具有重要作用。通過(guò)監(jiān)測(cè)新生詞的變化趨勢(shì),可以發(fā)現(xiàn)學(xué)科領(lǐng)域內(nèi)潛在的新興主題。突變?cè)~是指在不同時(shí)段內(nèi)詞頻發(fā)生顯著變化,呈現(xiàn)突然上升或下降趨勢(shì)的中、高頻關(guān)鍵詞。通過(guò)追蹤突變?cè)~在不同時(shí)段內(nèi)的變化情況,可以發(fā)現(xiàn)學(xué)科領(lǐng)域一般主題的演變趨勢(shì)[11-12]。


表1 2005-2008年、2009-2012年關(guān)鍵詞詞頻變化情況

表2 2009-2012年、2013-2016年關(guān)鍵詞詞頻變化情況

表2(續(xù))
由于共詞分析法結(jié)合知識(shí)圖譜技術(shù)已成為研究主題演化分析的重要手段,本研究按照上述3個(gè)時(shí)段分別繪制共詞網(wǎng)絡(luò)圖譜以揭示研究主題的演化趨勢(shì)。共詞分析法是以文獻(xiàn)的關(guān)鍵詞或主題詞作為分析對(duì)象,能夠反映出關(guān)鍵詞或主題詞在同一篇文獻(xiàn)中的共現(xiàn)關(guān)系,可以從更微觀的角度去揭示學(xué)科領(lǐng)域研究主題的演化規(guī)律。分別針對(duì)上述3個(gè)時(shí)段構(gòu)建關(guān)鍵詞的共詞網(wǎng)絡(luò),然后通過(guò)繪圖軟件工具NetDraw直接展現(xiàn)關(guān)鍵詞之間的共現(xiàn)關(guān)系(見(jiàn)圖2、圖3和圖4)。圖中節(jié)點(diǎn)大小與關(guān)鍵詞的點(diǎn)度中心性成正比,并用▲表示其詞頻呈現(xiàn)相對(duì)增長(zhǎng)趨勢(shì)的關(guān)鍵詞,用■表示其詞頻呈現(xiàn)相對(duì)平穩(wěn)趨勢(shì)的關(guān)鍵詞,用▼表示其詞頻呈現(xiàn)相對(duì)下降趨勢(shì)的關(guān)鍵詞。圖2和圖3中關(guān)鍵詞詞頻的變化趨勢(shì)是相對(duì)下一時(shí)段而言的,但圖4中關(guān)鍵詞詞頻的變化趨勢(shì)是相對(duì)上一時(shí)段而言的。

圖2 2005-2008年關(guān)鍵詞共詞網(wǎng)絡(luò)圖譜(詞頻≥2)
2005-2008年我國(guó)“科學(xué)數(shù)據(jù)”研究的相關(guān)文獻(xiàn)數(shù)量非常有限(81篇),其研究主題主要涉及專(zhuān)業(yè)領(lǐng)域內(nèi)科學(xué)數(shù)據(jù)的分類(lèi)、組織與管理,科學(xué)數(shù)據(jù)共享系統(tǒng)或平臺(tái)的設(shè)計(jì)、實(shí)現(xiàn)與訪(fǎng)問(wèn)等,表明在我國(guó)科技部于2002年啟動(dòng)“國(guó)家科學(xué)數(shù)據(jù)共享工程”之后許多學(xué)科領(lǐng)域都已展開(kāi)了“科學(xué)數(shù)據(jù)”領(lǐng)域的相關(guān)研究。這一時(shí)段圖書(shū)情報(bào)領(lǐng)域關(guān)于“科學(xué)數(shù)據(jù)”的相關(guān)研究還非常少,主要涉及科學(xué)數(shù)據(jù)的公共獲取與知識(shí)產(chǎn)權(quán)問(wèn)題、專(zhuān)業(yè)圖書(shū)館如何參與科學(xué)數(shù)據(jù)共享等研究主題。這一時(shí)段我國(guó)“科學(xué)數(shù)據(jù)”領(lǐng)域的相關(guān)研究以技術(shù)層面的研究主題為主,部分表征技術(shù)層面研究主題的關(guān)鍵詞詞頻在下一時(shí)段呈現(xiàn)出相對(duì)下降趨勢(shì),如“地球科學(xué)”、“地震科學(xué)”、“林業(yè)科學(xué)”、“系統(tǒng)設(shè)計(jì)”、“Web Services”、“數(shù)據(jù)機(jī)構(gòu)”和“網(wǎng)格服務(wù)”等;但大部分表征技術(shù)層面研究主題的關(guān)鍵詞詞頻在下一時(shí)段呈現(xiàn)出相對(duì)平穩(wěn)趨勢(shì),如“農(nóng)業(yè)科學(xué)”、“水利科學(xué)”、“數(shù)據(jù)匯交”、“XML”、“網(wǎng)格”、“元數(shù)據(jù)”、“數(shù)據(jù)集”、“數(shù)據(jù)產(chǎn)品”、“數(shù)據(jù)庫(kù)”、“數(shù)據(jù)中心”和“數(shù)據(jù)共享平臺(tái)”等,這表明技術(shù)層面的相關(guān)研究主題在下一時(shí)段依然受到持續(xù)關(guān)注。
2009-2012年我國(guó)“科學(xué)數(shù)據(jù)”研究的相關(guān)文獻(xiàn)數(shù)量也很有限(102篇),其技術(shù)層面的研究主題大多是延續(xù)上一時(shí)段的研究主題,并且技術(shù)層面相關(guān)研究主題的文獻(xiàn)數(shù)量大幅下降,表明其他學(xué)科領(lǐng)域?qū)Α翱茖W(xué)數(shù)據(jù)”相關(guān)主題的研究關(guān)注在這一時(shí)段逐漸衰退。這一時(shí)段圖書(shū)情報(bào)領(lǐng)域關(guān)于“科學(xué)數(shù)據(jù)”的相關(guān)研究顯著增長(zhǎng),主要涉及國(guó)外科學(xué)數(shù)據(jù)開(kāi)放共享政策法規(guī)體系,圖書(shū)館參與科學(xué)數(shù)據(jù)的組織、管理、監(jiān)管與服務(wù),科學(xué)數(shù)據(jù)管理服務(wù)如何與學(xué)科服務(wù)、圖書(shū)館服務(wù)相結(jié)合等研究主題。大部分表征技術(shù)層面研究主題的關(guān)鍵詞詞頻在下一時(shí)段均已呈現(xiàn)相對(duì)下降趨勢(shì),如“地球科學(xué)”、“農(nóng)業(yè)科學(xué)”、“水利科學(xué)”、“數(shù)據(jù)匯交”、“數(shù)據(jù)分類(lèi)”、“網(wǎng)格”、“元數(shù)據(jù)”、“數(shù)據(jù)產(chǎn)品”、“目錄服務(wù)”、“數(shù)據(jù)中心”和“數(shù)據(jù)共享平臺(tái)”等,這表明技術(shù)層面的相關(guān)研究主題在下一時(shí)段受到的研究關(guān)注迅速衰退。大部分表征管理層面、服務(wù)層面研究主題的關(guān)鍵詞詞頻在下一時(shí)段則呈現(xiàn)出相對(duì)平穩(wěn)、增長(zhǎng)趨勢(shì),如“數(shù)據(jù)管理”、“數(shù)據(jù)服務(wù)”、“數(shù)據(jù)監(jiān)管”、“數(shù)據(jù)整合”、“數(shù)據(jù)生命周期”、“學(xué)科服務(wù)”、“圖書(shū)館服務(wù)”等,這表明管理層面、服務(wù)層面的相關(guān)研究主題在下一時(shí)段受到了更廣泛的研究關(guān)注。

圖3 2009-2012年關(guān)鍵詞共詞網(wǎng)絡(luò)圖譜(詞頻≥2)

圖4 2013-2016年關(guān)鍵詞共詞網(wǎng)絡(luò)圖譜(詞頻≥4)
2013-2016年我國(guó)“科學(xué)數(shù)據(jù)”研究的相關(guān)文獻(xiàn)數(shù)量與上一時(shí)段相比有大幅增長(zhǎng)(364篇),其中圖書(shū)情報(bào)領(lǐng)域關(guān)于“科學(xué)數(shù)據(jù)”研究的文獻(xiàn)數(shù)量增長(zhǎng)極為顯著,已經(jīng)發(fā)展成為我國(guó)“科學(xué)數(shù)據(jù)”相關(guān)研究的主要學(xué)科領(lǐng)域,其他學(xué)科領(lǐng)域的研究文獻(xiàn)數(shù)量在這一時(shí)段已經(jīng)非常少了,并且管理學(xué)、新聞傳播學(xué)等其他社會(huì)科學(xué)領(lǐng)域的相關(guān)研究主題與圖書(shū)情報(bào)領(lǐng)域相比差別不大。這一時(shí)段出現(xiàn)了大量管理層面、服務(wù)層面和政策層面的新興研究主題,表征這些研究主題的關(guān)鍵詞詞頻與上一時(shí)段相比大多呈現(xiàn)出相對(duì)平穩(wěn)、增長(zhǎng)趨勢(shì),如“數(shù)據(jù)倉(cāng)儲(chǔ)”、“機(jī)構(gòu)知識(shí)庫(kù)”、“數(shù)據(jù)知識(shí)庫(kù)”、“數(shù)據(jù)期刊”、“數(shù)據(jù)出版”、“數(shù)據(jù)引用”、“DOI”、“數(shù)據(jù)政策”、“數(shù)據(jù)權(quán)益”、“數(shù)據(jù)管理政策”、“數(shù)據(jù)共享政策”、“數(shù)據(jù)管理服務(wù)”、“嵌入式服務(wù)”和“數(shù)據(jù)素養(yǎng)教育”等。這一時(shí)段的新興研究主題在整體上呈現(xiàn)出不斷深化、日漸豐富的發(fā)展特點(diǎn)。這一時(shí)段出現(xiàn)的表征技術(shù)層面研究主題的關(guān)鍵詞大幅減少,其詞頻與上一時(shí)段相比大多呈現(xiàn)出相對(duì)平穩(wěn)、下降趨勢(shì),如“地球科學(xué)”、“數(shù)據(jù)保存”、“數(shù)據(jù)集成”、“數(shù)據(jù)組織”、“數(shù)據(jù)發(fā)現(xiàn)”、“數(shù)據(jù)中心”、“本體”、“元數(shù)據(jù)”、“元數(shù)據(jù)標(biāo)準(zhǔn)”、“數(shù)據(jù)中心”和“數(shù)據(jù)共享平臺(tái)”等。
本研究提出判斷關(guān)鍵詞詞頻的相對(duì)變化趨勢(shì)的一種方法:通過(guò)對(duì)數(shù)似然值結(jié)合相對(duì)變化率判斷關(guān)鍵詞詞頻的相對(duì)增長(zhǎng)、平穩(wěn)和下降趨勢(shì),該方法在時(shí)間跨度較短、樣本數(shù)據(jù)較少的情況下也同樣適用,并可作為識(shí)別學(xué)科領(lǐng)域的核心詞、突變?cè)~和新興詞的方法之一。本研究選取2005-2016年“科學(xué)數(shù)據(jù)”領(lǐng)域發(fā)表于北大中文核心期刊和CSSCI來(lái)源期刊的期刊論文作為數(shù)據(jù)來(lái)源,通過(guò)對(duì)數(shù)似然值結(jié)合相對(duì)變化率判斷關(guān)鍵詞詞頻的相對(duì)增長(zhǎng)、平穩(wěn)和下降趨勢(shì),識(shí)別不同研究時(shí)段的“科學(xué)數(shù)據(jù)”領(lǐng)域的核心詞、突變?cè)~和新生詞,并結(jié)合共詞分析法揭示“科學(xué)數(shù)據(jù)”領(lǐng)域相關(guān)文獻(xiàn)研究主題的動(dòng)態(tài)演化趨勢(shì)。2005-2016年我國(guó)“科學(xué)數(shù)據(jù)”領(lǐng)域的相關(guān)研究從以技術(shù)層面的研究主題為主逐漸過(guò)渡到管理層面、服務(wù)層面和政策層面的研究主題,各相關(guān)研究主題已經(jīng)引起圖書(shū)情報(bào)、信息科學(xué)、新聞傳播和其他學(xué)科領(lǐng)域的研究關(guān)注,其中圖書(shū)情報(bào)領(lǐng)域已逐漸成為我國(guó)“科學(xué)數(shù)據(jù)”相關(guān)研究的主要學(xué)科領(lǐng)域。
[1]司莉,李鑫.基于共詞分析的我國(guó)科學(xué)數(shù)據(jù)領(lǐng)域研究主題探析[J].圖書(shū)館,2014,(6):68-72.
[2]謝智敏,郭倩玲,高彥靜.基于CSSCI的我國(guó)科學(xué)數(shù)據(jù)研究文獻(xiàn)計(jì)量分析[J].情報(bào)探索,2015,(9):33-38.
[3]周志峰.中國(guó)大陸科學(xué)數(shù)據(jù)領(lǐng)域研究熱點(diǎn)分析——基于知識(shí)圖譜[J].情報(bào)雜志,2016,35(1):81-86.
[4]王曰芬,謝清楠,宋小康.國(guó)外數(shù)據(jù)科學(xué)研究的回顧與展望[J].圖書(shū)情報(bào)工作,2016,60(14):5-14.
[5]王春秀,冉美麗.學(xué)科主題演化定量分析的理論基礎(chǔ)探析[J].現(xiàn)代情報(bào),2008,(6):48-50.
[6]馬費(fèi)成,張勤.國(guó)內(nèi)外知識(shí)管理研究熱點(diǎn)——基于詞頻的統(tǒng)計(jì)分析[J].情報(bào)學(xué)報(bào),2006,25(2):163-171.
[7]錢(qián)峰.基于卡方檢驗(yàn)的國(guó)內(nèi)外知識(shí)管理研究熱點(diǎn)比較[J].情報(bào)雜志,2008,(9):56-58.
[8]倉(cāng)宏宇,譚宗穎.國(guó)內(nèi)外信息檢索研究熱點(diǎn)分析——基于Z-Score標(biāo)準(zhǔn)化的詞頻[J].圖書(shū)館建設(shè),2009,(1):93-98.
[9]周鑫,陳媛媛.關(guān)鍵詞詞頻變化視角下學(xué)科研究發(fā)展趨勢(shì)分析——以國(guó)內(nèi)情報(bào)學(xué)研究為例[J].情報(bào)雜志,2016,35(5):133-140,112.
[10]馬曉雷.被引內(nèi)容分析——探究領(lǐng)域知識(shí)結(jié)構(gòu)的新方法嘗試[M].北京:外語(yǔ)教學(xué)與研究出版社,2011.
[11]劉敏娟,張學(xué)福,顏蘊(yùn).基于核心詞、突變?cè)~與新生詞的學(xué)科主題演化方法研究[J].情報(bào)雜志,2016,35(12):175-180.
[12]馮佳,張?jiān)魄?基于新生詞與知識(shí)圖譜的新興趨勢(shì)探測(cè)研究[J].情報(bào)理論與實(shí)踐,2015,38(11):87-90,138.
ExploringtheEvolutionofScientificDataResearchThemesinChinafromthePerspectiveofKeywordsFrequencyChange
Jiang Xin1Wang Dezhuang2Ma Haiqun1
(1.Research Center of Information Resources Management,Heilongjiang University,Harbin 150080,China;2.Library,Heilongjiang University,Harbin 150080,China)
This paper conducted an empirical study of research themes evolution in the field of Research Data from 2005 to 2016 based on CNKI database through the methods of keyword frequency analysis and co-word analysis.Based on 547 articles in the field of Research Data published from 2005 to 2016,which were embodied by Chinese core journal criterion of PKU or Chinese Social Science Citation Index(CSSCI),this paper determined the relative growth,stable and decline trend of keyword frequencies and identified the core words,burst words and new words during the different research periods by calculating logarithmic likelihood value and relative variation ratio,and finally revealed the dynamic evolution trends of research themes combined with co-word analysis.The research results showed that the relevant research themes in the field of Research Data in China from 2005 to 2016 had transitioned from mainly technical level ones to managerial,service and political level ones,and that the Library and Information Science(LIS)had gradually become the main subject area of relevant domestic research in the field of Research Data.
scientific data;research themes evolution;keyword;frequency analysis;logarithmic likelihood value
科學(xué)數(shù)據(jù);主題演化;關(guān)鍵詞;詞頻分析法;對(duì)數(shù)似然值
10.3969/j.issn.1008-0821.2018.01.021
G250.252
A
1008-0821(2018)01-0141-06
2017-10-11
國(guó)家社會(huì)科學(xué)基金項(xiàng)目“科學(xué)數(shù)據(jù)開(kāi)放政策分析與評(píng)估研究”(項(xiàng)目編號(hào)16BTQ060);黑龍江省高校基本科研業(yè)務(wù)費(fèi)專(zhuān)項(xiàng)資金項(xiàng)目“我國(guó)圖書(shū)情報(bào)學(xué)科知識(shí)結(jié)構(gòu)的動(dòng)態(tài)演化研究基于科學(xué)知識(shí)圖譜視角”(項(xiàng)目編號(hào)HDJDY201615);黑龍江大學(xué)研究生創(chuàng)新科研項(xiàng)目“基于政策文本分析的科學(xué)數(shù)據(jù)開(kāi)放共享政策研究”(項(xiàng)目編號(hào)YJSCX2017-005HLJU)。
姜鑫(1980-),女,副教授,博士研究生,碩士生導(dǎo)師,研究方向:信息計(jì)量與科學(xué)評(píng)價(jià)。王德莊(1978-),男,館員,碩士,研究方向:科技政策分析與評(píng)估。馬海群(1964-),男,教授,博士生導(dǎo)師,研究方向:信息政策與法律研究。
郭沫含)