摘 要:將國(guó)內(nèi)知網(wǎng)、維普、萬(wàn)方、超星的知識(shí)發(fā)現(xiàn)工具中的主要功能進(jìn)行對(duì)比,從文獻(xiàn)產(chǎn)出、關(guān)鍵詞、作者、機(jī)構(gòu)、期刊等方面找出它們的不同,并分析出它們各自的獨(dú)特優(yōu)勢(shì),并通過實(shí)例進(jìn)行說明,為這些工具的使用和該領(lǐng)域的相關(guān)研究提供參考。
關(guān)鍵詞:知識(shí)發(fā)現(xiàn)系統(tǒng);超星發(fā)現(xiàn);知網(wǎng)KNS;維普智立方;萬(wàn)方創(chuàng)新助手
知識(shí)發(fā)現(xiàn)是從數(shù)據(jù)集中識(shí)別出有效的、新穎的、潛在有用的,以及最終可理解的模式的非平凡過程。知識(shí)發(fā)現(xiàn)將信息變?yōu)橹R(shí),從數(shù)據(jù)礦山中找到蘊(yùn)藏的知識(shí)金塊,將為知識(shí)創(chuàng)新和知識(shí)經(jīng)濟(jì)的發(fā)展做出貢獻(xiàn)。知識(shí)發(fā)現(xiàn)系統(tǒng)利用文獻(xiàn)計(jì)量學(xué)的相關(guān)理論,利用各種數(shù)據(jù)處理工具和方法對(duì)某領(lǐng)域的文獻(xiàn)中的關(guān)鍵詞、作者、機(jī)構(gòu)、收錄期刊、引文等進(jìn)行分析挖掘,可以判斷該領(lǐng)域某個(gè)時(shí)間段內(nèi)的研究熱點(diǎn)、發(fā)展趨勢(shì),相關(guān)機(jī)構(gòu)、作者之間的聯(lián)系等。所以,發(fā)現(xiàn)系統(tǒng)在情報(bào)分析、學(xué)科服務(wù)和知識(shí)組織方面具有非常廣闊的應(yīng)用前景。
一、 工具簡(jiǎn)介
(一) 超星發(fā)現(xiàn)系統(tǒng)
以中外文文獻(xiàn)數(shù)據(jù)挖掘的相關(guān)技術(shù)為支撐,對(duì)中外文獻(xiàn)資源進(jìn)行數(shù)據(jù)關(guān)聯(lián)與情報(bào)分析處理,深入發(fā)現(xiàn)隱藏在大量數(shù)據(jù)背后的信息,從而建立功能強(qiáng)大的新一代學(xué)術(shù)資源發(fā)現(xiàn)平臺(tái),利用信息可視化呈現(xiàn)技術(shù),幫助讀者簡(jiǎn)捷、快速獲得所有需要的知識(shí)。對(duì)讀者來說,超星發(fā)現(xiàn)系統(tǒng)是學(xué)習(xí)的工具;對(duì)圖書館來說,它是一個(gè)研究學(xué)習(xí)平臺(tái)和功能強(qiáng)大的文獻(xiàn)管理平臺(tái)。
(二) 知網(wǎng)KNS
知網(wǎng)的知識(shí)網(wǎng)絡(luò)服務(wù)平臺(tái)是CNKI 系列數(shù)據(jù)庫(kù)產(chǎn)品的運(yùn)營(yíng)支撐平臺(tái),它通過智能化、交互式手段,將各種孤立、異構(gòu)的信息資源集成整合為相互關(guān)聯(lián)的知識(shí)網(wǎng)絡(luò),形成統(tǒng)一、開放的資源體系,對(duì)外提供增值性知識(shí)傳播服務(wù)。
(三) 維普智立方
智立方知識(shí)發(fā)現(xiàn)系統(tǒng)是一個(gè)知識(shí)資源的大數(shù)據(jù)服務(wù)平臺(tái),能滿足資源發(fā)現(xiàn)、知識(shí)管理、情報(bào)服務(wù)的多層次需求,為圖書館、科研單位和個(gè)人用戶提供全方位、基于云平臺(tái)架構(gòu)的一體化解決方案。智立方知識(shí)發(fā)現(xiàn)系統(tǒng)不僅適用于資源發(fā)現(xiàn)、知識(shí)發(fā)現(xiàn)方面的資源整合平臺(tái)采購(gòu),也廣泛適用于機(jī)構(gòu)的各類信息服務(wù)整合項(xiàng)目,從專家?guī)臁C(jī)構(gòu)庫(kù)、主題庫(kù)、領(lǐng)域詞典詞表,到知識(shí)目錄導(dǎo)航、區(qū)域?qū)W術(shù)聯(lián)盟建設(shè)等項(xiàng)目。
(四) 萬(wàn)方創(chuàng)新助手
針對(duì)科研人員的自助式的科研信息服務(wù)平臺(tái),為用戶提供基于科技文獻(xiàn)的信息挖掘、分析。利用該服務(wù),研究人員可全面深入了解所關(guān)注課題的研究現(xiàn)狀,完成特定領(lǐng)域?qū)<遗c研究機(jī)構(gòu)的研究數(shù)據(jù)提取,掌握學(xué)科最新動(dòng)向與基金研究熱點(diǎn)。
二、 功能對(duì)比分析
(一) 學(xué)術(shù)產(chǎn)出分析、趨勢(shì)分析
學(xué)術(shù)產(chǎn)出是指所屬某個(gè)機(jī)構(gòu)文獻(xiàn)的發(fā)表、出版發(fā)行、登記、注冊(cè)、被授權(quán)等的數(shù)量,一般按年來統(tǒng)計(jì)。通過分析會(huì)發(fā)現(xiàn)四種發(fā)現(xiàn)系統(tǒng)的產(chǎn)出/趨勢(shì)分析各不相同,超星發(fā)現(xiàn)分別給出了圖書、期刊、學(xué)位論文、會(huì)議論文、專利、報(bào)紙關(guān)注熱點(diǎn)趨勢(shì)/產(chǎn)出曲線,并可以根據(jù)產(chǎn)出年限長(zhǎng)短選擇10年、20年、30年或者全部;知網(wǎng)KNS則在同一張圖中給出了所選文獻(xiàn)、參考文獻(xiàn)、引證文獻(xiàn)總體趨勢(shì)/產(chǎn)出曲線,并列出了參考文獻(xiàn)數(shù)、被引數(shù)、下載數(shù)量等重要參考值;維普智立方的曲線給出了發(fā)文量和被引量?jī)身?xiàng)數(shù)值;以上這三種都能給出鼠標(biāo)所在位置對(duì)應(yīng)年限的產(chǎn)出等相關(guān)數(shù)值,文獻(xiàn)類型可選擇,具備互動(dòng)性。萬(wàn)方創(chuàng)新助手則分別給出了總體和分類文獻(xiàn)的趨勢(shì)/產(chǎn)出曲線,直接生成再報(bào)告,不具備互動(dòng)性,不夠靈活。
(二) 知識(shí)點(diǎn)/關(guān)鍵詞/熱詞分析功能
雖然不同的發(fā)現(xiàn)系統(tǒng)使用了不同的詞來表達(dá),但基本都可以歸為關(guān)鍵詞這一類。超星發(fā)現(xiàn)系統(tǒng)給出的是知識(shí)點(diǎn)相關(guān)性圖,不同知識(shí)點(diǎn)根據(jù)相關(guān)性程度不同,使用不同大小、顏色的圓圈和中心點(diǎn)的距離來表示并分布在圖中;知網(wǎng)KNS則繪制了一幅關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜,關(guān)鍵詞之間的關(guān)系可以通過球形的相對(duì)大小、連線上的數(shù)字來表示,關(guān)鍵詞之間還可以進(jìn)行聚類,聚類結(jié)果用不同的顏色表示;維普智立方使用柱狀圖/折線圖表示主題詞在文獻(xiàn)中出現(xiàn)的頻次,使用表格統(tǒng)計(jì)主題詞發(fā)文量和所在文獻(xiàn)被引量;萬(wàn)方創(chuàng)新助手給出了期刊熱詞的年度統(tǒng)計(jì)表和總體主題詞詞頻統(tǒng)計(jì)表。根據(jù)以上分析,可以看出包含信息量最大的是知網(wǎng)KNS的分析。
(三) 文獻(xiàn)作者分析
超星發(fā)現(xiàn)給出的是相關(guān)作者、第一作者相關(guān)性圖和作者發(fā)文統(tǒng)計(jì)餅圖,不同作者根據(jù)相關(guān)性程度不同,使用不同大小、顏色圓圈和中心度的距離來表示并分布,統(tǒng)計(jì)餅圖則給出了不同作者的發(fā)文數(shù)據(jù);知網(wǎng)KNS系統(tǒng)給出了作者發(fā)文統(tǒng)計(jì)餅圖、作者合作網(wǎng)絡(luò)分析圖譜,餅圖給出了發(fā)文排名前幾位的作者及數(shù)據(jù),圖譜給出了完整的作者合作關(guān)系圖,圓圈的大小表示發(fā)文的多少,連線則表示合作關(guān)系;維普智立方給出的是作者發(fā)文統(tǒng)計(jì)柱狀圖/折線圖和作者發(fā)文/被引統(tǒng)計(jì)表;萬(wàn)方創(chuàng)新助手分中文期刊、學(xué)位論文、會(huì)議論文、外文期刊、外文會(huì)議論文5類給出了作者發(fā)文統(tǒng)計(jì)表。根據(jù)以上分析,可以看出包含信息量最大的是知網(wǎng)KNS的分析。
(四) 文獻(xiàn)種類分析
文獻(xiàn)種類分析中,超星發(fā)現(xiàn)和知網(wǎng)KNS都給出了文獻(xiàn)種類統(tǒng)計(jì)餅圖,但不同的是前者僅對(duì)整體文獻(xiàn)大類進(jìn)行了大類分析,而后者不僅能對(duì)大類進(jìn)行分析,而且如果待處理文獻(xiàn)是某一類型文獻(xiàn)的時(shí)候,仍能夠進(jìn)行細(xì)分;維普智立方?jīng)]有提供此功能;萬(wàn)方創(chuàng)新助手由于對(duì)所有分類文獻(xiàn)進(jìn)行了單獨(dú)統(tǒng)計(jì)分析,所以無(wú)需提供此功能。
三、 結(jié)論
圖書館的知識(shí)發(fā)現(xiàn)系統(tǒng)不僅是幫助用戶解決尋找自己需要資源文獻(xiàn)的問題,還要幫助用戶高屋建瓴地了解所在領(lǐng)域的整體狀況,從這個(gè)方面上看,以上四個(gè)發(fā)現(xiàn)系統(tǒng)中的功能基本上能夠滿足用戶需求。但是,它們又有所不同,簡(jiǎn)單來說,超星發(fā)現(xiàn)的分析簡(jiǎn)潔、清晰,而且資源上包括圖書;知網(wǎng)KNS的分析深入、強(qiáng)大,知網(wǎng)節(jié)功能豐富;維普智立方的分析中可以查詢文獻(xiàn)所在課題及支持項(xiàng)目的信息;萬(wàn)方創(chuàng)新助手的分析全面,統(tǒng)計(jì)數(shù)據(jù)豐富,用戶可以根據(jù)自身情況,結(jié)合發(fā)現(xiàn)系統(tǒng)的其他功能特點(diǎn),選擇合適的系統(tǒng)。
以資源為研究對(duì)象,忽視對(duì)用戶使用行為的挖掘分析。如果能夠深入分析用戶在獲取和使用知識(shí)時(shí)的行為特征,發(fā)現(xiàn)用戶共有的需求特性及其之間的相互關(guān)聯(lián)規(guī)律,就能對(duì)用戶未來的活動(dòng)進(jìn)行預(yù)測(cè),引領(lǐng)用戶獲得更有用的知識(shí),就能夠?yàn)橛脩籼峁└鼉?yōu)質(zhì)的個(gè)性化信息服務(wù),這應(yīng)該是目前各大知識(shí)發(fā)現(xiàn)系統(tǒng)的一個(gè)發(fā)展方向。
參考文獻(xiàn):
[1]鐘文一.大數(shù)據(jù)時(shí)代下的圖書館數(shù)據(jù)挖掘和情報(bào)分析研究——以中文發(fā)現(xiàn)系統(tǒng)為例[J].教育觀察(上旬刊),2014(09).
[2]張為江.基于用戶需求分析的數(shù)字圖書館知識(shí)發(fā)現(xiàn)系統(tǒng)研究[J].圖書館理論與實(shí)踐,2014(09).
作者簡(jiǎn)介:
劉中凱,海南省海口市,瓊臺(tái)師范學(xué)院圖書館。