魏力更
?
大數據時代下高校圖書館的知識發現服務——基于超星發現、中國知網發現功能的研究
魏力更
(齊齊哈爾大學 圖書館,黑龍江 齊齊哈爾 161006)
在剖析大數據的價值及大數據給學者獲取學術信息所帶來的困擾基礎上,對知識發現的含義、知識發現系統的機理和特征進行了探討,對超星發現、中國知網知識發現功能的特色優勢進行了案例分析.針對高校圖書館的知識發現服務提出了精準預判用戶的知識需求,深度挖掘文獻間的知識關聯.為用戶提供可操作的知識發現平臺,提供學術趨勢分析,學術產出評價及課題動態跟蹤等深度專業咨詢的發展策略和建議.
大數據時代;知識發現;高校圖書館;發現服務
隨著云計算、物聯網和移動通信技術的蓬勃發展,全球信息總量正以驚人的速度增長和累積,這意味著大數據時代己經來臨.媒體頻繁使用“數據洪流”來描述數據的急劇增長,而且該現象不僅出現在科學領域,同樣也出現在社交媒體、商業和金融領域.維·爾耶·前瞻性地指出,大數據帶來的信息風暴正在變革我們的生活、工作和思維,大數據開啟了一次重大的時代轉型,引發了大數據時代的思維變革、商業變革和管理變革[1-2].龐大的數據量不僅以指數級速度增長,數據結構也變得愈加復雜.數據管理、數據存儲和數據挖掘成為大數據時代信息技術發展的重大挑戰.
信息時代萬物數字化,大數據的重要性已成為行業共識,其潛在價值也引起產業界和學術界的高度關注.倘若能夠更有效地組織和使用大數據,人類將得到更多的機會發揮科學技術對社會發展的巨大推動作用.大數據是一種基礎性資源,人們可以通過數據的分析、開發和整合,發現新的知識,創造新的價值.
在大數據時代,對于海量數據的分析和管理是科研過程中的重要組成部分,人們需要從數據中發現未知的研究領域.然而,所產生的大量數據,能夠被科研者利用的僅僅是冰山一角,大量數據沒有被有效管理、分析和儲存.科技工作者深受大數據所帶來的困擾,很難快捷、準確地檢索到所需數據資料[3].隨著數據爆炸時代的來臨,讀者迫切需要一個可以簡捷、快速獲得所有知識的理想平臺[4].圖書館作為一個面向大眾的知識服務機構,急需研發先進的知識發現引擎,幫助用戶挖掘正在發生什么,預測和分析將來會發生什么,以便積極應對未來的危機及挑戰[5].
知識發現是從大量的數據集合中識別那些潛在的、有價值的知識的復雜過程,是一種廣義的“數據挖掘”.它強調了知識是數據發現的最終產品.在當前高校圖書館的各類型信息資源激增的背景下,知識發現服務得到了廣泛且迅速的推廣和應用.近年來,國內關于知識發現系統的研究不斷升溫,各類型圖書館相繼引入國內外的各種“知識發現系統”.知識發現系統深入分析用戶潛在的知識需求,對信息資源進行充分的挖掘、關聯和升值,實現知識價值再造.
知識發現系統引入先進的技術手段,如知識挖掘算法、索引規則等,對各類文獻資源數據進行處理和分析,使得文獻的揭示由表面信息深入到各類文獻之間存在的復雜關系中,繼而幫助用戶發現潛藏在數據背后的信息[6-7].通過知識挖掘處理,展現給讀者的文獻資源是揭示各信息資源關聯關系的立體知識體系.
知識發現系統的特征是基于海量的元數據中心倉儲數據,在索引數據庫中進行數據搜索,再通過對檢索結果的相關度排序和分面導航等功能來幫助用戶發現最適合的資源[8].同時檢索詞提示、糾錯和可視化等Web2.0功能的融入與支持,有效提升了網絡環境下的交互性用戶體驗.本文僅就超星發現和中國知網這兩大系統的知識發現功能作以分析和探討.
3.1 超星發現的相關功能
北京超星公司于2012年推出了超星發現系統.超星發現為讀者提供了具備完善的知識挖掘與情報分析功能的知識發現系統.目前,該系統已在國內許多高校使用或試用.
3.1.1 巨大的數據資源“集成”目前,超星發現收錄了1 348家圖書館的文獻資源,為教育科研提供全面的專業服務.囊括了550萬種圖書,9 300萬篇期刊文獻,480萬篇學位論文,1 200萬篇專利,600萬部視頻等信息,而且數據每天在更新增長.海量的資源為科研工作者提供了系統、全面及權威的知識網絡.
3.1.2 專業級強大詞表庫支持精準智能發現 超星發現系統中容納了42萬主題詞表,8萬同義詞表,2 500萬學術專業詞庫,3 500條學科分類表等內容.專業詞表支持文獻的規范標引、同義詞匹配檢索和智能檢索,以提高檢索的查全率和查準率.如輸入“文化宮”,系統會同時檢索“文化館”、“俱樂部”等別名;輸入“有色金屬”,可查出其下位詞有:貴金屬、稀有金屬等.
3.1.3 可視化的知識關聯圖譜 超星發現的可視化關系圖譜功能便于發現知識、人、機構之間的相互關系.如檢索“一路一帶”,檢索結果顯示后,點擊“可視化”按鈕,則學術輔助分析系統顯示:與“一路一帶”關系密切的領域有絲綢之路、亞歐大陸橋等;與“一路一帶”主題相關的最具影響力的研究者姓名;與“一路一帶”相關的研究機構;在檢索結果中點擊某一篇學位論文的標題,可見“當前學位論文的作者”、“當前作者的導師”及“當前作者的師兄弟”之間的關系圖譜,據此可挖掘同一導師下不同學生研究主題的相關性.
3.1.4 洞察全局的學術趨勢分析 檢索“供給側”時,在“可視化”頁面可見這一主題在圖書、期刊、學位論文和會議論文等各類型文獻的學術發展趨勢曲線圖,對此主題的學術發展趨勢一目了然.
3.2 中國知網(KDN)的相關功能
新版中國知網也稱為“CNKI知識發現網絡平臺”(KDN),其于2012年9月正式上線為讀者服務.KDN利用知識管理的理念,實現了知識匯聚與知識發現,結合搜索引擎和全文檢索等相關技術來達到知識發現的目的.KDN平臺提供了多種檢索發現手段,如優先出版、引文關聯和檢索結果的多項分組排序等.
3.2.1 KDN資源覆蓋的范圍 從資源類型上來說,KDN涵蓋了期刊論文、學位論文、會議論文、重要報紙、專利、標準、科技成果、詞典和古籍等各類資源.從語種上來說,不僅包含中文資源,還包含豐富的外文文獻.
3.2.2 指數檢索 在KDN平臺的一框式檢索中,“指數檢索”提供關于某一主題的免費數據分析服務,通過直觀形象的圖形反映某一主題在過去一段時間里的研究發展趨勢,讀者可快速發現和追蹤學術熱點.例如:檢索“數據素養”,可顯示該主題在1981—2015年間的研究發展趨勢圖,該年度被引頻次最高的熱點文獻,該主題的最早研究文獻、最新研究文獻和經典文獻,該主題的學科分布情況,相關主題詞等,用于進一步擴大檢索.
3.2.3 學科專業圖書館 在KDN主頁中,設置了“學科專業圖書館”欄目.這一欄目將知網收錄的所有文獻資源分成168個學科數字圖書館和3 000多個子專業數字圖書館.讀者根據自己的研究領域,選擇進入某學科館,即可檢索本學科全部文獻內容.例如:點擊“材料科學”學科館,可顯示該學科的12個專業館、學科相關領域、學科院士、學科博導、學科工具書、學科研究熱點、學科論壇、學科國家級和省部級課題等內容,形成材料科學學科較完善的知識庫.
3.2.4 知識元檢索 在KDN主頁中設有“知識元”欄目,包括查工具書、數字搜索、表格搜索、圖形搜索和概念搜索等檢索項目.在此可以任意檢索概念、數字、表格和圖形等知識元信息.例如:(1)查工具書.知網工具書庫收錄了漢語詞典、專科詞典和百科全書等8 000余部工具書,可供查找字、詞、百科知識和圖譜等各類知識.(2)概念搜索.可查找某一學科的所有名詞術語的解釋.
3.3 兩大系統的分析結果
超星發現和中國知網兩大系統以其各自的特色為讀者提供了不同廣度和深度的知識發現服務.二者從不同角度把分散在不同載體上的內容,按照知識本來的脈絡整理出來,形成知識網絡,以方便讀者使用.值得一提的是,超星發現系統在可視化分析方面功能較為突出,其“學術輔助分析系統”進行數據分析后,通過可視化來展示各個知識點之間的關聯,更容易幫助讀者發現新的知識.中國知網則對于學科領域內各種知識信息的關聯、揭示和整理以及各種知識元的深度搜索方面占據優勢,為獲取全方位的學科信息提供了方便.可見,不同的知識發現系統對知識挖掘的側重點不同.目前,國內產出的知識發現系統已有多種,如萬方的“中國學術搜索”,重慶維普的“智立方發現系統”等,用戶如果能綜合利用各種發現系統,勢必會獲得更全面、更滿意的檢索效果.
在大數據時代,圖書館需要研究更加有效的方法進行大數據挖掘,對用戶的知識需求應該有更周到的服務.圖書館需深入挖掘各類知識資源所隱含的數據價值,并以讀者個性需求和大數據科學分析結果為依據,為讀者提供高效和滿意的個性化知識服務[9-10].
4.1 與時俱進,精準預判用戶的知識需求
在網絡環境下,讀者對個性化知識的需要與日俱增.這種知識往往不是一本期刊或一本書所能提供的,更多是針對某一個問題的解答,需要綜合來自各種文獻的信息.讀者正在變得越來越“懶惰”,他們希望得到直接的答案,而非一堆鏈接.知識發現平臺需要更聰明、更智能地去理解用戶想要做什么,提供給用戶更準確的結果.
4.2 深入挖掘數據價值,提高知識發現效率
適用大數據技術的圖書館可自主研發個性化的深度知識發現平臺,或考慮引進成熟的大數據分析產品.知識平臺的建設一方面需要包涵充足的資源,另一方面要加深文獻標引和文獻間知識關聯的挖掘,為科研人員提供可操作的知識發現平臺.同時,應充分考慮到數據對象的多樣性.隨著圖書館大量非結構化數據的涌現,圖像、視頻和音頻等多媒體數據挖掘價值非常大.
4.3 基于知識發現系統為用戶提供深度專業咨詢
圖書館應努力提供與教學科研緊密相關的知識支持,尤其是全面保障高校重點學科、精品課程信息資源的統一整合、深度搜索和權威咨詢,提高學科服務水平.利用超星發現、中國知網等系統發現有價值的知識信息,加上館員特有的分析挖掘能力,圖書館可開展各種深度信息服務.如為學院及學者開展個性化服務:學術趨勢分析、課題綜述、課題動態跟蹤及提供學術產出評價等,開展嵌入式學科服務.運用網絡級知識發現系統,基于特定需求分析海量數據,挖據潛在的學術信息,將使圖書館為教學科研提供細顆粒度的高度粘合和個性化的服務成為可能.
[1] 鐘文一.大數據時代下的圖書館數據挖掘和情報分析研究[J].教育觀察,2014(9):88-91
[2] 韓翠峰.大數據帶給圖書館的影響與挑戰[J].圖書與情報,2012(5):37-40
[3] 陳麗冰.讀者服務視角下的圖書館資源發現服務[J].情報資料工作,2012(4):66-70
[4] 殷翠芬.高校數字圖書館信息資源管理的問題及對策[J].圖書館學研究,2008(3):74-75
[5] 張正.數字圖書館用戶研究[J].圖書館,2004(1):46-48
[6] 廖志江.知識發現及數字圖書館知識服務平臺建設研究[J].情報科學,2012(12):1849-1853
[7] 劉江玲.面向大數據的知識發現系統研究[J].情報科學,2014(3):90-92
[8] 李俊,黃春毅.關聯數據的知識發現研究[J].情報科學,2013(3):76-80
[9] 李偉,趙衛利,劉冠群,等.知識庫和知識發現技術在知識服務方面的應用[J].現代情報,2009(7):180-182
[10] 李佳.基于知識發現的圖書館個性化知識服務研究[J].圖書與情報,2013(5):100-102
Knowledge discovery service of university libraries in the age of big data——Study of discovery service function basedon Superstar Discovery and CNKI
WEI Li-geng
(Library,Qiqihar University,Qiqihar 161006,China)
Based on the analysis of big data value and scholar's troubles for getting academic information,discusses the meaning of knowledge discovery and the mechanism and characteristics of knowledge discovery system,the special advantages of knowledge discovery function of Superstar Discovery and CNKI are analyzed for case studies.The development strategies and suggestions are put forward for the knowledge discovery service of university libraries,these suggestions are the depth professional counseling about accurate pre judgment of the user's knowledge needs,depth mining knowledge association among literatures,providing users with actionable knowledge discovery platforms,providing academic trend analysis and evaluation of academic output and subject dynamic tracking.
the age of big data;knowledge discovery;university library;discovery service
1007-9831(2016)11-0045-04
G254.9
A
10.3969/j.issn.1007-9831.2016.11.012
2016-08-09
魏力更(1964-),女,黑龍江雙城人,研究館員,從事數字資源的開發與利用等研究.E-mail:xiexiejiao123@126.com