周鳳飛 王佳佳
(天津工業大學圖書館 天津 300387)
隨著信息技術的發展,全球已進入信息爆炸時代,數據總量迅速膨脹,大數據時代應運而生。2011年5月麥肯錫公司在《大數據:下一個創新、競爭和生產力的前沿》研究報告中首次提出大數據的概念[1]。自從大數據概念提出以來,國際上大數據的討論和政府行動趨勢強勁。美國2012年出臺《大數據研究和發展計劃》,將大數據上升為事關國家核心競爭力的國家戰略,這是繼“信息高速公路計劃”之后在信息科學領域的又一重大計劃。英國2013年出臺《英國數據能力發展戰略規劃》,投資1.89億英鎊,提高大數據的采集、分析能力,推動英國在 “數據革命”中搶得先機[2]。2016年3月18日,中華人民共和國國民經濟和社會發展第十三個五年規劃綱要(簡稱“十三五”規劃(2016-2020年))發布,綱要中提出:“實施國家大數據戰略,推進數據資源開放共享”。由此可見,各個國家紛紛將大數據從以往的商業層面上升到了國家意志和國家戰略層面。
大數據時代的到來,促進了思維的變革、技術的變革和商業的變革。數據、技術與思維將三足鼎立。在此背景下,大數據技術、大數據思維逐漸滲入到圖書館的服務與管理創新中,特別對高校圖書館學科服務,影響作用日漸深入。面向問題、面向數字與模型、面向決策支持、面向數據范式的學科建設與科學研究都將越來越依賴于大數據的支撐;為教學科研提供服務也將越來越需要具有數據素養的圖書館專業學科館員。圖書館如何基于大數據思維、大數據理論、方法和技術,開展更深層次的學科服務,已經成為圖書館界面臨的重要決策問題。
在學術界,目前尚未對大數據的概念有統一的定義,大家比較認可關于大數據的定義從早期IBM公司提出的3V說法,逐漸發展到4V ,再到現在的 5V( 新增 Value) 。大數據的 5 個“V”,業界將其歸納為 Volume,Velocity,Variety,Veracity,Value,實際上也就是大數據包含的 5 個特征,即:巨大的數據量 (Volume)、快速的分析和處理速度 (Velocity)、多樣化的數據種類和數據來源 (Variety)、知識的真實性 (Veracity)和對商業領域巨大的價值(Value)[3]。如今大數據早已不再是簡單的數據大的事實了,而最重要的現實是對大數據進行分析,只有通過分析才能獲取其中智能的、深入的、有價值的信息。所以其核心理念就是以一種有效的方式來管理海量數據并從中提取價值。如何從海量數據中提取出有價值的數據,則需要利用各種先進的大數據技術。大數據的核心技術主要有數據采集與預處理技術、數據存儲與管理技術、數據分析及挖掘技術、數據展現及應用技術。
《普通高等學校圖書館規程(2005版)》規定,“高等學校圖書館應積極拓展信息服務領域,提供數字信息服務,嵌入教學和科研過程,開展學科化服務,根據需求積極探索開展新服務”[4]。在大數據背景下,無論是科研單位、教學單位、還是圖書館等信息機構,都面臨著嚴峻的挑戰。教學、科研需要更加系統化、專業化、知識化的數據資源支撐,而圖書館則是提供這種支撐的后臺保障。面對不斷變化的信息環境,傳統的以文獻資源提供和檢索為主的被動式服務已經遠不能滿足用戶的需求。學科服務逐漸朝著智慧化、協作化、綠色化、視覺化、泛在化和主動化的趨勢發展。而基于大數據的學科服務就是為適應學科服務這種多元化的發展趨勢而衍生的一種基于網絡的用以解決結構化、半結構化及非結構化數據多維度處理、分析并提供有預測性知識的信息服務新模式,是嵌入式協作化學科服務模式的一種新發展。這種服務模式以用戶需求為中心,以先進技術為支撐,以學科知識資源為基礎,以促進學科知識創新為目標,是綜合應用數據挖掘、信息檢索等大數據技術,對學科知識資源進行深入挖掘、分析與集成,為不同層次的用戶提供個性化智力服務的一種新形式。
數據素養簡單來說就是人們有效且正當地發現、評估和使用信息及數據的一種意識和能力。主要包括數據意識、數據獲取能力、數據處理與分析能力、數據交流能力、數據評價能力及數據道德等幾個方面[5]。大數據環境下,教學、科研等項目對數據質量的要求越來越高,高質量的數據必須由高數據素養的人才提供。因此數據素養已經成為館員及科研人員的必備素養之一,作為深入教學、科研項目的學科館員來說,數據素養尤為重要。新一代的學科館員已不僅是數據收集者,更是知識發現者。雖然圖書館對學科服務的重視程度逐漸增強,越來越多的圖書館已經配備了具有專業知識背景,且檢索能力較強的學科館員,但是對數據進行科學的管理、分類、分析、挖掘的知識和技能較為匱乏,所掌握的方法和工具也十分有限 ,使用新型數字工具(如繪制思維導圖軟件、情報分析圖譜軟件及專利分析軟件)的能力較弱[6-7]。面對分散且雜亂的數據資源,如何將有價值的信息提取出來,并進行深度的挖掘分析,將結果以恰當的形式展現給用戶,是新時代的學科館員應該具備的技能。
隨著學科服務模式的改變,用戶需求的增多,大數據環境下的學科服務需要學科服務一站式平臺來支持。這里的學科服務平臺定義為:學科服務平臺是學科服務系統必不可少的一部分,是一個展現學科服務系統各組成部分、各類工具和資源的平臺,將學科館員、學科用戶和學科資源三者緊密結合在一起[8]。筆者通過訪問部分985高校的圖書館網站發現,即使是科研實力強勁,學術資源豐富的一流大學,在學科服務一站式平臺建設方面仍然有所欠缺。主要問題是有的學校缺少學科服務一站式平臺,在有學科服務一站式平臺的情況下,則存在平臺的功能定位尚不清晰、重建設輕維護情況嚴重、部分圖書館重建設輕宣傳,用戶的知曉度和使用度不高的問題[9]。如何將深入教學科研的學科館員、海量數據、協同創新、產學研結合的研究需求以及數據庫、自建庫、免費學術資源庫及開放出版資源結合起來,提供功能完善的基于學科館員、學科用戶、學科資源的管理、檢索分析等一站式服務平臺已迫在眉睫。
以大數據為基礎的學科分析工具出現之前,大部分學校的學科服務項目包括:提供文獻信息服務,用戶培訓、學科資源建設、信息素養教育、查收查引等,服務范圍較窄、層次較淺,并沒有深入教學科研當中,而只停留在表面[10]?,F在已有一些高校圖書館開始提供一些更深層次的服務。如2016年11月,同濟大學圖書館利用了SCI、SSCI、ESI和InCites數據庫相關統計數據對同濟大學2015-2016年進入ESI排名前1%的學科,以及未進入ESI學科排名前1%但接近程度超過50%的潛力學科進行分析,為同濟大學保持優勢學科、發展潛力學科提供了有力的數據支撐。武漢紡織大學圖書館于2014年,選取Web of scienceTM核心合集平臺的數據,以SCIE和SSCI數據庫為文獻計量工具,通過分析總結出該校紡織科學與工程學科在全國的綜合地位,為學科發展提供數據定位,給領導制定決策做出參考[11]。如何深入教學科研之中,為學校的學科建設、科學研究提供有力的支撐與保障,是圖書館學科服務重要的發展方向。
美國大學與研究圖書館協會( Association of College and Research Libraries,ACRL) 《2015 年環境掃描》提出: “數據館員需要積極主動地參與信息素養對話,學習新的教學策略,并基于自身專業做出貢獻[12]。圖書館要積極組織安排學科館員在進行相關實踐的基礎上開展在職培訓,并實行考核制度??梢耘e辦有關的研討會,進行經驗以及先進理念的交流。定期邀請相關的專家進行培訓,制定有利于提高數據素養的培養計劃。開展相關的數據技能大賽以增加大家的學習熱情等。
構建具有強大的知識資源整合能力、海量知識分析能力、大數據挖掘能力和多維度知識可視化能力的一站式平臺,以研究型用戶需求環境和需求趨勢為導向,是一種以用戶為中心的提供解決問題決策的知識展示、交互和推送的新型服務模式。平臺的目標是為全校的用戶提供高效、高質量的學科服務。將學科服務的三要素學科館員、用戶以及知識資源三者整合在一起,實現功能的最大化[13]。將各種專業的結構化資源數據庫、非結構化的網絡數據資源以及各種自建數據庫整合在一起,通過建立個性化、多樣化的學科知識服務體系,增強圖書館的信息服務能力??梢酝ㄟ^設置不同的導航模塊如:知識檢索、學科態勢分析、資源推薦、科研學術評價等,形成面向教學、面向科研的學科化服務體系,為不同類型的學科用戶提供個性化服務。學科服務一站式平臺要求界面友好、結構層次清晰、內容豐富、功能完善,具有綜合性、開放性、適用性、易用性。平臺的設計不能盲目追求功能多樣,而應以高校學科服務的實際能力,以及用戶的實際需求為準,遵循先進性、可靠性、開放性、服務性以及可擴展性的原則,致力于打造以用戶需求為中心、以知識資源為導向、以先進技術為支撐的一站式服務平臺。
充分利用大數據的:數據采集與預處理技術、數據存儲與管理技術、數據分析及挖掘技術、數據展現及應用技術等對互聯網中的各種類型的結構化及非結構化的海量數據,進行采集、存儲、分析及展現。對于學科服務而言,利用這些關鍵技術,結合數據分析工具,對學科進行預測性趨勢分析,為學校的學科建設以及科研提供更準確的數據支撐、更深層次的技術支持,是大數據背景下學科服務創新的必然發展之路。其中新興的幾個學科服務分析工具主要有EiDeep、InCites、SciVal。EiDeep是基于中國科研機構的中外文科技文獻以及創新成果數據建立的科研創新能力評估與透視分析平臺。除了中文文獻它還可以提供EI、ESI、SCI、ISTP、Science、Nature、Cell、SSCI八類外文數據庫收錄的論文數據。利用Eideep平臺,可以量化的展示科研機構創新能力的分布和發展趨勢、按照機構組織體系,統計分析各級單位的科研績效、對比同類機構間的能力差異,做到知己知彼、聚焦各行業領域中創新力較強機構,發現投資合作目標。InCites數據庫中集合了近30年來Web of Science核心合集七大索引數據庫的數據,擁有多元化的指標和豐富的可視化效果,可以輔助科研管理人員更高效地制定戰略決策。利用InCites數據庫可以定位重點學科 、優勢學科、發展潛力學科,優化學科布局、跟蹤和評估機構的科研績效與同行機構開展對標分析、明確機構全球定位、分析本機構的科研合作開展情況,識別高效的合作伙伴、挖掘機構內高影響力和高潛力的研究人員,吸引外部優秀人才。SciVal分析工具可以幫助了解全球220個國家和4 600家機構的研究成果,其中包含了17種評估指標,可以實時了解在全國及全球的科研地位及科研進展,與全球類似機構比較,評估科研表現,并了解本地和全球合作情況,建立合作伙伴關系,促進交流和發展。其中SciVal比InCites的數據收錄更為全面,尤其是收錄了EI,因此更適合于評價工科高校,但SciVal的學科分類體系與我國的學科體系有很大的差異。InCites數據庫包含了基于中國國務院學位委員會和教育部《學位授予和人才培養學科目錄(2011年)》的學科分類,但文獻數據收錄略顯不夠全面。所以兩者各有優劣,應根據具體的需求做出最優的選擇。
大數據環境下學科服務的核心就是技術與創新,而技術與創新的首要前提是思維的改變。環境在變,思維也在變,大數據環境就需要大數據思維。面對大數據時代帶來的挑戰,把大數據的理念、方法、技術結合圖書館的實際情況,尋找適合圖書館發展的新服務、新方向是圖書館提高服務質量的關鍵。
[1] 楊振力.大數據時代圖書館學科服務模式探析[J].圖書館學刊,2016,(6):73-75.
[2] 薛風平. 加快實施國家大數據戰略[ EB/OL] .[2017-05-02].http://wb.qdqss.cn/html/qdrb/20160109/qdr b131138.html.
[3] Bernard Marr. Big data: the 5Vs everyone must know [EB/OL].[2017-05-05]. http://www.linkedin.com/pulse/20140306073407-64875646-big-data-the-5-vs-everyone-must-know.
[4] 劉江紅, 趙桂榮. 大數據時代高校圖書館個性化學科服務創新探究——以黑龍江大學圖書館為例[J]. 農業圖書情報學刊, 2016, 28(12):166-170.
[5] 隆茜.數據素養能力指標體系構建及高校師生數據素養能力現狀調查與分析[J].圖書館,2015,(12):51-56.
[6] 郝媛玲, 沈婷婷, 高珊. 高校數據素養教育實踐的思考和建議——基于哈佛大學案例和我國圖書情報人員訪談的分析[J].圖書情報工作, 2015,(12):44-51.
[7] 周鳳飛, 王俊麗. 天津市高校圖書館學科館員數字能力現狀研究[J]. 圖書情報工作, 2015,(19):47-54.
[8] 蔚海燕, 衛軍朝. 研究型圖書館學科服務的轉變:從學科館員到學科服務平臺[J]. 大學圖書館學報, 2013, 31(6):74-81.
[9] 李書寧. 985高校圖書館學科服務平臺建設情況調查與分析[J]. 圖書與情報, 2015,(4):71-76.
[10] 贠琳紅. 高校圖書館嵌入式學科服務與傳統信息服務的比較分析[J]. 農業圖書情報學刊, 2014, 26(9):179-181.
[11] 閆文軒. 基于文獻計量學的高校圖書館學科服務創新探索——以武漢紡織大學圖書館為例[J]. 中國教育技術裝備, 2016,(2):79-80.
[12] Koltay T.Data literacy: in search of a name and identity[J].Journal of Documentation,2015,71(2):401-415.
[13] 劉祿峰.大數據環境下高校圖書館學科服務云平臺構建研究[J]. 圖書館學刊, 2016,(3):99-101.