馮秋燕
(河南財經政法大學,河南 鄭州450000)
大數據時代信息文獻資源共建共享的創新與發展
馮秋燕
(河南財經政法大學,河南 鄭州450000)
大數據時代下,電子書刊等電子資源的積累、云計算和社交網絡等信息技術的發展、高速網絡和智能手機的普及,為信息文獻資源提供了廣泛的數據來源。如何更好地管理、利用大數據成為現今的熱點話題。本文首先介紹了大數據的特征、概念和應用情況;然后以我省為例講述信息文獻資源共建共享目前的情況為例;最后,以經典案例為契機,探討了大數據時代下信息文獻資源共建共享的創新模式。
大數據;信息文獻資源;共建共享
隨著博客、社交網路、物聯網等新型技術的興起,大數據時代的到來,學術界、工業界、政府機構都開始關注大數據問題。2008年,《Nature》推出了BigData專刊。
大數據不僅僅指數據量的龐大和數據規模的龐大,依據大數據所具有的規模性、多樣性、高速性、價值性、真實性等特征,大數據具有3V和4V定義,維基百科對大數據的定義[1]為:大數據是指利用常用軟件工具捕獲、管理和處理數據所耗時間超過了可容忍時間的數據集。
大數據的典型應用有:科學計算、金融、社會網絡、移動數據、網絡數據、多媒體等,其中所用數據量均在GB級以上,大數據給人們帶來便利的同時也給傳統的數據管理方式帶來了極大的挑戰,詳見表1。目前,大數據的處理以云計算為基礎,有流處理和批處理[2]兩種模式。表1給出了大數據集成、大數據分析、大數據隱私、大數據能耗、大數據處理與硬件的協同問題、大數據管理的易用性、性能的測試基準等大數據目前所面臨的問題及其子問題。
以河南省高等教育文獻保障系統(HALIS)為例,HALIS以中國教育科研網(CERNET)為依托,配合CALIS,聯合河南省各高校圖書館,實現了全省高校信息文獻資源的有效開發和利用;黃河金三角“示范區”[3]中的6所高校,建立學校聯盟,調配資源,優勢互補,逐步推進區域性資源共建共享。
表2描述了以HALIS為平臺,高校圖書館對超星電子圖書、電子版《四庫全書》、CSSCI數據庫、CCC數據庫、中文科技期刊數據庫的訂購情況,最高的是超星電子圖書96.67%,而最低的CCC數據庫只有36.67%,可見,河南省高校圖書館的共建共享服務情況并不理想。

表2 河南省HALIS的利用情況
大數據對信息文獻資源的沖擊不可避免,本文以數據這項基礎性資源為出發點,分別從大數據時代下信息文獻資源共建共享創新層面、創建虛擬圖書共建共享社區、創建區域性總分館模式三個方面對大數據時代下信息文獻資源共建共享創新方法進行闡述。
4.1 大數據時代下信息文獻資源共建共享創新層面
本節從管理層次、技術層次、人員建設、服務模式四個層面對大數據時代下的信息文獻資源共建共享進行簡單的分析。
大數據建設是一項系統工程,需具備良好的運作機制:
4.1.1 在管理層次,應完善數據管理措施,建立數據管理部門,負責數據的獲取、管理、使用、分析、協調等工作,如美國的MIT、康奈爾大學圖書館成了專門的“研究數據管理服務工作組(RDMSG)”,負責如元數據標準、數據重用、數據共享、處理數據版權等數據管理工作。
4.1.2 大數據技術是解決大數據問題的核心,搭建合理的大數據技術架構是基礎性同時也是全局性工作。大數據架構,自底向上,第一層即底層是大數據的采集工作,即對結構化、半結構化、非結構化數據、科學數據、課件、數據庫、論文、郵件、社交網絡、微博等的處理;大數據架構的第二層是大數據的存儲工作,可以采用云存儲、NoSQL、Hadoop、HDFS、Mapduce、HBASE等技術;大數據架構的第三層是大數據處理工作,即大數據的集成、數據抽取、數據建模、重復數據刪除、聚合與關聯、網格計算、數據加密、數據容災等工作;大數據架構的第四層即大數據的應用,包括信息檢索、資源發現、數據挖掘、數據可視化、相關應用軟件、推薦服務、學科化服務、知識服務等。
4.1.3 在人員建設上,應具有一批懂技術、通管理的人員隊伍。美國國家科學委員會(NSB)提出的“數據科學家(DataScientist)”中,包含學科專家、信息科學家、數據處理員、計算機科學家、圖書館員等。
4.1.4 由于信息已經從“紙質”向“數字”進行轉變,原有的服務方式、模式也應當做適當的調整。首先,應當收集、整理、編輯數據,其次,應當對信息進行分析、認知、推理,然后,發現、獲取、應用知識,最后,對知識進行積累、預見形成智慧(Wisdom),通過這四層對信息的處理模式,最終將有效的信息提供給需求者。
4.2 創建虛擬圖書共建共享社區
虛擬圖書共建共享社區指的是,成立多個不同種類的社區興趣小組,小組內部成員有相同或相似的興趣、愛好,相互之間可以分享自己感興趣的圖書或雜志等,還可以將興趣指數、評價較高的資源放置到該小組的“云”端,供大家分享,小組之間可以通過組間“云”端共享所需資源。換言之,創建社區興趣小組即將大數據劃分為不同質(“質”指興趣、愛好等分類依據)的數據,對大數據的處理在小范圍內迭代進行,實現了大數據時代下信息文獻資源的共建共享。

表3 創建虛擬圖書共建共享社區影響因子
創建虛擬圖書共建共享社區除需要考慮如表3所示的幾個因素,還需滿足以下三個轉變:第一,紙質文獻轉變為電子資源;第二,傳統的固定服務模式向移動服務模式轉變;第三,工作人員由原來的坐班制變為Web在線服務制。
4.3 創建區域性總分館模式
本文秉著科學計劃、系統整體、規范統一、共建共贏、注重特色的原則,以平臺共享、權威協調為策略創建區域性總分館模式。
區域性總分館模式是指以學校特色、類型為依據,結合地域分布的特點,在該區域建立總分館模式,整合區域內高校的文獻信息資源,提高資源共知共享程度的管理體制和服務模式。
區域性總分館模式,以區域內總館為中心,在區域內設置分館、汽車流動圖書館、24小時自助圖書館等。該模式,首先,可以通過建立分館(如圖1所示)進行館際互借,實現紙質資源的區域性傳播;其次,根據用戶需求,可以通過郵件等形式,提供給用戶所需電子版資源;最后,總分館之間進行溝通交流,定期更換各自館內的館藏等。
本文以河南省高等教育文獻保障系統為例,闡述了大數據時代下信息文獻資源共建共享的發展方法,這些創新模式有望在更多的地區加以使用。
[1]Bigdata[EB/OL].[2012-10-02].http://en.wikipedia.org/wiki/ Big_data.
[2]KumarR.Twocomputationalparadigmforbigdata[EB/OL]. [2012-10-02].KDDsummerschool,2012.http://kdd2012.sigkdd. org/sites/images/summerschool/Ravi-Kumar.pdf.
[3]梁轉琴.黃河金三角“示范區”高校文獻信息資源共建共享探析[J].圖書館學研究,2013(6):63-67.
[4]王海.總分館模式下文獻資源共建共享的探索與實踐—以濟南市圖書館為例[J].圖書館學刊,2013,(4):45-47.
G250
A
1671-0037(2014)-48-1.5
2013年12月26日。
馮秋燕(1988-),女,碩士,助理館員,研究方向:現代軟件工程技術、數據挖掘、大數據等研究工作。