榮幸 邢奕
關鍵詞:大數據;圖書館;業務管理
摘要:文章簡述了大數據的概念和特征,提出圖書館應以信息資源為對象構建動態采購平臺,以圖書館業務為對象構建風險評估模型,以用戶為對象構建數據挖掘系統,以業務人員為對象構建靈活的工作模式,以技術為對象構建大數據支撐體系,創新圖書館業務管理模式,提高圖書館業務管理水平。
中圖分類號:G251文獻標識碼:A文章編號:1003-1588(2017)11-0110-03
大數據背景下,人們的生活發生了改變。隨著大數據應用實例的增多,圖書館也開始從不同角度對大數據的利用進行研究。如:2008年,張保華基于南京理工大學圖書館的圖書借閱系統,對數據挖掘技術進行了研究[1];2012年,樊偉紅等學者對圖書館需要怎樣的“大數據”進行了系統的梳理,指出圖書館的業務工作也需要利用大數據[2]。
1大數據的概念和特征
隨著現代科技的發展,新技術、新知識層出不窮,大數據(Big Data)也成了這些海量數據的代名詞,但大數據并不單純指這些海量的數據,其還有更深層的含義。大數據從時間和速度兩個維度進行解析,是一種結構化和非結構化相結合的數據。麥肯錫第一次提出了大數據的概念,他認為大數據是典型數據庫軟件不能進行采集、儲存、管理和分析的數據集合[3]。但到目前為止,大數據的概念還沒有一個準確的定論。雖然大數據的概念還不確定,但大數據的一些特征是公認的,這些特征為圖書館了解大數據、應用大數據提供了實質性的幫助。
1.1類型多,容量大
傳統的圖書館館藏會成為大數據的一部分,如大量的電子圖書、期刊、音頻、視頻資源等。用戶在利用圖書館時也會產生各種數據,如讀者的行為數據、移動設備數據等。另外,圖書館內的技術設備在運行時也會產生大量的數據,如自助打印、復印設備及RFID設備等。這些類型多樣、數量龐大的數據構成了圖書館的大數據集。
1.2增長速度快
目前,大數據呈現快速增長趨勢,存儲單位已經從TB級別發展到PB甚至EB 級別。大數據驚人的增長速度對圖書館提出了兩個方面的要求:一是對存儲技術提出了要求。如果沒有新的存儲技術,迅速增長的信息量將迫使圖書館花費更多的資金購買新的存儲設備。二是對信息處理速度提出了要求。圖書館只有及時抓住稍縱即逝的數據進行分析,才能挖掘出有價值的信息。
1.3結構化與非結構化并存
圖書館傳統的數據庫軟件主要處理結構化的數據,這些數據規律性強,可以使用不同的模塊對數據進行采集、存儲和處理。但大數據背景下,用戶已經不是單純的信息獲取者,他們還會成為信息的制造者。這些非結構化的數據也會給圖書館的管理帶來很多問題,但如果圖書館能對這些數據加以利用,會使其發揮很好的作用。
1.4數據價值密度低
雖然大數據中蘊含廣泛、有價值的信息,但其同時也存在價值密度低的特征。如:在圖書館長達1小時的視頻監控信息中可能只有幾十秒是有用的,而要分析出有用的信息,則需要花費大量的人力、物力及時間[4]。因此,圖書館必須掌握有效的大數據處理方法,才能在數量龐大的數據中找到對圖書館有用的信息。
2大數據與圖書館業務管理
圖書館的業務部門一般包括采訪編目部、流通閱覽部、信息技術部、參考咨詢部等,傳統的業務工作流程包括采訪、編目、加工、存儲、服務等[5]。在大數據的影響下,圖書館的業務也發生了變化。如:圖書館傳統的采購和編目工作,通過招標等形式外包給其他機構,圖書加工也對外委托,圖書館的業務工作重心轉向以數據為中心的信息資源組織、利用與保存,數據的采集、存儲、挖掘和分析成了圖書館的主要業務[6]。圖書館對復雜的大數據進行數據挖掘和可視化分析,可以使用戶更準確、及時、有效地利用信息[7],但大數據也給圖書館的業務管理帶來了以下問題:①數據采集問題。圖書館的工作量并沒有因為業務外包而減少。大數據時代,圖書館的每一項業務都涉及數據,如何高效收集各種數據,成為決定圖書館業務工作成效的重要因素。②質量控制問題。圖書館傳統的結構型數據庫已經不能適應非結構化數據和半結構化數據的動態管理和分析需求,業務管理模式如不加以革新,其業務工作的質量將會難以跟蹤和控制[8]。③數據利用問題。圖書館收集大數據的最終目的是為了提高圖書館的服務質量,讓用戶充分利用圖書館的資源創造價值。從圖書館業務工作的內容來看,信息資源如何組織、存儲和利用,都涉及大數據的利用問題。從圖書館業務工作的形式來看,任何一個業務工作流程都會產生新的數據,這些數據包含隱性的有用信息,圖書館只有把這些隱性信息挖掘出來,發現業務工作中的重點和難點,才能改進業務工作流程,提高業務工作水平。
3基于大數據的創新性的圖書館業務管理模式
3.1以信息資源為對象構建動態采購平臺
信息資源是圖書館開展各項服務的基礎,圖書館應根據服務對象和經費情況決定采購哪些圖書及哪種類型的數據庫。因此,圖書館應構建一個動態的信息資源采購平臺,對出版社的動態、不同層次用戶的閱讀需求和閱讀形式、供應商的實際情況等數據進行收集,設置權重,利用大數據分析技術構建圖書評價系統。圖書館只需把書目、出版社、供應商的信息導入系統,就能實時、準確地挑選到圖書,不但可以降低館藏資源的購置費用,還能提高館藏資源的利用率。
3.2以圖書館業務為對象構建風險評估模型
圖書館的業務工作與服務息息相關,業務工作出現偏差會導致服務出問題。因此,圖書館應根據自身情況構建圖書館業務風險評估系統,在開展新業務前先進行風險評估。如:圖書館在建立數字圖書館初期,應收集經費、技術、設備等數據資料及科技發展數據、供應商數據、用戶數據等[9],利用這些大數據構建信息安全風險評估模型及知識產權風險評估模型,科學分析構建數字圖書館的可行性,智能輔助決策,降低數字圖書館建成后可能帶來的風險。endprint
3.3以用戶為對象構建數據挖掘系統
用戶在利用圖書館資源時會留下各種數據,這些數據可以歸為以下五類:①用戶的資料。用戶資料可以幫助圖書館了解服務對象的類型、層次、地域分布等,從而有針對性地提供閱讀推廣和參考咨詢服務。②用戶的到館數據。這些數據可以使圖書館了解用戶的到館周期,為其制定各項業務的工作時間提供依據。③用戶的查詢或咨詢數據。用戶在圖書館進行參考咨詢或查詢書目信息、圖書館區域分布時都會留下數據,這些數據都和用戶的需求有關[10]。④用戶的借還數據。用戶的借還數據可以幫助圖書館了解用戶的閱讀周期和閱讀需求,一些相關數據還能在信息資源采購平臺中被加以利用。⑤用戶訪問電子資源的數據。這些數據主要是用戶在檢索、瀏覽、下載時產生的數據,它們會成為圖書館在構建數據、挖掘系統時的重要資源。通過構建以用戶為對象的數據挖掘系統,圖書館可以了解用戶對館藏資源的滿意程度,分析用戶流失的原因及到館用戶和網絡用戶的顯性需求和隱性需求[11]。
3.4以圖書館員為對象構建靈活的工作模式
當代圖書館員應具備基本的學科知識、超前的服務意識、數據分析和處理能力、開發隱性知識的能力及開拓創新的能力[12]。圖書館員對圖書館的業務工作最為熟悉,也最能發現業務工作中存在的問題。因此,圖書館除了要培訓館員,還應以館員為研究對象,收集館員的工作數據,并對這些數據進行分析,找出工作中的不足,進而建立更有效率的工作模式,使館員充分發揮才能。
3.5以技術為對象構建大數據支撐體系
圖書館不論是從信息資源、業務還是館員、用戶的角度對大數據進行分析都離不開技術,這些技術包括大數據采集技術、大數據存儲技術、大數據分析和處理技術等[13]。目前,較為成熟的大數據處理技術有Hadoop、SAP HANA、Hive、Pig等[14]。圖書館利用這些技術進行大規模的數據處理和分析,不僅可以降低館員的工作量,還能為用戶節省時間。為了構建以技術為核心的大數據支撐體系,圖書館除了要購置相關的軟硬件設備,還應注重對技術人才的培養。大數據背景下的技術人員不僅需要具備豐富的大數據知識,還應了解各類數據庫軟件和數據挖掘、分析軟件。為了更好地把大數據應用于圖書館的業務管理,圖書館應對技術人員進行圖書館業務培訓,使其成為精通圖書館業務的技術型人才。其培養方式主要有:①人才委托培養。即圖書館聘請專業機構對圖書館的技術人員進行技術和業務培訓。②與高校、企業合作。即圖書館與高校、企業聯合開展大數據培訓課程,使大數據的理論與實踐相結合。
4結語
大數據拓寬了圖書館業務管理的視角,使圖書館可以從更廣泛的角度考慮業務管理的流程及方式。大數據逐漸成為圖書館業務的基礎,而圖書館的業務則是大數據的價值體現。圖書館在利用大數據時應重視對用戶、合作機構及圖書館員的隱私保護,在采集、保存、利用和開發大數據的過程中要建立隱私安全保護機制及法律保障體系[15],避免出現信任危機,最大限度地發揮大數據的價值。
參考文獻:
[1]張保華.數據挖掘技術的研究及在圖書借閱系統中的應用[D].南京:南京理工大學,2008.
[2]樊偉紅,李晨暉,張興旺,等.圖書館需要怎樣的“大數據”[J].圖書館雜志,2012(11): 63-68.
[3]桂定君.基于大數據的圖書館信息服務體系研究[J].河南圖書館學刊,2014(1):111-113.
[4]李紅霞,曾英姿.高校圖書館基于大數據的知識服務[J].現代教育技術,2014(9):15-21.
[5]劉二燦.網絡環境下圖書館機構設置探析[J].情報雜志,2004(10):87-89.
[6]周明璇.淺談圖書館信息資源組織與服務發展趨勢[J].內蒙古圖書館工作,2012(1):32-34.
[7]陳艷.基于大數據的圖書館業務流程再造研究[J].新世紀圖書館,2014(6):28-31.
[8]張國杰.大數據視角下圖書館服務發展走向及策略研究[J].圖書館工作與研究,2014(6):8-12.
[9]周杰,蘇靜,曾建勛.下一代數字圖書館的發展思考[J].圖書情報工作,2013(8):35-39.
[10]樓晶.圖書館個性化信息推送系統[J].圖書館學研究,2008(4):49-53.
[11]馮小嬋.基于用戶隱性需求顯化的互動式服務組織[J].情報雜志,2006(10):90-92.
[12]楊萬勤,陳霞,徐宏儒.大數據時代的圖書館館員業務素養研究[J].山西檔案,2014(5):49-51.
[13]郭曉春.淺談大數據對圖書館發展的影響[J].中國西部科技,2015(1):125-126.
[14]張毅,趙雅潔.論大數據在圖書館管理與服務中的應用[J].圖書館工作與研究,2015(9):4-8.
[15]郭雷.論圖書館讀者的個人數據及其保護[J].科技情報開發與經濟,2007(27):23-25.
(編校:徐黎娟)endprint