◆劉 杰
(山西大學商務學院 山西 030031)
基于大數據的圖書館信息安全問題分析
◆劉 杰
(山西大學商務學院 山西 030031)
在對大數據及其相關概念進行論述的基礎上,探討了大數據環境下圖書館運行過程中所面臨的主要問題。為了保證圖書館的信息安全,本文分別從知識產權保護、隱私安全、網絡安全以及數據存儲四個方面提出了對應的策略,形成了相對完善的圖書館信息安全管理對策,為圖書館信息安全問題應對提供相關參考。
大數據;信息安全;圖書館
大數據是在“Web2.0”和云計算之后出現的一種新型信息技術,是當前信息技術研究的熱點問題之一。隨著現代圖書館信息系統建設規模的不斷擴大,大數據在圖書館信息服務中開始得到了相對廣泛的應用,這給圖書館信息系統帶來發展的同時,也給圖書館的信息安全防范工作帶來了一定的挑戰。因此,探討大數據環境下圖書館信息安全面臨的主要問題,并提出針對性的解決策略,對優化圖書館整體信息安全系統,保證圖書館信息安全具有十分重要的作用。
大數據(Big Data)是一個相對抽象的概念,在當前信息研究領域并沒有一個統一的定義。通常認為大數據是指使用常用軟件工具獲得、管理并處理數據所消耗時間超過可容忍時間的數據集。根據Gartner的定義,“大數據”需要對處理模式進行更新才能夠提高系統的決策能力、洞察能力以及流程優化能力,從而能夠獲得多樣化的信息資源[1]。也有部分研究人員將“大數據”描述成為是未來的新石油,不同的定義多是根據大數據的具體特征歸納整理出的,其大多是從大數據的規模性、多樣性、高速性與價值性四個方面著手進行分析。
2.1 圖書館藏知識產權及衍生知識產權問題
在當前大數據環境下,圖書館網絡系統通常會通過構建海量的信息資源共享知識數據庫,實現不同圖書館之間的館際共享和交流。大量的數字資源在圖書館網絡系統中傳播,不但容易被復制、截取,而且容易產生知識產權等方面的糾紛。尤其是在當前云共享以及分布式存儲網絡體系之下,知識產權糾紛和矛盾已經成為了圖書館館藏管理的重要對象。例如,不同的圖書館機構通過購買云服務,并將自己產生的數字資源提交給云服務上進行管理。按照知識產權的理念,數據的持有者應該完全擁有其被托管數據的知識產權,但是實際上當數據提交給云服務商之后,他們通過數據挖掘等方式獲得數據的內在核心價值,并對這些數據加以利用。通過這種對數據二次開發的方式從中獲得相關信息,并獲得相關利益,這在很大程度上侵犯了信息所有者的知識產權。
2.2 用戶的隱私保護問題
在當前的大數據背景下,圖書館館際服務能夠為用戶提供豐富的知識資源與服務,例如數字圖書、知識挖掘、知識分析和數據處理等。當通過使用大數據方式進行整合、挖掘、分析而獲得海量的數據信息時,會涉及到很多個體用戶及機構的私人信息。若不能夠對這些數據信息進行妥善處理,則可能會嚴重威脅社會穩定,造成安全威脅。例如,圖書館通常會對用戶的資料、讀書行為、個人偏好以及位置信息等進行分析,甚至可以深入至微博、微信等社交網絡中,達到某種商業價值,從而給用戶的生活帶來困擾。
2.3 網絡安全問題
現代數字圖書館是以互聯網為基礎構建起來的信息傳遞以及知識共享的系統,能夠為讀者提供全面的服務。在網絡系統中,大數據因為其豐富的資源及其更具價值的特點更加容易成為網絡上被攻擊的目標。這主要是因為圖書館的“大數據”不但包含大量的數據,同時還包含了用戶行為、敏感數據等,這些數據更容易吸引攻擊者,使得大數據成為更加有吸引力的目標。同時,黑客通過大數據發起網絡攻擊,能夠同時控制數百萬臺計算機,實現多點海量攻擊。另外,利用大數據,黑客還可以發動APT攻擊,并將其攻擊代碼隱藏在大數據中,難以被檢測得到[2]。
2.4 數據存儲安全問題
當前,現代圖書館所關注的數據不再局限于普通的數目(書目)信息、讀者信息和數字刊物等業務數據,其還涉及到微博、微信和移動互聯網絡等讀者活動中產生的信息。這些數據具有極強的社會化功能,其龐大的數據集是對圖書館存儲、軟硬件設備的一個重大考驗。因此,如何避免這些重要數據的丟失、損毀以及被非法入侵、利用,是現代圖書館數據存儲所面臨的一個重要安全問題。一般,在大數據環境下,圖書館為了壓縮成本,通常會將這些數據存儲至云端,而云端的開放性、海量性都給其帶來了潛在的風險與威脅。
3.1 知識產權的保護
針對大數據環境下知識產權的保護問題,圖書館的信息資源存儲中心要結合云計算的具體協議與標準,制定在圖書館內部使用云計算時必須遵循的準則與規范。同時,對通過對提供云計算服務的相關供應商進行對應的評估和考核,詳細地了解企業所提供的云計算產品的技術性能和能夠持續應用的情況,并對其采取對應的訪問控制及管理措施,保證圖書館間的合作與數據共享能夠逐漸實現標準化和規范化。另外,國家相關部門還應該盡快地完善相關的法律制度,以適應新的技術,使得云服務提供商與圖書館、著作權人機用戶之間的利益得到權衡,避免出現網絡資源隨意傳播,侵害著作權人權益現象的出現。最后,數字簽名、數據加密、數字證書、安全容器等技術手段也能夠在對應程度上打擊侵權現象的出現。
3.2 數據安全監管機制的構建
大數據及其關鍵技術的快速發展給圖書館大數據的存儲及分析奠定了堅實的基礎,其逐步成為了圖書館的重要資產。但是,這些海量數據及數據分析結果一旦出現問題,例如泄露等情況,則對個人及整個圖書館都是一個重大的損失,甚至可能造成聲譽受損的情況,嚴重時還需要承擔相關的法律責任。除了技術問題之外,圖書館的大數據還是一個管理問題。因此,圖書館除了需要從技術方面保證數據存儲安全、云安全以及網絡安全等方面保證系統的信息安全威脅之外,還需要從數據安全監管、數據資源共享機制以及數據隱私保護等方面進行管理,加強對敏感數據的審計與保護工作,從管理方面避免圖書館核心數據、隱私數據以及敏感數據的流失。最終形成一個能夠貫穿到圖書館運行各個流程的數據監控與管理機制,保證隱私數據、數據預處理等功能。
3.3 強化網絡監管
為了保護大數據環境下圖書館信息資源的安全,并避免圖書館網絡導致的數據泄露問題。這就要求圖書館必須做好網絡監管工作,通過集中優勢資源,學習并借鑒國內外其他圖書館運行管理獲得的先進經驗,建設具有自身獨特功能及效果的網絡監管系統,做好網絡安全監管與檢查工作。同時,在日常的數據管理工作中,也需要通過加強數據的實時監控及定期抽查等工作,將信息安全問題作為網絡管理的重要手段。
3.4 確保數據存儲安全
圖書館是云存儲服務的重要用戶,其關注的重點在于保證云端數據的完整性和安全性,即要避免非法入侵,并保證合法訪問時數據的精確性。從當前大數據的實際應用及相關成果來看,為了保證存儲數據的安全,可以從身份認證、加密存儲以及數據災備三個方面來保證云數據安全。
(1)身份認證技術
應該強化圖書館云端數據的管理,通過身份認證的方式,保證管理員、用戶、云存儲服務商等通過認證的用戶能夠獲得訪問權限,并可能夠實現對“云端”數據資源的管理、分析、訪問。云端數據因為具有跨平臺、異構、分布等特點,為了提高管理人員及用戶的訪問效率,應該建立一個高效的統一身份登錄與認證系統,支持各個圖書館之間進行身份認證信息共享,減少重復驗證造成的資源浪費問題。
(2)加密存儲技術
通過對數據及文件進行加密存儲,能夠保證圖書館的數據在云存儲及數據資源傳輸過程中不會出現意外的丟失、損壞和非法利用。加密處理過程中,主要包括這樣兩個方面:① 密鑰的管理與生成;② 使用密鑰對數據進行加密存儲與解密讀取[3]。利用云存儲系統給用戶生成的解密秘鑰,系統將數據存儲在云端,用戶在下載加密數據之后,通過使用自己的秘鑰恢復數據,獲得原始的真實數據。在這個過程中,存儲性能及網絡傳輸效率將會影響到存儲性能,所以要加快加密存儲技術的研究。另外,也需要有針對性地對重要數據、敏感數據及個人信息數據等進行加密存儲。
(3)數據災備技術
云計算的一個重要特點及其優勢就是具有數據災備的優勢。通過使用虛擬化技術、分布式技術以及云計算等技術,能夠實現多點備份、數據的自動冗余存儲、云節點數據級災備等功能,可以保證數據在出現災變之后及時地恢復系統功能。因此,圖書館通過利用云存儲技術在不同的物理存儲設備上建立兩個及以上的圖書館云存儲數據中心,形成一個跨地域的統一存儲平臺體系,各個業務部門以及用戶都能夠實現數據共享,保證數據中心的整體完整性,能夠為數據中心提供持續的服務。
[1]王彤.大數據時代下的圖書館跨界服務信息安全技術問題及對策[J].數字圖書館,2014.
[2]鮑劼,李蘇豐.大數據環境下圖書館信息安全問題與對策分析[J].科技情報開發與經濟,2014.
[3]胡瑋瑋.大數據時代下圖書館面臨的信息安全問題與對策[J].創新科技,2015.