徐國蘭
〔摘 要〕提出了云存儲的概念,總結了云存儲在數字圖書館信息資源存儲中的優勢。通過研究和分析云存儲在數字圖書館應用中存在的安全問題,主要有數據傳輸安全、存儲安全、訪問安全等。提出了改進技術、建立行業標準和規范、引入第三方審計等防范措施。改進了云存儲在數字圖書館信息資源存儲中數據的安全與穩定性。
〔關鍵詞〕云存儲;數字圖書館;數據;數據安全;防范
〔中圖分類號〕G250.76 〔文獻標識碼〕A 〔文章編號〕1008-0821(2012)04-0057-03
目前數字圖書館廣泛采用的存儲方案主要有DAS(Direct Attached Storage,直接附加存儲)、NAS(Network Attached Storage,網絡附加存儲)、SAN(Storage Area Network,存儲區域網絡)、ISCSI(Internet Small Computer System Interface,互聯網小型計算機系統接口)和網格存儲等[1]。這5種存儲方案各有其優勢,但單獨采用其中任何一種方案,都無法全面解決數字圖書館資源存儲面臨的眾多問題。針對這些現存問題,現代數字圖書館正在探索使用云存儲方案。
1 云存儲的概念及在數字圖書館數據存儲應用中的優勢1.1 云存儲的概念
云計算至今沒有一個統一的定義,每個定義都是從自身理解的角度來定義的,但主流的定義主要有技術層面和服務層面的定義。云存儲是在云計算(cloud computing)概念上延伸和發展出來的一個概念。在這里筆者也根據自己的理解來定義云存儲。云存儲是指通過集群應用、網格技術或分布式文件系統,將網絡中分散的、不同類型的存儲設備統一到一個或幾個大的存儲池下,形成一個統一的整體,作為一個動態的存儲資源實體向用戶提供數據存儲和業務訪問功能。由于云計算系統運算和處理的核心是大量數據的存儲和管理,云計算系統中配置有大量的存儲設備,所以云存儲是一個以數據存儲和管理為核心的云計算系統。
在數字圖書館信息資源存儲中應用云存儲可以低成本的實現海量數字資源的存儲,提高存儲資源的利用率,并能提高數字圖書館之間信息資源的共享。與前面提到的存儲方案相比,數字圖書館采用云存儲方案具有較強的優勢。
1.2 云存儲在數字圖書館應用中的優勢
1.2.1 節約成本
云存儲向圖書館用戶提供以網絡為基礎的在線存儲服務,把云存儲集群的一部分提供給圖書館用戶。對于圖書館用戶來說就是通過網絡和一定的應用軟件或應用接口得到一定類型的存儲服務和訪問服務,不需要配置基礎設施,并對這些基礎設施進行安裝、升級和維護,以及數據完整性保護和容災備份。云存儲通過多租戶模式使得使用成本和管理成本大幅度降低。
1.2.2 安全和穩定
云計算采用分布式存儲的方式來存儲數據,采用冗余存儲的方式來保證存儲數據的可靠性(為同一份數據存儲多個副本),采用數據加密技術保證云存儲中的數據不會被未授權的用戶所訪問。同時,通過各種容災技術和措施可以保證云存儲中的數據不會丟失,保證云存儲自身的安全和穩定。數字圖書館采用云存儲,當用戶突然增多、訪問量突然加大時,通過云存儲系統,利用其自身的分布式系統、集群系統,能合理分擔存儲和訪問的壓力,有效地防止數字圖書館系統癱瘓,提高數字圖書館的信息資源存儲系統的穩定性。
1.2.3 實現資源共享
在云存儲系統中,各個數字圖書館的信息資源保存在“云”中,所有符合權限的讀者只要通過互聯網連接到“云”,就可以不受物理地址和時間限制的訪問所有資源,實現了數字圖書館之間的資源共享。
2 云存儲數字圖書館數據存儲應用中的安全問題
云計算的吸引力在于其經濟上的可擴展性、資源復用、低成本和高效率。為了支撐這種低成本高效率,云供應商提供的服務必須足夠靈活,但這種靈活性會降低其對安全控制的能力[2]。根據2009年CSA(Cloud Security Aliance,云安全聯盟)發布的一份云計算安全風險簡明報告總結了7條最常見的風險:濫用和惡意使用云計算;不安全的接口;內部員工的濫用;基礎設施共享問題;數據丟失或泄漏;賬號或服務劫持;未知的風險。云存儲在數字圖書館信息資源的存儲應用中主要存在以下安全問題:
2.1 數據傳輸過程安全
數字圖書館采用云存儲模式,原來局限在私有網絡的資源和數據現在暴露在互聯網上,并且這些資源和數據放到了第三方云計算提供商所有的共享公共網絡上。圖書館在將信息資源數據通過網絡傳遞到云計算服務器進行處理時,會存在這樣的問題:數據在網絡傳輸過程中是否進行了嚴格加密,保證數據不被中途偵聽,即使被偵聽了也無法還原;能否保證數據的完整性;在傳輸過程中能否不被被莫名其妙的修改。
2.2 數據存儲安全
數字圖書館信息資源數據存儲在云存儲系統中,他所使用的基礎設施是共享的,非隔離的,當一個攻擊者得逞時,全部服務器都將成為攻擊者的攻擊對象。所以數據存儲是否安全要看云計算服務商是否有強大的分區和防御策略;是否有強大的實時監控系統防止有未經授權的修改和活動;對所托管數據是否進行備份,備份使用的是單服務器多硬盤方式還是多服務多硬盤方式,是否實現異地備份。
2.3 數據訪問控制安全
數字圖書館信息資源數據在云計算提供商公共云存儲時,惡意軟件和木馬將會在云中變得更強大,垃圾郵件發送者和惡意代碼作者可以利用云服務中的匿名注冊和云服務模式進行網絡犯罪。在云環境中,如果攻擊者能夠獲得你的憑據,他們可以看到你的活動,處理你的數據,并給云計算服務提供商客戶端導致問題。另外,當用戶不再需要已分配的IP地址時,云計算提供商會再分配給其他用戶使用。IP地址再分配使用就會帶來問題。用戶無法確信他們對資源的網絡訪問能隨著IP地址的釋放一并終止,因為從DNS中的IP地址改變到DNS緩存清理,這之間存在一段時間延遲。因此在老的地址被清楚之前,還會一直存在于ARP緩存中。這意味著即使地址可能已經變化,原先的地址在緩存中依舊有效,因此用戶還是可以訪問到那些理應不存在的資源。最后,雖然資源可能無法通過互聯網直接獲得,但出于管理的目的,這些資源必須可通過專用地址在提供商網絡上進行訪問。圖書館的云計算提供商的其他用戶有可能從內部通過云計算提供商的網絡獲得圖書館資源。
2.4 云存儲服務商信用
由于數字圖書館的信息資源數據存儲在公共云,我們不能保證云服務商在得到數據時不將保密數據泄漏出去。有些云服務商的服務合同中規定:我們對于任何未經授權的訪問或使用、破壞、刪除、銷毀或弄丟任何你的內容或應用的程序不負有責任。像這種在合同中不承諾對任何數據泄密事件以及被破壞行為承擔法律責任或義務的服務商很難保證數據的安全。
2.5 知識產權保護
數字圖書館的知識產權問題在云時代有了新變化。圖書館購買云存儲服務后,將自己的數據交給云,由云托管這些數據。從理論上講,圖書館應該完全擁有被托管數據的知識產權。但是在現實中,云存儲商會千方百計利用這些數據,并以數據整合、數據挖掘、知識服務的名義使圖書館數據利用合法化。使得他們利用館藏數據開發出來的一些產品很難界定知識產權的歸屬,這成為一個新問題。
以上數據安全問題主要是由云服務商來保證,而數據備份是最基本的安全保障措施。
3 防范措施
為了解決數字圖書館云存儲存在的安全問題,下面主要采取安全技術措施和法律規范措施兩方面進行討論。
3.1 技術措施
目前有關云計算的安全性問題主要集中在訪問控制(基于層次密鑰生成與分配策略實施訪問控制的方法);利用基于屬性的加密算法(如密鑰規則的基于屬性加密方案(KP-ABE));虛擬安全技術(Santhanam等人提出了基于虛擬機技術實現的Grid環境下的隔離執行機);數據保護(Mowbray等人提出了一種基于客戶端的隱私管理工具,提供以用戶為中心的信任模型,幫助用戶控制自己的敏感信息在云端的存儲和使用)等方面[3]。
3.1.1 訪問控制
圖書館的云存儲服務訪問控制認證和授權兩個方面。身份鑒別就是圖書館讀者向云存儲服務提交操作請求時,云存儲服務在接收到讀者的請求后,要鑒別讀者的身份。為了有效地鑒別讀者的身份,云存儲服務事先就要為每個讀者用戶分配一個秘密訪問密鑰和一個用戶標識;讀者訪問云存儲服務時,首先要生成請求報文,然后利用密鑰采用某種HMAC對請求報文進行簽名,并將該簽名和訪問密鑰惟一標識一起附加到請求報文中;云存儲服務在處理請求前,會對該簽名進行驗證。權限判定就是圖書館云存儲服務完成對讀者用戶的驗證后進一步驗證該讀者是否有進行所請求操作的權限,只有有權限的圖書館讀者才能進行相應的操作,否則操作請求將被拒絕。圖書館云存儲服務還可以通過對讀者用戶進行授權,并進行授權控制,對大量用戶進行管理[4]。
3.1.2 數據加密
數字圖書館的信息資源中有很多涉及圖書館的絕密數據,有時會在傳輸過程稱遭到偵聽,給圖書館造成巨大的損失,所以數字圖書館的重要數據需要進行加密,以防被盜取或破壞。圖書館數據在云計算存儲時由誰來加密,是圖書館自己加密還是云計算服務提供商加密,采用什么加密算法和什么強度的密鑰,這取決于所選擇的云計算服務提供商。圖書館數據在圖書館與云計算提供商之間進行傳輸,對于那些靜態數據如果使用簡單存儲可以進行加密,但有些數據在云計算中處理時,絕對是不加密的。這種未加密狀態的數據很容易遭到破壞。目前關于數據加密的手段很多,普通的加密方案如需對加密文件進行操作,必須將加密數據回傳,解密操作后再加密回傳云端,效率低下。在2009年6月,IBM宣布其研究人員與斯坦福大學的研究生合作,開發出一種完全同態加密方案,這種方案允許在不解密的狀態下處理數據[5]。利用全同態加密技術對數字圖書館的數據進行加密,就是將數據加密后存儲在云端,從而提高數據的安全性,即使這些數據被竊取,沒有相應的密鑰也無法還原,而密鑰只有用戶才知道,云端不知道該密鑰[3]。由于同態加密的特性,云端可以直接對加密文件進行操作,從而提高了對加密數據進行操作的效率。利用全同態加密技術對數字圖書館的數據進行加密既能確保用戶數據安全,又能避免傳統加密方案的弊端的新的云計算數據安全方案。
3.2 制定相關的行業標準、規范、法規
不同云服務商對數據的技術管理能力不同,在對用戶數據管理執行標準上有較大差異,為云計算服務提供商提供了規避大部分安全風險,而將風險轉嫁給用戶的可能,導致用戶權利難以保證。所以,建立國際行業標準,規范服務,確保有國家級的監管來保障云服務質量和安全標準迫在眉睫。OASIS標準組織在SOA安全方面的現有標準,如IAM、IDM。強化的認證標準,數據加密標準,密鑰管理標準以及VM安全配置標準等,都可以被應用到云安全領域。在云安全領域,不是要制定或發明新標準的問題,而是要研究如何把現有的安全技術很好的和云計算對接,最好地發揮作用。Cloud Security Aliance(CSA,云計算安全聯盟)的定位和目標是制定關于云計算安全問題的一些“最佳實踐”和指南[6]。此外,還應對“云”管理服務提供商(MSP)在開放性、共享性、標準化、安全性能、保密級別、企業的誠信與可持續發展制定不同行業等級,依據行業級別運營相應安全級別的數字圖書館“云”業務[7]。
一些數據泄漏事件出自云計算提供商內部員工,所以加強對云計算提供商雇員的管理,在聘用合同上明確雇員的法律責任,在違反安全規定造成安全事故時有權送交司法機關。
3.3 引入第三方的認證機構進行數據審計
無論圖書館放在云計算中的數據有無加密,了解云計算中的數據專門存儲的地點和時刻是非常有用的,甚至有時候是必須的。數據沿襲(對數據路徑的跟蹤)對審計有很重要的作用。云計算提供商確保既能提供有效地數據,又不損害其他已有客戶的利益,又在審計過程中保證審計機構不泄露相關客戶的敏感數據的情況下,協助第三方機構對數據的產生進行安全性和準確性的審計。
4 結束語
云存儲模式的出現,給互聯網環境下數字圖書館信息資源中心作用的發揮帶來了機遇。數字圖書館云服務平臺具有動態的、自適應的系統組成能力與集成機制,能實現分布式數字圖書館服務的虛擬化,能實現更大程度的資源共享與協作。同時,云存儲的應用還處在探索階段,在發展過程中還存在著安全問題和風險。隨著圖書館對云計算技術的關注和安全技術的廣泛應用,以及云安全標準的進一步完善,我國數字圖書館的發展將進入一個嶄新的階段。
參考文獻
[1]劉文云,鮑凌云.“云”下的數字圖書館資源存儲研究[J].情報資料工作,2011,(2):51-54.
[2]丁秋峰.云計算環境下取證技術研究[J].信息網絡安全,2011,(11):36-38.
[3]吳旭東.云計算數據安全研究[J].信息網路安全,2011,(9):38-40.
[4]王平建.云存儲中的訪問控制技術研究[J].信息網路安全,2011,(9):41-43.
[5](美)Tim Mather,Subra Kumaraswamy,Shahed Latif.云計算安全與隱私[M].北京:機械工業出版社,2011:64.
[6]周洪波.云計算技術、應用、標準和商業模式[M].北京:電子工業出版社,2011:332-333.
[7]馬曉亭.云計算環境下數字圖書館信息資源安全威脅與對策研究[J].情報資料工作,2011,(2):55-59.
(本文責任編輯:孫國雷)