任生楠 黃奮 徐寬
東北師范大學信息管理系,吉林 長春 130000
云存儲在數字資源長期保存中的優勢和問題研究
任生楠 黃奮 徐寬
東北師范大學信息管理系,吉林 長春 130000
文章結合數字資源長期保存的模式及云存儲的含義,分析了云存儲在數字資源長期保存中的優勢,進一步探討目前云存儲存在的突出問題。
云存儲;數字資源長期保存;安全問題
云存儲是一種新興的數字信息存儲概念,鑒于它在資源分布式保存利用方面的優勢,已經開始在數字資源長期保存研究中得到重視,可以為該領域提供有力的技術支持。
1.1 信息長期保存的最終目標
目前比較常用的保存模式有遷移、仿真和備份。遷移法是把數字信息按照一定的周期從一代計算機上遷移到新一代計算機上的過程;仿真法是對已經過時的或者數字信息產生時的硬件、軟件及系統進行模仿,使得數字信息能以原始面貌出現;備份法是在多個地點、利用多個備份來完成保存工作。但這些策略有些價格昂貴,普通的機構很難保證長期的支付,有些技術手段單一或者技術過時,影響保存和重現效果,而云存儲概念的提出就可以有效地解決這些問題。
1.2 云存儲的功能作用
云存儲系統的結構模型由4層組成。
存儲層。存儲層是云存儲最基礎的部分。存儲設備可以是FC光纖通道存儲設備,可以是NAS(網絡附加存儲)和 iSCSI 等IP存儲設備,也可以是 SCSI 或SAS(統計分析系統 )等 DAS(直接附加存儲)存儲設備。云存儲中的存儲設備往往數量龐大且分布多不同地域,彼此之間通過廣域網、互聯網或者FC光纖通道網絡連接在一起。
基礎管理層。云存儲通過集群、分布式文件系統和網格計算等技術保證各個存儲設備之間協同工作, 同時利用數據壓縮、重復數據刪除、數據加密等技術進行數據管理和安全管理。
應用層。不同的云存儲開發不同的應用服務接口, 提供不同的服務。
訪問層。任何一個授權用戶都可以通過標準的公用應用接口來登錄云存儲系統,享受云存儲服務。
與傳統存儲系統相比較,云存儲系統具有如下不同:
(1)功能。云存儲系統針對的是多種類型的網絡在線存儲服務,但傳統存儲系統則針對如高性能計算等應用;
(2)性能。云存儲服務要把考慮數據的可靠、安全、效率等指標作為首要目的,而且由于用戶規模大、服務范圍廣等特點,實現高質量的云存儲服務必將面臨更大的技術挑戰;
(3)數據管理。云存儲系統不僅要提供類似于POSIX(可移植操作系統接口)的傳統文件訪問,還要能夠支持海量數據管理并提供公共服務支撐功能,以方便云存儲系統后臺數據的維護。
從2006年到2010年,全球信息總量增長了6倍以上,隨著技術的不斷發展,現已經普遍采用的SATA硬盤容量是750GB或1 TB。但在面對PB級的海量存儲需求時,傳統的NAS(網絡附屬存儲)或SAN(存儲區域網)已經不能滿足目前對數據保存高容量、高性能、易擴展的需求。
2.1 支持海量存儲
傳統的DAS和SAN使用塊數據存儲, 并利用分離的文件系統或數據庫管理支持串行擴容, 在系統規模較小時性能較好, 但是隨著數字資源數量的不斷增大,存儲性能會受I/O服務瓶頸制約而降低。云存儲集成使用了支持大規模存儲的集群技術、P2P 技術和網格技術, 允許存儲服務器和存儲節點同時增加, 進行并行擴容。因此, 在擴展時不會遇到兼容性的問題, 存儲的性能還會隨著節點的增加而無縫增長。
2.2 動態擴展與動態保存
云存儲能將資源集中監控,同時可將這些資源進行動態管理,確保每個應用所使用的存儲空間可以實時調整。因此,在進行數字資源長期保存時,機構可根據自身保存資源的狀況,在保存前期先申請較小的存儲空間,隨著保存資源的增加,動態調整存儲空間大小。此外,存儲中的任何數據都是經常被使用的。由于云存儲自身動態靈活的特點,機構在保存資源時并不是想將其完全靜態孤立的保存,所以,當原有的數據應用平臺出現版本過低要求升級時,利用云存儲的優勢,同時也將數據對象格式同步升級,而不會等到數據版本或者環境因素改變過多而造成原有數據無法讀寫、原有數據平臺無法接納新數據的矛盾情況。
2.3 管理方便
在以往的存儲系統管理中,管理者不但要了解并掌握不同存儲設備的管理界面,而且對所有目前正在應用的存儲器使用狀況要精確掌握,工作量繁瑣且容易出錯。此外,在硬盤或是存儲服務器損壞時,數據容易丟失。而云存儲則大大避免了這個麻煩,若硬盤損壞,數據會自動按照一定的程序遷移到另外的已經準備好的硬盤,不用立即更換存儲器,從而減輕了管理者的工作負擔和出錯概率。
2.4 成本更低廉
云存儲系統中所采用的存儲及服務器設備均是性價比較高的設備。可實現長久合作關系下,設備商采購的穩定渠道,便于實現對成本及服務質量的控制。傳統的存儲系統對硬盤的一致性要求近乎苛刻,必須同廠牌、同容量、同型號,否則系統很容易出問題。面對升級換代較快的IT產業,硬盤在使用2~3年后很難找到同型號產品更換。使用云存儲沒有這個問題,云存儲系統對存儲設備、服務器設備、硬盤等產品的一致性沒有要求,不同介質、容量、廠牌、型號的硬盤,都可以一起工作,既可以實現原有硬件的利舊保護投入,又可以實現新技術、新設備的快速更新,合理搭配、優化選擇、可持續發展。
如今,云存儲已經越來越受到人們的重視,其特有的優勢幫助使用者們解決了許多過去無法解決的問題,同時也為使用者們節省了不少資金,但是由于云存儲剛剛被引入數字資源長期保存領域不久,因此由于技術受限而存在的一系列問題自然成為焦點,主要涉及的問題包括:
3.1 安全問題
(1)云數據存儲位置
在云提供商中,用戶不知道實際數據的存儲位置,這一點會造成用戶對于數據存儲地的擔心。另外還有對敏感數據的訪問問題,如果云存儲管理出現異常,可能導致用戶不能掌控自己數據的訪問權限。
(2)數據隔離
云存儲存儲了大量的客戶數據,這些數據本身是應該隔離的,云提供商需要保證私有數據不能被其他無授權的用戶訪問。
(3)數據恢復
一旦云端數據出現全部或部分數據破壞時,提供商是否有能力進行全面恢復, 需要多少時間才能完成恢復, 都具有不確定性.
(4)云服務擴充與遷移
當用戶需求擴大時, 云提供商現有的云服務不能滿足用戶需求,用戶需要轉移至其他云提供商。但對于用戶來說,已有數據及應用能否保證順利遷移將面臨很大的不確定性。
3.2 數據隱私問題
需要長期保存的數字資源類型不僅包括期刊論文,還包括在互聯網上開放獲取的資源。對于前者,往往只有訂購數據庫的用戶(如高校圖書館,各類研究所等)才有權利訪問,并且受到版權的保護。如果將這些數據內容以遠程方式存放到云端,必然會引發用戶對數據隱私保護的擔憂。目前,在云存儲技術領域,有研究者提出可以通過加密或文件/碎片方式阻止未經授權用戶的非法訪問,但這是否適用于數字資源長期保存的流程、是否還能夠保證數據的完整性, 有待于進一步研究和考證。
數字資源長期安全保存的最終目的不是保存,而是利用。保存是手段,而利用才是最終目的。作為一項新的概念,云存儲有它自己獨特的技術等優勢,在數字資源長期安全保存領域中是一顆新星,雖然有很多地方不是很完善,但是對于未來的年輕科學家們來說,這種思想的提出,不僅對現當代有著重要的意義,還為今后數字資源長期安全保存提供了捷徑,云存儲將是未來數字資源長期安全保存的主流方向。
[1]趙敏.淺談數字資源長期保存相關問題[J].科技情報開發與經濟.2010(11):98~101
[2]宋凱,耿義良.云存儲技術[J].才智.2010 (04):65
[3]張龍立.云存儲技術探討[J].電信科學. 2010(S1):71-74
10.3969/j.issn.1001-8972.2011.18.025