◆湯桂清 孫玲玲 陳艷輝
網絡環境下的檔案數據儲存安全管理及其構建分析
◆湯桂清1孫玲玲2陳艷輝3
(1.承德廣通信息網絡有限公司灤平分公司 河北 068250;2.河北民族師范學院 河北 050000;3.灤平縣國土資源局灤平鎮國土資源所 河北 068250)
隨著社會經濟的持續發展及技術的不斷更新,檔案數據庫在此浪潮中已被認定為檔案信息資源共享、管理與組織的最優方案與方法,管理檔案數據庫需要有一個系統化平臺與有效工具,而構建一個統一化的檔案數據存儲管理平臺,則恰好能滿足此需求。至此,本文對此平臺的構建內容、所面臨問題及主要功能進行適當性論述,探討統一數據管理平臺內在特性及所持有優勢,以期為相關應用研究提供理論參考。
檔案數據存儲;安全管理;構建
伴隨當今社會信息化程度的日漸加深與彼此融合,社會各級別檔案館也正在趨向于海量化、系統化的檔案信息存儲中心。建設安全可靠而又實用的數字化檔案信息存儲管理平臺,已然成為當前檔案館需要積極落實的關鍵內容。當前,對于日漸規模化、數字化的檔案信息存儲體系而言,其主要包含四方面內容,即歸檔、備份、容災與存儲。
1.1 存儲
存儲架構有3種類型劃分,即網絡區域存儲(SAN)、網絡附加存儲(NAS)及直連存儲(DAS)。在檔案系統運用時,選用SAN或者NAS架構,最具合理性:NAS結構,其將文件系統作為其內在基礎,所以在檔案文件存放當中運用NAS架構,能夠高效化且相對經濟性的落實檔案的電子化;而SAN結構,其主要是將數據塊作為其基礎,所以其對于檔案數據庫的構建,更加具有適用性,能夠以更高的速度與效率,查詢與管理檔案數據。另外,存儲產品可靠性,比如存儲構造是否合理及存儲控制器有無冗余狀況等。對于一個較為可靠的存儲系統來講,需要同時設置2個甚至更多的高性能控制器,以此為核心控制的安全性與可靠性提供充足保障;還需具有N+1設備冗余,如通道卡、風扇及電源等;對于存儲構造,需要選用點對點模式或者是交換模式,以此來獲取更加的數據傳輸性能;對自身數據存儲進行安全保護,需考慮遠程數據的復制支持、故障監測、硬盤raid級別及數據快照支持等。
1.2 容災
容災實際就是為應對可能出現的災難,實現準備好的各項預防應急措施。在遠程容災系統方案實際規劃過程中,需要結合相關要求,就方案各項細致化內容及所需達成目標予以明確。由于災難在恢復目標方面存有差異,因此,可運用與災難類型相適應的恢復技術,至此,無論是在運行成本上,還是在投資規模方面,均會存有差別。依據信息中心實況,檔案館在容災系統方案實際選擇時,需酌情考慮如下內容:(1)目標1:應對災難的實際種類。計算機所在環境及系統內當中所存在的各種潛藏性因素,可能會導致數據大范圍丟失。相關數據統計顯示,在導致數據丟失的各類型事件當中,網絡故障及軟硬件所占比例達11%,而電源故障及斷電所占比例為50%,雷電、爆炸、火災、地震等為18%,人為占17%,其它4%。為了能夠采取有效措施,對各種突發災難予以應對,對于主中心的選址而言,其與災備中心的選址存在差突出不同。比如針對地震災害,為施加應對,災備中心與主中心需要選址于不同城市,不可同城;為了應對長時間停電,在災備中心與主中心的選址上,需選擇不同的電廠覆蓋區域。只需將災害類型予以明確,方能更加合理、高效的選出災備中心與主中心的適宜位置。(2)目標-2:恢復時間目標。所謂恢復時間目標實際就是當發生災難之后,業務能夠接受或者最大忍耐的停頓時間,還可理解為:當災難出現后,業務在運行恢復方面所需時間,通常情況下,當具有越短的恢復時間時,則會具有相對較高的災難恢復方案的成本,但由此而導致的業務損失量也就隨之而變小;相反,當具有越長的恢復時間時,則會具有越低的災難恢復方案成本,但會具有越大的業務損失。其中最為恰當而又合宜的恢復時間,需為方案成本曲線,與業務影響曲線相交點,即對應的時間。若短于最佳,則會導致較大的投資浪費;若長于最佳恢復時間的目標,當發生災難之后,所產生的損失會超過方案投資成本,因此,具有較大的災難損失風險。(3)目標-3:恢復數據目標。所謂恢復數據目標,實際就是發生災難之后,業務可接受的數據丟失量,還可理解為有災難所導致的最大數據丟失量。通常情況下,當恢復數據目標越高,則具有越高的方案成本,但會具有越小的因災難所致業務損失;相反,當具有越低的恢復數據目標,則會具有越低的方案成本,但由災難所導致的業務 也會隨之而增大。
1.3 備份
備份乃是為數據安全最后屏障,不管是容災,還是還是后續的存儲環節,均為在線儲存。針對以備份方式而存在的數據,除了可在線存放外,還可利用硬盤等分方式而實現離線保存,對于那些在線保存的數據而言,可實現快速恢復。而對于那些離線保存下來的數據而言,則相比于其它數據,具有更加安全的存放環境。當一個嚴重性災難發生,導致容災系統當中的數據不可用,或者是本地系統當中的數據不可用時,利用備份,便可最大程度的恢復可用數據。便能最大程度、最大限量的實現損失量的減少。如果數據丟失因素乃因人為,則可利用磁盤等介質,以在線的方式,進行數據備份,便可以較快的方式。所以在條件許可狀況下,可選擇磁帶備份與磁盤備份相結合的方式,以此為數據安全提供保障。當前所開發出的各種類型的備份軟件,能夠為災難時數據提供可靠備份,還能運用各種介質,恢復所丟失的數據,進而以較快速度、較短的時間,實現業務系統的恢復。
1.4 歸檔
備份就是為了恢復,以此在出現以往故障時,能夠確保業務持續與連貫。尤其是在線備份,在速度方面通常會有比其它內容更高的要求,但在容量方面,卻要求較低。實施歸檔的最終目的而言,其與備份相比,存有較大差別,由于檔案館內數據龐大,且其中多數今后較少用到,但這些數據還需要認真保存,以備用時能夠及時查詢到。實際上,進行歸檔,就是保障數據始終保持完整性。在歸檔系統選擇時,可遵循如下原則。(1)需長久保留數據。不管是備份還是歸檔,均需要切實有效的保證數據的完整性,需在制定時間內,使數據能夠安全的得以儲存。(2)數據需便于讀取。盡管諸多數據日后所用范圍不大,但歸檔系統仍然是一個大倉庫,需要確保在實際使用時,能夠便于讀取,此乃歸檔系統的基礎原則。(3)法規運用。當前對于國內而言,在此方面的法規,仍然處于不斷完善階段,而在國外,已經頒布實施了薩班斯-奧克斯萊法案及SEC法案等,并明確了電子記錄的可存取性、保密性與完整性。(4)數據具有可擴展性。數據始終處于不斷擴展之中,對于歸檔系統,需時刻提升自身所持有的可擴展性,滿足今后需求。
當前,各級檔案館均在大力度建設數字化檔案信息存儲系統,構建包含有諸多功能的儲存系統,如歸檔、備份、容災及存儲等。但因各廠家所生產出的產品缺乏兼容性,不能有效管理數據的有效性與完整性。數據管理人員未能深入了解所儲存數字檔案信息的重要性,通常是只知道有此數據,而卻不知道其準確位置。對于數據是否為有效儲存不太了解,難以結合各儲存系統實際運行情況,及時制定并提出切實有效的數據遷移計劃。為了將數據備份工作盡量做好,當前,許多檔案館選用了各種備份模式,如局部集中備份等,造成在運用數據備份方面,一些系統存在不充分狀況,完成備份的時間也相對較長,難以系統化、全面性保存數據。這些問題的實際存在,往往會促使數據保護風險的增加,管理成本也會保持高位。數字化檔案信息,需將其所保管信息資源的價值最大化挖掘出來。而為實現此功能,網絡、服務器及存儲設備為其提供了基礎結構與工具,但要想構建一個完備的數字化檔案信息的存儲中心,需在適當的地點及適當的時間,提供真實所需的信息能力上。要想實現此目標,需做到各環節的有機整合,構建統一化、完善的檔案存儲管理平臺。
對于檔案管理平臺,其由多模塊構成,如資源管理及恢復等,運用相同源代碼緊密融合在一起。此些功能功能強大,在起初的軟件架構設計階段,便立足于此些功能模塊能夠對相同的服務功能實現共享,還可利用單一的控制臺,對全部數據管理功能,可靠、簡單而又迅速的執行,能夠以一種較為有效的方式,幫助客戶將基礎架構階段所存在的成本問題予以消除,還可實現數據管理效率的大幅提升。針對統一數據管理平臺而言,需選用一個統一視圖,以此來提供如下功能:(1)數據恢復與備份。不僅能夠對郵件系統及數據庫實施備份,而且還能對文件系統及種操作系統進行備份。備份時,可結合實際,自動完成此操作。(2)快照恢復與管理。可運用軟硬件引擎,基于存儲設備,建立存在時間點的各類恢復卷,在較短時間內,便可實現硬軟件的快速恢復,以此為業務的連續性提供保證。(3)復制遠程連續數據。可運用有限寬帶,來運用軟件數據,并對文件進行復制,建立恢復點,保證數據一致性。可運用此功能,把原來儲存在中心處的各種數據,以復制的方式向異地復制,實現容災;另外,還可將各個地方數據,向中心區域復制,實施集中保護。(4)服務管理和報告。運用此工具軟件,管理者能夠以一種較為輕松的方式管理存儲資源,并對數據管理的全部操作進行跟蹤,提供對應報告,保證服務質量。
總而言之,構建統一檔案數據存儲管理平臺,乃是有效管理檔案的重要內容,同時也是隨著當前檔案管理工作發展的實際需求。至此,通過運用此平臺,保證檔案資源的可靠性與完整性,為社會提供更為豐富、全面的檔案信息資源,推動資源的融合與共享。
[1]孫志強,高旭,官澤.健康檔案管理模型構建與系統開發[J].軟件工程師,2013.
[2]王振興,楊敏華,吳勰等.檔案掃描入庫管理系統設計與實現[J].測繪科學,2008.
[3]王玉涵,黃茂海,劉飛飛.SVOM數據檔案庫軟件原型系統的設計與實現[J].天文研究與技術,2015.
[4]胡銳.基于Hadoop的高校檔案管理存儲系統研究[J].無線互聯科技,2016.
[5]朱曉鐘,李鑫.能源行業檔案管理系統存儲架構設計分析[J].信息系統工程,2012.
本文為承德市科學技術研究與發展計劃項目“京津冀一體化環境下基于‘互聯網+’的檔案管理數據庫平臺建設與服務研究”(編號:201606A133)的研究成果之一。