關兆雄 林鈺杰


摘要:
在現代網絡環境普及的前提下,許多領域都采用數據化運作方式,這種方式能夠有效的突破傳統模式的局限性,規避一系列傳統問題,所以在數據成為了現代社會運作的主要形式。但網絡環境存在威脅數據的因素,例如病毒、惡意破壞或者設備失效等,都會直接導致數據無法應用。而通過連續數據保護恢復算法RMCBDD,能夠有效地將被破壞的數據恢復,此算法即使在數據存在差異的前提下依然可以應用,在應用方面RMCBDD可以對起止時刻的數據差異進行分析,進而消除兩者的差異來進行恢復,所以該算法的應用面積十分廣泛,例如在多間隙復雜環境,在此環境當中算法顯然要高于傳統數據恢復算法、WDRS算法等,主要優勢體現于效率等方面。
關鍵詞:
連續數據保護; 數據恢復; 算法
中圖分類號: TP393
文獻標志碼: A
Analysis and Application of Continuous Data Protection Recovery Algorithm under Data Difference
GUAN Zhaoxiong, LIN Yujie
(Foshan Power Supply Bureau, Guangdong Power Grid Co. Ltd., Foshan, Guangdong 528000, China)
Abstract:
Under the premise of the popularization of modern network environment, many fields have formed a databased operation mode. This method can effectively break through the limitations of traditional models and avoid a series of problems in the traditional environment, so modern data technique has become the main form of social operation. However, there are factors in the network environment that threaten data, such as viruses, malicious damage, or device failures, they directly cause data to be unapplied. The continuous data protection recovery algorithm RMCBDD can effectively recover the corrupted data. This algorithm can be applied even if the data are different. In the application aspect, RMCBDD can analyze the data difference between the start and end time. Then, the difference between the two sets is eliminated to recover, so the application area of the algorithm is very wide, for example, in a multigap complex environment, ?the algorithm is obviously higher effects than the traditional data recovery algorithm, WDRS algorithm, etc. The main advantage is reflected in the efficiency.
Key words:
continuous data protection; data recovery; algorithms
0引言
信息網絡技術是現代社會發展的核心技術,能夠應用于社會運作的各個層面,而此類技術的運作基礎在于數據,所以如果數據出現問題,則會導致技術系統出現問題,不利于應用領域的運作,因此對信息網絡技術中的數據進行保護,具有較為重大的意義。針對現代網絡環境進行分析,其中存在著許多對數據存在威脅的因素,例如病毒、硬件損壞風險等,當數據受到此類風險的破壞之后,數據將難以應用,所以如何規避此類風險、恢復被破壞的數據,是當前相關領域所研究的重點問題。
1連續數據保護恢復算法概述
當數據被破壞之后,為了維持數據應用,采用連續數據保護恢復算法,能夠有效的將被破壞的數據恢復,達到維持應用的目的。此算法在應用當中,能夠在不干涉正常的數據業務前提下,對范圍內所有的數據進行實時跟蹤,并持續保持對數據更新的記錄,此時自動形成了數據的完整備份,當數據出現破壞現象時,通過此記錄備份,即可實現數據的恢復[12]。在傳統的連續數據保護恢復算法之下,其恢復的機制在于時間順序機制,即對數據更新的時間進行計算,從而當發現某時間節點下存在數據的空白,則認定此部分數據出現了破壞,再利用備份數據當中對應時間節點的數據進行回復,這樣的運作方式能夠最大限度的保護數據完整性,具有數據丟失小的優點,但缺點在于需要對整體數據的時間節點進行核對,在效率上相對較低[34]。
而隨著信息數據應用的深入,數據的結構也出現了許多變化,例如多間隙復雜環境,此類數據環境當中,數據并不是連續更新的,數據與數據之間可能存在著較長的時間間隔,所以在傳統連續數據保護恢復算法的應用下,容易出現效率低下的問題,為了對此進行改善,相關領域通過研究提出了一種RMCDD的連續數據保護恢復算法,此算法雖然同樣采用時間節點機制,但在應用效率方面則遠超于傳統算法,因此其在現代數據保護回復當中具有較高的應用價值[56]。
2模型構建
為了對RMCDD連續數據保護恢復算法的應用進行分析,本文將構建基本模型,并對模型進行定義,以此在之后研究中將該算法納入模型當中,驗證算法的應用及有效性。
2.1模型定義
在理論角度上,當大小相同的獨立數據模塊形成數據集成之后,其每個獨立數據的定性數據的大小也相同,并且定性數據只能被邏輯塊地址所識別,在此基礎上,本文假設A為數據塊儲存中所有數據的邏輯塊地址,D為表示數據塊中所有可能的數據的集合,即可得出下文中的2個定義。
定義1。假設A、D集合的二元關系為St,St由二元序偶集合而成,其中t代表確認的時間節點,此時A作為邏輯塊地址,能夠對D進行識別,因此在二元關系上為函數,其定義上代表了t時間節點在數據儲存當中的鏡像,并Sta為a在對數據塊進行標識時t的數據鏡像[78]。
定義2。寫請求集合R為形式(t,a,d)的三元序偶集成,代表了某個時間節點內,邏輯塊地址a和時間戳表示數據的更新集合,因此R(t1,t2)則表示了時間節點與時間節點之間的距離,即時間區間t1,t2當中數據儲存系統所存在的所有寫請求集合[910]。
2.2臨近算法的形式化分析及證明
在應用連續數據保護恢復算法進行數據恢復時,一般情況下需要反復多次的對數據備份進行完整性檢查,以此對照原有數據基礎即可得出被破壞的數據時間節點[1112]。由此可見,在每次進行數據恢復時,連續數據保護恢復算法都需要對備份以及原有數據整體進行依次檢測,從而其需要的時間十分漫長,因此首先說明其計算的效率較穩低下,而在結果方面來看,在通過長時間的檢測之后,因為原有數據與數據備份的時間節點十分相似,所以兩者的數據差異并不大,而這樣就說明在傳統連續數據保護恢復算法當中,時常會對數據相同的時間節點進行檢測,這也就是其效率低下的原因,而通過對差異數據進行分析及處理,則可以有效改善傳統的缺陷,提高整體運作的效率[1314]。
在數據差異之下,連續數據保護恢復算法能夠有效的對數據鏡像進行調控,并在此基礎上實現對恢復時間節點的檢測,確認恢復指令的有效執行時間節點,結合信息判斷檢測進行綜合性控制管理[1516],算法詳細路徑如圖1所示。
由圖1可見,在近算法的運作當中,能夠根據時間間隔對臨近信息進行有效控制,同時根據實際操作來提高算法在結構上的應用,以此消除時間節點之間的間隔。針對此項應用,下文將從兩個層面上對此進行分析。
1、在對多間隔環境進行處理之后,數據之間的間隔已經消除,此時對臨近時間上進行恢復,能夠針對無間隙后的臨近時間點進行恢復,恢復機制為T1到Ta的過度,之后將結
合數據當前的卷曲狀態,在相應時間節點上對數據進行分析,這一過程相較于傳統算法的過程要較為簡潔,說明此算法具有更高的效率性。
2、在無間隙的條件下進行數據恢復時,計算會受到時間使用規范的的影響,臨近時間恢復作用會得到相應的提升,同時依靠數據對比,可以對重復、完成的數據進行排出,之后結合鏡像備份來對數據進行恢復。這一過程主要可通過下列公式來表示:
通過上述分析可見,臨近算法有著比傳統效率更好的效率性,同時也具備消除時間間隙的能力,但在與RMCBDD算法相比之下,其依舊存在性能上的不足。
3RMCBDD算法
3.1數據記錄
在多間隙復雜情況下,通過RMCBDD算法的應用,能夠有效的在此情況下進行數據恢復。RMCBDD算法本身具備了恢復映射序列的能力,可以對連續數據保護系統啟動后的每一次恢復進行記錄。
假設在3間隙條件下應用RMCBDD算法進行數據恢復,那么其過程為首先從初始時間節點到最終節點質檢存在T1→T2,T3→T4,T5→T6間隙,然后在RMCBDD算法的應用下,對此3個間隙進行了3次恢復,恢復主要利用其中映射序列,記錄過程的初始時間節點,以此在每個間隙的初始時間節點上,均設置相同的時間節點,以此來消除數據質檢的差異性,最終執行所有恢復工作。
3.2插入快照
為了實現效率的提高,在RMCBDD算法當中插入快照,可以改變RMCBDD算法對歷史數據的查閱方式,即在查閱當中,RMCBDD算法會按照一定的時間間隔,進行查閱。快照的功能在于分割時間節點,其主要插入在RMCBDD算法的日志鏈條當中,以此來分割時間節點,同時能夠將起止時間節點與初始時間節點之間的共同經歷錄入在請求需求當中,有效提高計算的效率。
3.3數據備份
在RMCBDD算法當中,要實現數據恢復同樣需要對數據進行備份,并且需要具備相應的數據恢復能力,為了詳細對RMCBDD算法進行了解,本文針對此進行了相應的分析。數據備份即是指在數據為損壞之前對數據進行復制、保存,此點與其他算法相同,可以通過相應的復制功能、傳輸功能來實現。在備份完成之后,即可以保障數據恢復的正確性,避免數據出錯。
4實驗分析
4.1實驗環境
為了解RMCBDD算法的恢復性能,本文將在相應的環境下應用此算法。本文將在Windows平臺之下,通過磁盤過濾驅動技術,構建了傳統算法、臨近算法以及RMCBDD算法,在分別運作之后,對相同的一組數據進行備份,最終刪除30組數據,在分別運作算法,查看其恢復的時間以及完整性。
4.2傳統算法實驗結果
運用傳統算法進行數據恢復,首先傳統算法對原始數據以及數據備份的查閱時間為19 min,對刪除數據數量的計算為5 min,對刪除數據的時間節點計算為10 min,總耗時34 min。其次,傳統算法在對刪除數據進行恢復時,總體耗時15 min,對恢復結果進行查看,恢復數據數量上無誤,但卻存在2組數據恢復錯誤,說明傳統算法存在一定的缺陷。
4.3臨近算法實驗結果
運用臨近算法進行數據恢復,首先臨近算法對原始數據以及數據備份的查閱時間為13 min,對刪除數據數量的計算為2 min,對刪除數據的時間節點計算為5 min,總耗時20 min,相較于傳統算法,臨近算法在效率上存在明顯的優勢。其次,臨近算法在對刪除數據進行恢復時,總體耗時8 min,對恢復結果進行查看,恢復數據數量上無誤,不存在數據恢復錯誤的現象,說明臨近算法較為完善,并優于傳統算法。
4.4RMCBDD算法實驗結果
運用RMCBDD算法進行數據恢復,首先RMCBDD算法對原始數據以及數據備份的查閱時間為7 min,對刪除數據數量的計算為2 min,對刪除數據的時間節點計算為2 min,總耗時10 min,相較于傳統算法,由此可見RMCBDD算法在效率上,要優于傳統算法以及臨近算法。其次,RMCBDD算法在對刪除數據進行恢復時,總體耗時5 min,對恢復結果進行查看,恢復數據數量上無誤,不存在數據恢復錯誤的現象,說明RMCBDD算法較為完善,并優于傳統算法。
4.5綜合分析
通過上述的分析可以了解到3項算法的實際應用效率以及性能,在相互對比之下,顯然RMCBDD算法的應用結果最佳,其在效率上要優于傳統算法與臨近算法,而在數據恢復的完整性方面,其與臨近算法結果一樣,但因為本文實驗條件有效,未能對大量數據進行研究,所以此研究結果存在可靠性不足的缺陷,需要在之后的研究當中進行完善。綜合而言,RMCBDD算法是當前數據恢復工作當中應用價值最高的算法。
5總結
在現代社會的發展下,許多領域都將數據信息儲存在網絡環境當中,而這樣的方式,會受到網絡環境當中風險因素的影響,容易造成數據被破壞的現象,因此本文為了保障數據的安全性、提高數據信息化運作的水平,對數據恢復算法數據差異下的連續數據保護恢復算法以及其應用進行了分析,分析首先針對傳統連續數據保護恢復算法進行了概述,之后構建了相應的模型來對臨近算法的性能進行了分析;對RMCDBB算法進行了分析,最終在構建模型的基礎上,借由Windows平臺構建了新的實驗環境,在此實驗環境下實際運行了3項算法,從而能通過對比得出性能最佳的算法,即RMCDBB算法。
參考文獻
[1]李艷平.WSN中一種基于壓縮感知的數據恢復算法[J].計算機工程,2014,40(6):2935.
[2]吳桂峰,王軒.基于二次規劃的無線傳感器網絡數據恢復算法[J].計算機應用,2013,33(4):935938.
[3]鮮江峰,徐善凱.基于神經網絡的WSN丟失數據恢復研究[J].物聯網技術,2017,7(2):4041.
[4]李亞萌,何涇沙.基于Hash的YAFFS2文件各版本恢復算法研究[J].信息網絡安全,2016(5):5157.
[5]劉向東,陳晨.計算機取證中數據恢復算法研究[J].軍民兩用技術與產品,2016(20):2133.
[6]張良德.LINUX系統下的計算機取證技術研究[J].內蒙古科技與經濟,2014(9):5556.
[7]趙靜.一種文件系統硬盤數據恢復技術研究[J].電子設計工程,2015,23(23):5153.
[8]顧廣宇,張淑娟,王雪飛,等.一種FAT32文件系統中文件恢復方法[J].網絡新媒體技術,2016,5(2):3641.
[9]劉俊.WINDOWS系統下基于底層數據分析的數據恢復研究[J].深圳信息職業技術學院學報,2015(3):2732.
[10]徐仙偉,楊雁瑩,曹霽.Windows系統中文件級數據恢復方法分析研究[J].皖西學院學報,2014,30(2):2427.
[11]王芳芳.基于糾刪碼的云存儲數據可靠性保障[J].軟件導刊,2015(4):137139.
[12]曹茂誠,王軍敬,何及夫.醫院容災備份系統的研究與實施[J].微型電腦應用,2015,31(2):1718.
[13]顧瑜,劉川意,鞠大鵬,等.基于云存儲的塊級連續數據保護系統[J].計算機科學與探索,2014,8(3):257265.
[14]吳昊,范九倫,劉建華,等.基于指紋魔方算法的云存儲數據保護機制[J].電信科學,2014,30(11):110115.
[15]閆明.一種新的云計算環境下數據安全保護算法研究[J].科技通報,2017,33(9):184187.
[16]劉旭春.數據差異下的連續數據保護恢復算法[J].電子商務,2016(4):5960.
(收稿日期: 2019.05.21)
作者簡介:關兆雄(1987),男,碩士,平臺管理員,研究方向:存儲和服務器虛擬化運維工作。
林鈺杰(1987),男,碩士,系統管理員,研究方向:系統開發和大數據研究工作。
文章編號:1007757X(2020)08014803