摘 要: 高性能計算和數(shù)據(jù)中心存儲規(guī)模的飛速增長造成對存儲系統(tǒng)的容量和性能的巨大需求。磁盤陣列是目前應用最廣泛的存儲系統(tǒng),是構成最大規(guī)模存儲系統(tǒng)的基礎設備。磁盤陣列采用多磁盤并行的方式擴展了存儲系統(tǒng)容量,提高了存儲系統(tǒng)性能,用冗余技術提高了存儲系統(tǒng)高可用性。通過對磁盤陣列預警技術中傳感技術、S.M.A.R.T技術及磁盤增長缺陷表的研究和分析,使用戶能及時發(fā)現(xiàn)系統(tǒng)中可能存在的隱患,及時發(fā)現(xiàn)預警信息,及時進行相關保護,大幅降低了數(shù)據(jù)丟失的風險,提高了磁盤陣列存儲系統(tǒng)的可靠性和可用性。
關鍵詞: 磁盤陣列; 數(shù)據(jù)安全; 預警技術; 研究
中圖分類號:TP399 文獻標志碼:A 文章編號:1006-8228(2013)10-04-02
0 引言
隨著信息技術的快速發(fā)展,大量的數(shù)據(jù)通過計算機系統(tǒng)來存儲,形成了數(shù)據(jù)在IT環(huán)境中的高度集中存儲。由于需要處理的數(shù)據(jù)量不斷增加,導致對存儲系統(tǒng)的容量和性能的巨大需求。單位面積下可以存儲更多的文件、視頻、影視、圖片及聲音等數(shù)據(jù),在很大程度上提高了信息和數(shù)據(jù)管理的自動化,提高了效率、降低了成本,但同時數(shù)據(jù)安全的風險性也在不斷增強。由于設備故障、操作失誤、環(huán)境變化、病毒感染、人為破壞、自然災難等所造成的數(shù)據(jù)丟失可能會導致巨大的損失。越來越多的企業(yè)認識到存儲設備安全的重要性,因而也越來越重視存儲設備安全以及數(shù)據(jù)保護。
1 目前應用需求現(xiàn)狀分析
目前采用得較多的存儲設備是磁盤陣列,它能提升存儲設備性能、擴充存儲容量、提高存儲可靠性。磁盤陣列采用冗余技術提高存儲系統(tǒng)可靠性,當磁盤產(chǎn)生故障時,系統(tǒng)進入降級狀態(tài)。傳統(tǒng)的數(shù)據(jù)保護方法多是通過采用冗余技術以及各種數(shù)據(jù)備份來保證數(shù)據(jù)的可用性及可靠性,是在系統(tǒng)故障已經(jīng)發(fā)生時進行數(shù)據(jù)的重建或者數(shù)據(jù)的恢復,備用磁盤需要反復執(zhí)行輸入/輸出存取動作,從而導致系統(tǒng)性能降低和I/O資源浪費,并且由于其故障維護窗口容量較小,極易造成二次數(shù)據(jù)流失,也可能造成數(shù)據(jù)業(yè)務的中斷。根據(jù)實際應用經(jīng)驗,使用時間相當、同批次磁盤中某一個磁盤一旦出現(xiàn)故障,其他磁盤也可能即將出現(xiàn)故障,極有可能由于其他成員盤再次產(chǎn)生故障而導致重建失敗、陣列數(shù)據(jù)損毀的事故,因此,數(shù)據(jù)重建過程相對來說是比較危險的操作。如果能夠事前根據(jù)存儲設備的運行狀態(tài)有效地預測系統(tǒng)的故障發(fā)生概率,在磁盤產(chǎn)生故障之前進行安全預警并采取相關的數(shù)據(jù)保護措施,不僅可以降低不必要的長期備份開銷,縮小備份窗口,而且可以極大地減少數(shù)據(jù)丟失的風險。因此及時對磁盤陣列的運行情況進行預警,根據(jù)其運行、性能和健康狀況,在系統(tǒng)即將產(chǎn)生故障之前進行數(shù)據(jù)保護、防患于未然是十分重要的。將安全預警技術引入存儲系統(tǒng)中。能保證數(shù)據(jù)不丟失、系統(tǒng)盡快恢復運行。存儲設備安全預警能夠為數(shù)據(jù)存儲提供最為基礎的可用性保證,對提高存儲系統(tǒng)可靠性和可維護性提供保障,最終保護存儲系統(tǒng)數(shù)據(jù)安全[1]。
2 安全預警技術研究現(xiàn)狀
對安全預警技術的研究是當前國內外比較重要的研究內容之一,這些研究有利于及時發(fā)現(xiàn)系統(tǒng)中可能存在的隱患,使用戶及時發(fā)現(xiàn)預警信息,便于用戶及時進行相關保護,避免不必要損失。當前安全預警技術研究方向可以分為以下兩種。
⑴ 按磁盤檢測技術來分,有各種傳感技術、S.M.A.R.T技術、磁盤增長缺陷表等。
⑵ 按預警的用途來分,有用于交換機、遠程預警監(jiān)控等網(wǎng)絡的,用于流媒體、網(wǎng)絡電視等存儲技術領域的,用于電腦裝置、磁盤、磁盤陣列等存儲設備[2]。
3 安全預警技術研究內容
3.1 傳感技術
傳感技術是從各種設備獲取信息,并進行處理和識別的技術。可以利用感測傳感技術感知硬盤受到外部作用力而跌落或碰撞的異常震動進行預警,可以利用溫度傳感技術感知硬盤工作環(huán)境溫度變化進行預警,可以利用生物傳感技術對硬盤及數(shù)據(jù)進行保護。利用各種傳感技術可以對磁盤的物理故障進行提前預警,從而保護磁盤及存儲的數(shù)據(jù)。
預測傳感器技術是如何在硬盤裝置中預警保護的?預測傳感器由感測單元、信號處理與控制電路及預警電路組成。感測單元采用加速度感測芯片在極短時間內感知加速度并及時通知硬盤將磁頭移到停靠區(qū),該感測傳感技術感測硬盤受到外部的作用力而產(chǎn)生運動時的加速度,并以模擬信號的形式輸出感測信號到信號處理與控制電路。信號處理與控制電路可以將模擬信號轉換成數(shù)字信號并輸出到單穩(wěn)態(tài)電路,輸出觸發(fā)信號。若硬盤裝置發(fā)生異常,則輸出控制信號至硬盤以停止讀/寫操作。硬盤自帶電路發(fā)出停止數(shù)據(jù)讀/寫指令,從而使得硬盤的磁頭拉離盤片表面,回歸初始位置并停止讀/寫,避免磁頭撞擊盤片造成硬盤損壞而導致數(shù)據(jù)丟失。硬盤受到外部作用力而跌落,處于自由運動狀態(tài)時,或者因碰撞而處于非自由落體的異常震動狀態(tài)時,預警電路接收信號處理與控制電路輸出的控制信號并發(fā)出預警信息。可以對預警電路的預警級別進行區(qū)別,即在非正常操作時,如偶然碰撞但未使硬盤跌落或翻轉,硬盤可發(fā)出輕度預警提示,可以不停止硬盤的讀寫/操作;而當硬盤受到外部猛烈的撞擊,會進一步損壞硬盤時,則啟動嚴重預警信息,并同時啟動控制電路以停止硬盤工作[3]。
3.2 S.M.A.R.T技術
S.M.A.R.T技術(Self-Monitoring Analysis and Reporting Technology),即自我監(jiān)測、分析及報告技術。支持S.M.A.R.T技術的硬盤可以通過硬盤上的監(jiān)測指令和主機上的監(jiān)測軟件對磁頭、盤片、電動機、電路的運行情況、歷史記錄及預設的安全值進行分析比較。當出現(xiàn)安全值范圍以外的情況時,就會自動向用戶發(fā)出警告[4]。
S.M.A.R.T技術可以在安全預警中建立穩(wěn)定的存儲機制。一般計算機設備包含磁盤和磁盤冗余控制單元,用具有S.M.A.R.T技術的磁盤監(jiān)測工具監(jiān)測磁盤的工作情況。當磁盤監(jiān)測工具檢測到磁盤工作信息出現(xiàn)異常情況時,觸發(fā)磁盤冗余陣列控制單元運行,并將磁盤陣列中可能發(fā)生損壞的磁盤所存放的數(shù)據(jù)映射到動態(tài)備份磁盤,當磁盤完成映射式磁盤冗余陣列數(shù)據(jù)備份后接管可能有故障磁盤的工作,保護寫入磁盤和磁盤存放的數(shù)據(jù)不受損毀[5]。
3.3 磁盤增長缺陷表
在硬盤驅動器中,使用增長的缺陷列表(G-list)作為使用過程中用戶數(shù)據(jù)區(qū)的缺陷調整。具體策略是:用保留區(qū)的扇區(qū)來替代缺陷扇區(qū)。
在具有磁盤增長的缺陷列表磁盤陣列預警系統(tǒng)中,磁盤陣列卡和多個硬盤等必備的存儲設備還包括能夠收集、保存、分析磁盤增長缺陷數(shù)據(jù)的監(jiān)測單元,并且連接在磁盤陣列卡與硬盤接口之間的總線上,根據(jù)分析結果給出預警信息。監(jiān)測單元的數(shù)據(jù)采集單元用于采集磁盤陣列預警數(shù)據(jù),并將采集的數(shù)據(jù)存儲到數(shù)據(jù)存儲單元中。磁盤陣列硬盤的增長缺陷數(shù)據(jù)以日志文件的格式進行存儲。需要對這些存儲的磁盤陣列預警數(shù)據(jù)進行比較分析,以便發(fā)現(xiàn)磁盤陣列預警數(shù)據(jù)中潛在的故障,并在磁盤陣列預警數(shù)據(jù)達到預警水平中的一個或多個時,發(fā)出預警信息提示用戶。當其中一塊磁盤的增長缺陷表數(shù)量達到設定的范圍或在一個時間段內,增長缺陷表數(shù)量增長數(shù)達到設定的范圍。報警單元在接收到預警信息后,向計算機發(fā)出報警信息,告知用戶[6]。
4 結束語
由于磁盤陣列具有容量大、數(shù)據(jù)存取速度快、安全性高等特點,磁盤陣列技術得到了廣泛的運用。磁盤陣列預警技術有利于及時發(fā)現(xiàn)存儲系統(tǒng)中可能出現(xiàn)的故障及隱患,提前獲得故障預警信息并及時修復,便于用戶及時進行相關的數(shù)據(jù)信息保護,保護用戶的數(shù)據(jù)安全,避免數(shù)據(jù)損毀,提高磁盤陣列的健壯性。
今后隨著安全預警技術的發(fā)展,應從全局的角度提出一種對磁盤內盤片、磁盤陣列內的磁盤、磁盤陣列間的磁盤進行全面檢測的技術。充分利用多種磁盤檢測技術,在存儲系統(tǒng)中建立故障信息收集模塊,從而獲取故障預警信息,并進行相關的數(shù)據(jù)信息保護,有效縮短存儲系統(tǒng)故障維護時間,提前預警、及時修復、提高存儲系統(tǒng)可靠性、增強存儲系統(tǒng)的安全性。
參考文獻:
[1] 曹強,黃建忠,萬繼光,謝長生.海量萬絡存儲系統(tǒng)遠離與設計[M].華中科技大學出版社,2010.
[2] 許靜.多級存儲技術及光盤庫在實際工程中的應用探討[J].智能建筑電氣技術,2011.3.
[3] 劉軍平.磁盤存儲系統(tǒng)可靠性技術研究[D].華中科技大學,2011.
[4] 胡維.基于智能預警和自修復的高可靠磁盤陣列關鍵技術研究[D].國防科學技術大學,2010.
[5] 黃迅,劉晨.一種計算機RAID陣列預警系統(tǒng)及方法:China,CN200610094289.3.[P],2006.
[6] David P Helmbold,E Long D D,Sherrod B.A dynamic disk spindown technique for mobile computing[J].Computing and Networking,1996:130-142