張天宇 李娟 劉靖宇
新型存儲介質在RAID中的應用與研究
張天宇 李娟 劉靖宇
河北工業大學計算機科學與軟件學院,天津 300401
隨著半導體技術的迅速發展,新型非易失存儲器件由于具有非易失、低延遲、低能耗以及抗震等優良特性,得到了廣泛關注,也為存儲系統的研究提供了新思路與挑戰。針對應用日益廣泛的視頻監控、連續數據保護、備份、歸檔等這類連續存儲系統的特點,將新型存儲介質作為緩存引入系統,可以極大地提高系統的性能, 具有非常好的研究價值。
RAID;NVM;SSD;緩存技術
獨立磁盤冗余陣列(Redundant Array of Independent Disks, RAID)[1]技術是把相同的數據存儲在多個硬盤的不同地方的方法,自從1987年提出以來就受到了廣泛關注與研究。RAID技術是將多塊相同的磁盤通過RAID控制器連接起來形成一個統一的存儲設備來進行數據存儲。不僅擴大了系統的存儲容量,而且大大提高了數據的讀寫速度。更為重要的是RAID技術還提供數據容錯技術,保證了系統數據的安全性。根據選擇的版本不同,RAID比單盤有以下一個或多個方面的益處:增強數據整合度,增強容錯功能,增加吞吐量或容量。另外,磁盤組對于計算機來說,看起來就像一個單獨的磁盤或邏輯存儲單元。目前其技術已經很成熟并廣泛應用于大規模的存儲系統中。
大規模存儲系統通常采用普通機械磁盤作為存儲介質,其磁盤數據的存取與普通單個磁盤的存儲操作相同,仍然受到緩慢機械運動的限制。這就限制了由多個單盤組成的磁盤陣列性能的進一步提高,使其存取時間仍停留在毫秒級,其吞吐率及帶寬已經成為大規模存儲系統的性能瓶頸。
近年來以新型非易失性存儲器(Non-Volatile Memory,NVM)[2]為代表的新型存儲介質的飛速發展為突破存儲系統IO瓶頸提供了新的思路與挑戰。
很多存儲系統的寫操作程序中,內存作為控制器和硬盤之間的重要橋梁,提供更快速的性能,但是如果發生突然間斷電的情況,如何保護內存中的數據不丟失,這是存儲系統中老生常談的議題。近年半導體技術迅猛發展,相繼出現了閃存(Flash)、相變存儲器(PCM)、鐵電隨機存儲器(FRAM)、磁阻隨機存儲器(MRAM)、憶阻器(RRAM)等新型非易失存儲介質和技術。這些存儲介質沒有機械裝置,在斷電后數據不丟失,具有非易失、低延遲、抗震動、低能耗等特點,在很大程度上可以改善了單個硬盤的I/O性能。
從性能指標上來看,NVM比較接近DDR內存的性能,且具有非易失按字節存取、存儲密度高、低能耗等特征,在新的存儲系統中可能逐漸成為主要的存儲設備,而DDR內存則作為臨時數據的緩存使用與傳統的單數據速率相比,DDR技術實現了一個時鐘周期內進行兩次讀/寫操作,即在時鐘的上升沿和下降沿分別執行一次讀/寫操作。當前閃存技術發展得最成熟,讀寫性能上也達到了較高水平,既可以作為磁盤與系統內存之間的數據緩存,又可以替代硬盤作為持久性存儲設備。
固態盤(Solid State Disk,SSD)[3]就是一種基于閃存的新型可讀寫和擦除的非易失性半導體存儲器,用固態電子存儲芯片陣列而制成的硬盤,由控制單元和存儲單元(FLASH芯片、DRAM芯片)組成。固態硬盤(SSD)是以Flash代替了傳統的硬盤盤做為存儲介質,使用SATA 系列接口的新型存儲設備SSD的出現解決了計算機中存儲系統的瓶頸問題,顯著提高了計算機性能,降低了功耗。
SSD采用電子存儲介質進行存儲,通過改變存儲芯片內介質的狀態來存儲數據,擺脫了磁盤機械特性的限制,免去了數據查找時間和尋道時間。隨機訪問性能比傳統硬盤高一兩個數量級,能夠對小粒度、隨機I/O訪問提供較好的支持。
SSD采用閃存作為存儲介質,讀取速度相對機械硬盤更快。固態硬盤不用磁頭,尋道時間幾乎為0。持續寫入的速度非常驚人。在存儲系統中應用SSD存儲技術可以極大地提高系統的讀寫能力,RAID系統中應用SSD一般有兩種情況。一是直接用SSD替換磁盤用于存儲數據,但SSD本身的容量和價格問題致使不能大范圍使用。二是將SSD用作系統緩存,雖然發揮了其讀速度的優勢,但頻繁的計算校驗信息也嚴重制約了寫速度的優勢。
固態硬盤都使用相同的LPM(Link Power Management)節能特性。LPM節能特性包括三種基本狀態:Active(活動)、Partial(輕度睡眠)和Slumber(深度睡眠)。LPM節能特性的實現有兩種發起方式。由主機端(電腦南橋)發起的被稱之為HIPM(Host-Initiated LPM);而直接由硬盤發起的則叫做DIPM(Device-Initiated LPM)。LPM節能需要主機端電腦和設備端硬盤的共同支持,此外還需要操作系統及磁盤控制器驅動的協同工作。LPM節能的運作在外部是無法觀察到的。SSD不僅為存儲系統帶來了極大的性能提升,而且節能效果也特別顯著,與其相關的研究也很廣泛,例如基于SSD的緩存技術、磨損均衡、數據遷移以及垃圾回收機制等提出的優化策略。隨著SSD應用技術日趨成熟,與HDD組成的混合存儲方案因其充分考慮了存儲容量和性能,所以逐漸成為研究熱點。
將SSD作為緩存引入存儲系統。首先,SSD作為緩存可以擴展主緩存容量。使容量可達到TB級,比現有存儲系統的可用緩存要大得多,因而能夠存儲更多的數據。其次,SSD的寫入速度比機械磁盤快一個數量級,對于映射到SSD中數據的操作,將以更短的響應時間和更高的IOPS進行操作。最后,緩存可以減少磁盤的讀I/O并放緩寫操作,因而磁盤可以有足夠的空閑時間來降低盤片旋轉速度甚至是完全停轉減少能耗。
連續數據存儲系統具有特定的數據訪問模式和存儲特性。如I/O負載以順序訪問為主,只有少量隨機訪問;對數據的可靠性、存儲空間的要求較高;以寫操作為主,讀操作通常回放寫操作等。
針對這類存儲系統,將SSD作為二級緩存引入系統中,二級緩存是指利用SSD的快速讀能力,將系統、游戲常用數據置于SSD內,從而滿足客戶機的快速讀取需求。利用良好的寫性能將數據寫入SSD中,SSD中的數據也方便系統快速讀取,待達到系統設定條件再將SSD中數據寫回到逐一寫入RAID的磁盤陣列中,在提高系統寫性能同時也通過磁盤待機方式減少了系統能耗開銷。同時也可以改善校驗信息的計算方式來減輕頻繁小寫給系統帶來的寫懲罰,進一步提高系統性能。但在研究過程中也要充分考慮到NVM其壽命受到擦寫次數以及失效率的限制。
視頻監控、連續數據保護、備份、歸檔等這類連續存儲系統應用日益廣泛。針對連續存儲系統的特點,將NVM作為緩存引入系統可以極大地提高系統的性能,具有非常好的研究價值。
[1]Chen P M, Lee E K, Gibson G A, et al. RAID: high-performance, reliable secondary storage[J]. ACM Computing Surveys, 1994, 26(2):145-185.
[2]張鴻斌,范建,舒繼武,等.基于相變存儲器的存儲系統與技術綜述[J].計算機研究與發展,2014, 51(8):1647-1662.
[3]詹玲,門勇,湯陳蕾,等. SHCA:基于RAID的兩級緩存算法設計與實現[J].小型微型計算機系統,2017, 38(5):1152-1157.
The Application and Research of New Storage Medium in RAID
Zhang Tianyu Li Juan Liu Jingyu
School of Computer Science and Engineering, Hebei University of Technology, Tianjin 300401
With the rapid development of semiconductor technology, the Non-Volatile Memory that have the metrics of non-volatility, low latency, low power consumption and shock resistance, are attracting wide attention, and also provides a new way to the research of storage system and challenges. Based on the chara cteristics of continuous storage system such as video monitoring, continuous data protection, backup and archiving, and so on, using the Non-Volatile Memory as cache can greatly improve the performance of the system and has great research value.
RAID; NVM; SSD; cache technique
TP333.4
A