999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

分布式塊存儲系統中高效糾刪碼重構技術研究

2016-05-14 15:49:00陳付張淑萍
軟件導刊 2016年7期

陳付 張淑萍

摘要:當前的海量存儲壓力導致三副本存儲效率越來越難以滿足需求。糾刪碼可以提供和三副本存儲相同的可靠性,使用更少的存儲容量和網絡帶寬。提出一種針對分布式塊存儲訪問特點的糾刪碼故障處理方案——一種糾刪碼和熱備副本相結合的方法,解決臨時故障導致的退化讀和退化更新問題,同時精細地控制永久故障延遲重構的時間點,減輕重構操作造成的對網絡帶寬的壓力。實驗結果表明,相對于傳統糾刪碼,該方案可節省3倍帶寬流量,存儲成本只有三副本的50%。

關鍵詞關鍵詞:云存儲;分布式塊存儲;糾刪碼;重構效率

DOIDOI:10.11907/rjdk.161381

中圖分類號:TP301文獻標識碼:A文章編號文章編號:16727800(2016)007003303

0引言

云存儲可提供不同接口類型的存儲服務,如文件存儲、對象存儲和塊存儲。其中,塊存儲接口可以為云計算中的云主機提供云硬盤服務。在大規模數據存儲系統中,設備故障越來越頻繁,使人們對于確保數據可靠性的需求十分迫切。通常采用數據冗余容錯技術來保護數據,但隨著海量數據的存儲壓力與日俱增,分布式存儲系統中保障數據可靠性的三副本技術的存儲成本也越來越高[1]。現有分布式存儲系統如微軟WAS[2]、Facebook的F4[3]、HDFS等開始支持糾刪碼取代三副本技術,從而能夠在保持高可靠性的同時,減輕海量數據存儲壓力。糾刪碼的缺陷在于重構效率低下,因此分布式塊存儲由于其高I/O密集和低訪問延遲特性,必須要克服糾刪碼重構成本高的弊端。

1相關技術

1.1分布式塊存儲系統

塊存儲提供塊存儲設備接口,用戶需要把塊存儲卷附加到虛擬機上之后才可以與其交互。面對極具彈性的存儲需求和性能需求,單機或獨立的SAN越來越難以滿足企業需求。塊存儲在Scale-up的瓶頸下面臨著Scale-out的需求,因此Scale-out的分布式塊存儲系統應運而生。企業級分布式塊存儲系統有Amazon EBS,開源系統有Ceph RBD[4]和Sheepdog[5]。

1.2糾刪碼容錯技術

考慮一個有M個服務器節點的糾刪碼編碼存儲集群,將數據分割成數據段,然后在每個段上獨立地使用糾刪碼進行編碼。將一個糾刪碼方案表示為EC(n,k),EC(n,k)將一個數據段分割成了k個相同大小的未編碼塊,稱為數據塊,然后編碼生成n-k個編碼塊,稱為校驗塊。假設n

2方案設計

2.1臨時故障與永久故障

存儲系統面臨著兩種類型的節點故障:臨時故障和永久故障。臨時故障包括機器重啟、軟件升級等,永久故障包括機器崩潰、磁盤損壞等[9]。如果一個存儲節點丟失數據,則發生了永久故障。為了維持系統的冗余級別,存儲系統需要執行故障節點重構,即將丟失的數據修復并寫入另一個新的存儲節點。目前,很多研究是關于加快永久節點故障重構。另一方面,如果一個節點存儲的數據并沒有丟失,僅是暫時無法直接訪問,則發生了臨時故障。無永久數據丟失的臨時故障占數據中心所有故障事件的90%[10]。

區分臨時故障和永久故障,只對永久故障采用重構操作,這樣既可以極大地減少存儲系統中的重構次數,又避免了退化更新操作的高延遲。思路是當節點出現不可用的情況時,初步界定為臨時故障,采用熱備副本方法進行退化讀和退化更新操作,盡量延遲對永久故障的判定時間;當確認出現永久故障時,進一步延遲重構操作,直到一個數據條帶的幾個塊同時出現永久故障,或者臨時故障較多,可能影響到數據的可用性和可靠性時,才開始進行重構操作。

2.2臨時故障解決方案

為訪問暫時不可用的數據,存儲系統需要執行退化讀操作,即從剩余存儲節點讀取數據并重建不可用的數據。同時,為了對無法直接訪問的數據塊進行更新,存儲系統需要進行退化寫操作。在更新操作對延遲不敏感的存儲系統中,將更新操作進行阻塞直到能判斷存儲節點是永久故障還是臨時故障(等待15分鐘)。如果是永久故障則進行重構操作,并將更新數據寫入到恢復后的節點;如果是臨時故障,在節點可以重新訪問之后直接將更新數據寫入數據塊節點[11]。但對于更新延遲比較敏感的分布式塊存儲系統,以前不重視的退化更新變得更為重要。

(1)退化讀。當需要對不可用的數據塊進行讀操作時,從剩余的n-1個數據塊和校驗塊中選取k個可用的塊進行解碼恢復操作,然后將恢復的數據塊返回客戶端。這些操作與標準的退化讀操作一致,但不同的是將恢復的數據塊保存到對應數據塊節點的熱備節點中作為副本存儲。在該條帶出現臨時故障的節點一直不可用期間,將使用該副本替代原有節點的數據塊來完成各項更新和讀取操作。當原臨時故障節點恢復正常可用時,如果數據塊已有更新,則將副本上更新的數據塊復制到原節點。接下來如果原節點的可用數據塊發生更新,則將副本設為無效。

(2)退化更新。退化更新操作分為對數據塊節點和校驗塊節點兩種情況:①針對數據塊節點:先進行退化讀操作,恢復原有數據塊,得到新數據塊并寫入到熱備節點中形成副本,然后計算出新舊數據的更新差量,進行常規的更新操作來更新所有校驗塊;②針對校驗塊節點:首先獲取校驗塊狀態,如果處于可用狀態,則進行常規更新操作,如果處于不可用狀態,則利用更新后的數據塊,計算相應的新校驗塊,并將新校驗塊寫入對應的熱備節點中形成副本。

2.3永久故障解決方案

當確定一個設備出現永久故障時,一般會立即觸發重構操作。但由于糾刪碼有很強的可靠性,能夠容忍多節點同時故障,因而可采用一種延遲重構的方法。延遲重構方式的基本思想是降低重構頻次,減少重構消耗的網絡帶寬,同時不對可用性產生較大影響。可以采用的延遲方案有:

(1)對所有故障塊進行延遲重構。在網絡存儲環境中提出的一種解決方案是延遲故障塊的重構,直到一個條帶的可用塊數目達到給定的恢復閾值r。例如,對于CRS(15,10),r=13,系統將等待出現一個條帶中有兩個塊出現故障時才觸發條帶的重構。使用CRS(15,10)編碼延遲重構的數據,永久丟失的概率大約等同于原始的CRS(14,10)進行即時恢復的數據丟失概率,因為恢復操作都是在僅有13個塊可用時進行。

延遲重構有兩個主要優點:①恢復兩個塊的網絡成本和恢復一個塊成本相近,即恢復一個塊需要讀10個塊寫入1個塊(總共11x帶寬),而恢復兩個塊需要讀10個塊寫入2個塊(總共12x帶寬,或者平均每次恢復6x);②如果一個塊由于臨時故障而不可用,如網絡消耗,延遲恢復可以使其有更多時間恢復到正常可用狀態,從而避免了多余的修復。

系統模擬表明將重構閾值減少1可能會極大地增大退化條帶的數目。例如,對于CRS(15,10),重構閾值r=12,導致30%的存儲條帶處于退化狀態。另一方面,增加修復的閾值到r=13,能夠幫助減少退化條帶的數目,但會失去原來節省的網絡帶寬。

(2)結合臨時故障的精細延遲重構。下面進一步提出了與臨時故障處理相結合的更精細化的延遲重構方案。將存儲系統中一個編碼條帶的故障程度表示為R,節點上出現臨時故障的編碼條帶比例為p%,有:R=∑ni=1r×(1-×p%)(1)這里的表示每個編碼條帶中已經進行退化讀或更新操作產生熱備副本的比例。公式(1)將編碼條帶組的臨時故障和永久故障情況進行統一考慮,更加全面地對數據塊丟失概率和網絡恢復流量兩者之間進行權衡。其中:γ=1節點處于永久故障狀態

p%節點處于臨時故障狀態(2)將閾值表示為limit,這里的limit可以動態地自適應調整,當R≥limit時則開始重構操作:limitz + a = lim itZ + δ

lim itZ -(3)當進行了一次正常的重構恢復操作時,即將limit值漸進地增加δ(一個小增量);當出現由于延遲重構而造成數據丟失的事件時,則懲罰性突變減少(一個大增量)。這里的初始閾值limit0是一個經驗初值,對于CRS(15,10)可配置為2或3。

3方案評估

3.1評估方案

評估一種重構方案在減少修復帶寬、對系統可用性和可靠性影響等方面的作用是非常困難的,這里使用一個在GitHub開源的分布式存儲系統模擬器DS-SIM來估計修復帶寬和系統可用性如何受故障事件、編碼方式和重構方案等因素影響。

DS-SIM的輸入包括硬件配置規格說明、存儲系統組件故障和重構分布的統計性質、編碼方案,模擬器返回穩態和網絡帶寬利用的即刻值、退化條帶數目等。模擬參數如表1所示。

表1模擬系統參數參數數值總數據量4PB磁盤容量2T每個主機的磁盤數20每個機架的主機數20修復帶寬容量650TB/每天運行周期10年迭代次數25,0003.2評估結果

對3種方案進行了比較,包括:三副本、CRS(15,10)和采用高效重構的NRS(15,10)。

4結語

針對分布式塊存儲系統的訪問特點,本文設計了一種高效的糾刪碼重構技術。對臨時故障和永久故障分別設計了相應的解決方案,即對臨時故障采用一種糾刪碼和熱備副本相結合的故障處理方法,解決了臨時故障導致的退化讀/更新問題,并從時間維度分散了永久故障的重構成本,提升了重構效率。同時精細地控制永久故障延遲重構的時間點,在不影響讀寫性能和數據可靠性的前提下,減少故障節點重構次數,從而極大地減輕了重構操作對網絡帶寬和磁盤造成的壓力。使用DS-SIM模擬器的評估結果表明,該重構方案相對于原有的CRS方案減少了3倍的修復帶寬流量,同時對系統的可用性和可靠性影響很小;相對于三副本方案,該方案提高了系統的存儲效率與可靠性。

參考文獻:

[1]RASHMI K, NAKKIRAN P.Having your cake and eating It too:jointly optimal erasure codes for I/O,storage, and networkbandwidth[C]. USENIX Association,2015:8194.

[2]MURALIDHAR S, LLOYD W.f4:facebook's warm BLOB storage system[C].OSDI. USENIX Association,2014:383398.

[3]HUANG C, SIMITCI H,XU Y.Erasure coding in windows azure storage[C].ATC. USENIX Association,2012:2.

[4]WEIL S A, BRANDT S A.Ceph:a scalable,highperformance distributed file system[C].OSDI,2010:307320.

[5]劉磊.分布式塊存儲系統節能技術研究[D].武漢:華中科技大學,2013.

[6]羅象宏,舒繼武.存儲系統中的糾刪碼研究綜述[J].計算機研究與發展,2012, 49(1):234240.

[7]LI X,ZHENG Q,QIAN H.Toward optimizing cauchy matrix for cauchy reedsolomon code[J].IEEE Communications Letters,2009:603605.

[8]PLANK J S, LUO J.A performance evaluation and examination of opensource erasure coding libraries for storage[C].CFST.2009:253265.

[9]RASHMI K V,SHAH N B.A hitchhiker's guide to fast and efficient data reconstruction in erasurecoded data centers[J].Acm SCCR,2014:331342.

[10]鄭清吉.安全存儲系統中糾刪碼技術研究[D].上海:上海交通大學,2009.

[11]朱云鋒.分布式存儲系統中基于糾刪碼的容錯技術研究[D].長沙:國防科學技術大學,2014.

主站蜘蛛池模板: 国产尤物jk自慰制服喷水| 国产成人精品男人的天堂| 在线亚洲天堂| 狠狠色噜噜狠狠狠狠色综合久 | 九九九久久国产精品| 91成人精品视频| 国产欧美视频综合二区| 国产日本一线在线观看免费| 亚洲第一香蕉视频| 国产91色在线| 欧美日韩国产综合视频在线观看| 国产精品中文免费福利| 久草网视频在线| 国内嫩模私拍精品视频| 欧美性久久久久| 国产日韩精品欧美一区灰| 一区二区三区成人| 欧美午夜在线播放| 人妻精品久久无码区| 日本欧美午夜| 99ri国产在线| 国产福利拍拍拍| 人妻21p大胆| 欧美激情首页| 狠狠色丁香婷婷综合| 色视频久久| 亚洲成人黄色在线观看| 谁有在线观看日韩亚洲最新视频 | 欧美五月婷婷| 园内精品自拍视频在线播放| 精品国产www| 韩日免费小视频| 黄色a一级视频| 一级毛片免费观看不卡视频| 一本大道无码高清| 国产成人三级| 欧美日韩国产综合视频在线观看| 欧美.成人.综合在线| 国产天天色| 精品91自产拍在线| 精品久久久久无码| 国产欧美精品专区一区二区| 国产精品白浆在线播放| 在线精品亚洲国产| 无码精品一区二区久久久| 亚洲中文无码av永久伊人| 久久国产V一级毛多内射| 亚洲欧洲日韩国产综合在线二区| 九色综合视频网| 亚洲天堂视频在线观看| 久久免费视频6| 亚洲黄色高清| 国产第一页第二页| 欧美一区福利| 婷婷六月综合网| 亚洲床戏一区| 午夜视频日本| 国产乱子伦手机在线| 国产在线精品人成导航| 97色伦色在线综合视频| 国产亚洲精久久久久久无码AV| 国产成人免费观看在线视频| 日韩欧美国产综合| 久久人与动人物A级毛片| 首页亚洲国产丝袜长腿综合| 一区二区欧美日韩高清免费 | 她的性爱视频| 97青草最新免费精品视频| P尤物久久99国产综合精品| 国产精品第页| 婷婷久久综合九色综合88| 色天天综合| 网友自拍视频精品区| 五月六月伊人狠狠丁香网| 91精品啪在线观看国产| 久久99精品久久久久纯品| 国产欧美视频一区二区三区| 亚洲国产成熟视频在线多多| 欧日韩在线不卡视频| 黄色三级毛片网站| 国产综合网站| 91精品国产情侣高潮露脸|