崔俊多
【摘要】隨著計算機技術的不斷發展,大數據已經逐漸成為人們研究的一個熱點。但近年來受計算機系統的限制,大數據的處理變成了一項巨大的挑戰。PCM即變相存儲器的出現,憑借著它自身存在的優勢,為大數據的處理帶來了新的方式。本文旨在通過對PCM的研究,探析在PCM運行之下大數據的存儲與管理。
【關鍵詞】PCM;大數據;存儲;管理
PCM的出現為計算機存儲數據的體系結構帶來了新的變革,為大數據的處理系統帶來了新的發展的契機。在目前大數據的使用滲入到人們生活的每一個階段,關于大數據的存儲與管理變得十分的重要。大數據的順利儲存與處理直接的關系到人們信息的安全,和計算機系統的正常運行,因此要重視關于大數據的存儲管理。
1大數據
1.1大數據的緣起
在當前各種數據輪番暴漲的時代,大數據已然變成了人們口中的一個熱門的話題。關于大數據的相關定義,有官方稱“在短時間內內無法用常規的工作軟件對其進行收集、儲存與管理的數據,即為大數據。”在大部分的研究者眼中,大數據就是在數據的規模、類型、處理速度上較為緩慢的數據,它的存在向新的數據管理提出了新的挑戰,對于如何滿足現階段的大數據的儲存,變成了首當其沖的問題。
1.2大數據的特點
(1)種類繁多
大數據作為各種數據的集成,它所擁有的種類也是比較的多變的。如:電網應用中的大數據就包含有眾多的數據類型,僅僅針對用電用戶的數據就包含有用電數據,用戶信息的數據,電費清算的數據等。由此不難看出大數據是一個龐大的體系,它的種類也是經常變動的。
(2)獲得速度快
對于大宗的數據處理來說,快速的獲取各種信息變得十分的重要,只有在更快的獲取到所需要的數據才能更好的加以處理。如:自然災害的發生總是猝不及防,關于受災地區的數據的收集則就在獲取的速度上有相當高的要求。只有及時的獲取信息才能更好的阻止災害帶來的破壞繼續的蔓延。因此關于大數據的的處理,獲取速度是其中的一個重點。
(3)數據的真實性
大數據的收集的來源一般都是比較可靠的,因此關于大數據的質量上也是可以得到很好的保證。如:國家氣象局每天進行的天氣播報,關于各個地區的天氣的變化情況,都是通過專門的機械觀察總結得出的,在對于指導人們的生活方面是具有相當大的參考意義的。因此,對于大數據來說數據信息的真實性也是難以忽視的。
(4)價值高
關于大數據的存儲與管理來說,大數據的一次收集可以應用到許多的方面,以最低的成本創造出最高的價值。如:地質部門收集的關于某地區的地形地況的資料,在對于該地區的城市的規劃,農業的發展來說都是具有參考價值的,因此我們可以說大數據是用最低的成本創造了最大的價值。
2PCM的應用
2.1 PCM的概述
PCM作為一種用于儲存大數據的變相的儲存器,它很好地適應了當前對于大數據儲存的更高的要求,更加適合高效的大數據存儲。關于閃存技術對于大數據儲存的沖擊,研究者們紛紛投以了探究的目光。在近幾年PCM的應用逐漸的發展起來,并在眾多的大數據存儲器中大獲好評,被研究者們認為是未來最具有發展潛力大數據存儲介質。
2.2 PCM的發展狀況
PCM的研究最早開始于上世紀的六十年代,隨著半導體的技術與相關的材料的演變,變相的儲存器的優勢逐漸的顯現出來并得到了廣泛的重視。直至2007年才有專門研發PCM的公司出現,隨著人們對于數據的存儲需求不斷地增加,PCM也得到了進一步的發展,2012年更是將PCM的研發推到了一個頂峰,中國更是在這一年第一次擁有可以自主生產變相儲存器的企業。
2.3 PCM的特性
(1)高存儲密度
PCM儲存單元中的材料主要是硫化物,這種材料的特性是是可以根據電壓的改變而隨之發生變化呈現出不同的電阻值。這種材料的應用可以通過使用不同的電阻值來分區儲存數據,以達到一個儲存單元可以儲存多個字節的目的。另外在PCM的制作技術的不斷提高,在同等大小上的PCM儲存器可以儲存更多的數據。
(2)不易失控
PCM是通過儲存單元中的硫化物的電阻值的變化來實現關于數據的保存的,而硫化物本身的電阻值在不同的電壓和電流的變動而變動,硫化物的穩定性就幫助PCM在進行儲存大數據時不會容易丟失,也不需要通過持續的供電來保證儲存中的大數據不會發生變化。
(3)低能耗
PCM儲存是屬于微型儲存器中的一種,僅僅只是依靠硫化物來進行數據的存儲,不涉及到過多的機械轉動裝置。并且在低電壓的運行中,PCM的讀寫與操作的能耗都是比較少的,不需要通過定期的刷新電流來保存數據,屬于綠色的數據存儲器。
(4)讀寫不對稱
PCM的讀取延遲較其他的閃存要減少一到兩個的數量級,并且在新一輪的數據存儲中不需要抹除以前留下的痕跡,只需要通過編碼的更改來實現新的一輪的數據的更新。其讀寫的不對稱性主要體現在讀取的延遲之上,也就是說較其他的存儲器的讀寫來看,它在運行中呈現出一種非對稱式的記錄。
(5)使用壽命短
PCM的元件在經過多次的實驗操作過程,里面的相變材料會變得十分的粗糙,容易導致單元格的數據收集失敗,因此在PCM的元件使用上,它的使用次數是有一定的限制的。所以在對于PCM的元件的設計上關于使用壽命的思考也是相當的重要的。
3大數據中的PCM的應用
3.1主存構架
在大數據橫行的時代,人們對于可以大容量的儲存的要求,對于在主存系統中存在的問題人們提出了相應的解決辦法。在開始是用PCM完全的代替原來的DRAM,這種主存的機構之下,構成比較的簡單而且是按照DRAM的運行來進行工作的,它的讀寫的效率較低。針對這樣的情況出現了混合的朱構架模式,所謂的混合式主構架模式就是PCM與DRAM混合的存在與主存中。這樣的主存模式將PCM的容量大,能耗低與DRAM的讀寫快結合起來,有效地解決了單一的PCM運行的讀取慢的問題,但容易造成主存架構內部變得復雜。因此在目前來看各種主存得的構架模式對于大數據的處理來說都是有一定的缺失的。
為了進一步的改善這樣的情況,我們在主存的運行中可以通過減少無用的寫入數據、提前對數據進行分類整理,通過對于不同數據的編碼來將復雜的運行步驟不斷的進行縮減,以達到高效的處理各種數據的儲存。
3.2磨損均衡
在對于大數據的處理中的材料的磨損來說,主要是在寫入數據時將數據進行偏移一個值的空間以去除在寫入內容時對于可用時間的影響。再對大數據進行處理時,要將每個數據的轉移實現周期性的轉移,將數據計算的方法變簡單,減少不必要的儲存開支。
3.3硬件的糾錯
關于在DRAM的運行中的錯誤是暫時性的并且可以恢復到原來的數據,而PCM的運行中一旦錯誤是永久的并不可恢復的。這就對于在運行過程中的硬件的糾錯變得十分的重要。我們要通過使用指針的方式將錯誤的數值進行撤銷,并迅速的用另一個正確的數據來代替它的存在。針對不同的硬件出現的不同的錯誤我們要將其進行分組化的處理,不斷的糾正各個組合內部的錯誤,將儲存的空間合理的分配,以達到最優的儲存效果。
總結
關于PCM在大數據的存儲與管理中是十分的重要的,面對目前的PCM中存在的問題的研究與解決已經提上發展的日程。人們在不斷的發展PCM的應用時,關于大數據的處理能力也在不斷的提升。因此在進入大數據的時代,關于數據的存儲與管理,是可以通過技術的不斷的革新來加以完善的。
參考文獻
[1]楊曉娣. 存儲虛擬化技術在網絡海量GIS數據存儲中的應用[J]. 電子世界,2016,(20):197-198.
[2]魏偉. 大數據背景下民政檔案管理工作創新路徑探析[J]. 經貿實踐,2015,(12):163.
[3]胡平源. 數據保護中虛擬儲存技術的應用解析[J]. 信息通信,2015,(06):71.
[4]彭小圣,鄧迪元,程時杰,文勁宇,李朝暉,牛林. 面向智能電網應用的電力大數據關鍵技術[J]. 中國電機工程學報,2015,(03):503-511.