徐福燕
隨著計(jì)算機(jī)系統(tǒng)規(guī)模越來越大,全球數(shù)據(jù)存儲(chǔ)量呈現(xiàn)爆炸式增長(zhǎng),企業(yè)及互聯(lián)網(wǎng)數(shù)據(jù)以每年50%的速率在增長(zhǎng)。據(jù)Gartner 預(yù)測(cè),到2025 年,全球數(shù)據(jù)量將達(dá)到175ZB,而中國(guó)的數(shù)據(jù)總量也將達(dá)到48.6ZB。數(shù)據(jù)爆發(fā)性增長(zhǎng)給數(shù)據(jù)存儲(chǔ)技術(shù)方案帶來了前所未有的變革。
傳統(tǒng)的中心化集中存儲(chǔ)經(jīng)常有數(shù)據(jù)丟失、網(wǎng)絡(luò)盜竊、個(gè)人隱私泄漏,甚至是運(yùn)營(yíng)關(guān)停等問題發(fā)生,而且集中存儲(chǔ)極大占用了骨干網(wǎng)網(wǎng)絡(luò)帶寬,而大規(guī)模擴(kuò)容骨干網(wǎng)寬帶資源將消耗大量的投資,在中心化的存儲(chǔ)架構(gòu)下,該問題難以有效地解決。
分布式存儲(chǔ)以其高性能、方便平滑擴(kuò)容、較高的數(shù)據(jù)安全等優(yōu)勢(shì),已經(jīng)成為當(dāng)前存儲(chǔ)市場(chǎng)上主流的技術(shù)模式,受到了企業(yè)、政府及個(gè)人消費(fèi)者的青睞。在分布式網(wǎng)絡(luò)中,需要存儲(chǔ)的用戶可以用更便宜的價(jià)格、更安全和透明地存儲(chǔ)數(shù)據(jù),而且也大大縮短了數(shù)據(jù)查詢與調(diào)用的時(shí)延。
不管是集中存儲(chǔ)還是分布式存儲(chǔ),主要的數(shù)據(jù)安全策略是進(jìn)行RAID 備份,如RAID0+1、RAID5、RAID6 等。但RAID 機(jī)制仍有很大的局限性,如RAID6 方式,在同一集群內(nèi)也僅允許同時(shí)壞掉2 塊硬盤。如果分布式存儲(chǔ)節(jié)點(diǎn)出現(xiàn)網(wǎng)絡(luò)故障、電源故障或存儲(chǔ)設(shè)備故障時(shí),就有可能造成存儲(chǔ)的重要數(shù)據(jù)資料丟失。
2009 年1 月份比特幣上線后,世界各國(guó)對(duì)區(qū)塊鏈的研究與應(yīng)用飛速發(fā)展,區(qū)塊鏈甚至被認(rèn)為是繼蒸汽機(jī)、電氣化、計(jì)算機(jī)之后的第四次工業(yè)革命的重要成果。經(jīng)過10 多年的技術(shù)沉淀,區(qū)塊鏈技術(shù)得到了長(zhǎng)足發(fā)展,在全球領(lǐng)域內(nèi)已實(shí)現(xiàn)金融、政務(wù)、醫(yī)療、保險(xiǎn)、工業(yè)制造等多個(gè)領(lǐng)域不同程度的應(yīng)用,社會(huì)對(duì)區(qū)塊鏈的價(jià)值和適用場(chǎng)景的認(rèn)識(shí)不斷提高,區(qū)塊鏈的去中心化、加密、防篡改等優(yōu)勢(shì)特性變得眾所周知。在區(qū)塊鏈時(shí)代的背景下,基于區(qū)塊鏈技術(shù)的分布式存儲(chǔ)應(yīng)運(yùn)而生,為分布式存儲(chǔ)提供了加密、防篡改、自動(dòng)恢復(fù)、多副本備份等功能,讓重要數(shù)據(jù)安若磐石,滿足市場(chǎng)上行業(yè)客戶對(duì)存儲(chǔ)數(shù)據(jù)高安全性的要求。
分布式存儲(chǔ)采用兩級(jí)架構(gòu),管理運(yùn)維功能集中部署在上層,數(shù)據(jù)節(jié)點(diǎn)分散下沉,對(duì)外提供數(shù)據(jù)存儲(chǔ)和業(yè)務(wù)訪問的能力,如圖1。分布式存儲(chǔ)采取集群建設(shè)模式,將寫入數(shù)據(jù)負(fù)載分擔(dān)到集群內(nèi)所有節(jié)點(diǎn)做數(shù)據(jù)切片存儲(chǔ)處理,擁有高效的寫入效率,并通過 EC(Erasure Code)糾刪碼策略、RAID6 等數(shù)據(jù)安全等多重保護(hù)策略,支持?jǐn)?shù)據(jù)重構(gòu),提高寫入數(shù)據(jù)的安全性。

圖1 分布式存儲(chǔ)架構(gòu)
區(qū)塊鏈?zhǔn)且环N去中心化的分布式電子記賬系統(tǒng),是以區(qū)塊結(jié)構(gòu)存儲(chǔ)數(shù)據(jù)、多方共同維護(hù)的、使用密碼技術(shù)保證傳輸和訪問的分布式數(shù)據(jù)存儲(chǔ)技術(shù)體系。在加密算法的配合下,交易信息按照發(fā)生的時(shí)間順序記錄在區(qū)塊鏈系統(tǒng)中,并附帶相應(yīng)的時(shí)間戳。數(shù)字區(qū)塊必須通過所有參與交易的人一致同意才可以更新,因此不容易被攻擊者通過數(shù)據(jù)攔截、修改或刪除進(jìn)行非法操作,具有去中心化、時(shí)序數(shù)據(jù)(即時(shí)間戳)、可追溯、防篡改、安全可信等特點(diǎn)。其主要核心技術(shù)是共識(shí)機(jī)制(PBFT、RBFT 等)、智能合約、多級(jí)密碼機(jī)制(數(shù)字簽名算法、安全哈希算法等)。
區(qū)塊鏈和分布式存儲(chǔ)技術(shù)相結(jié)合,充分利用了兩種技術(shù)的優(yōu)勢(shì)特征,是分布式數(shù)據(jù)存儲(chǔ)、點(diǎn)對(duì)點(diǎn)傳輸、共識(shí)機(jī)制、加密算法等計(jì)算機(jī)技術(shù)的新型應(yīng)用模式(圖2),解決了多點(diǎn)之間相互信任以及數(shù)據(jù)安全的問題,在智慧工地、醫(yī)療影像、電子病歷、法院卷宗、政務(wù)單據(jù)等方面都有廣闊的應(yīng)用前景。

圖2
1)在云資源池上,部署區(qū)塊鏈業(yè)務(wù)平臺(tái),客戶可通過互聯(lián)網(wǎng)或VPN 網(wǎng)絡(luò),將重要數(shù)據(jù)文件上傳到區(qū)塊鏈業(yè)務(wù)平臺(tái)上。
2)在分布式存儲(chǔ)節(jié)點(diǎn)上,同時(shí)部署區(qū)塊鏈功能節(jié)點(diǎn)。為了避免將存儲(chǔ)數(shù)據(jù)直接暴露在公網(wǎng)中,區(qū)塊鏈各節(jié)點(diǎn)通過VPN 網(wǎng)絡(luò)與云資源平臺(tái)上的區(qū)塊鏈業(yè)務(wù)平臺(tái)主節(jié)點(diǎn)進(jìn)行對(duì)接交互,提高數(shù)據(jù)安全性。
3)區(qū)塊鏈業(yè)務(wù)平臺(tái)根據(jù)客戶需求,分配需要的存儲(chǔ)空間大小,按最小化訪問策略限制其他公網(wǎng)IP 訪問的黑白名單,并配置所需要的副本存儲(chǔ)數(shù)量(N=3,5,7 等)。
4)客戶將重要數(shù)據(jù)文件上傳到區(qū)塊鏈業(yè)務(wù)平臺(tái),平臺(tái)將文件信息進(jìn)行MD5 加密上鏈,并根據(jù)用戶的多副本存儲(chǔ)需求,異步存放到各個(gè)存儲(chǔ)節(jié)點(diǎn)中,通過多副本異地存儲(chǔ)的方式,大大提高了數(shù)據(jù)存儲(chǔ)的安全性和可靠性。
5)上傳的文件信息存儲(chǔ)到區(qū)塊鏈各節(jié)點(diǎn)上,各區(qū)塊鏈節(jié)點(diǎn)共同維護(hù)有效地保證了存儲(chǔ)數(shù)據(jù)不被篡改。
6)系統(tǒng)可主動(dòng)進(jìn)行定期掃描,若某個(gè)存儲(chǔ)節(jié)點(diǎn)數(shù)據(jù)損壞或丟失,區(qū)塊鏈節(jié)點(diǎn)進(jìn)行文件信息校驗(yàn),并從其他節(jié)點(diǎn)中重新獲取數(shù)據(jù)并進(jìn)行修復(fù)。

圖3
在系統(tǒng)部署上,將區(qū)塊鏈存儲(chǔ)業(yè)務(wù)平臺(tái)劃分為能力層和業(yè)務(wù)接入層,業(yè)務(wù)接入層負(fù)責(zé)對(duì)接客戶側(cè)的互聯(lián)網(wǎng)或VPN 網(wǎng)絡(luò)接入,按公網(wǎng)、VPN 專網(wǎng)兩種方式分別設(shè)置接口機(jī),能力層則將區(qū)塊鏈及存儲(chǔ)能力相關(guān)能力封裝為基礎(chǔ)核心能力,供接入層進(jìn)行調(diào)用,以避免存儲(chǔ)節(jié)點(diǎn)和區(qū)塊鏈節(jié)點(diǎn)公網(wǎng)環(huán)境建設(shè)一套,VPN 環(huán)境再建設(shè)一套,達(dá)到節(jié)省建設(shè)投資并大大提高存儲(chǔ)資源利用率的效果。
在網(wǎng)絡(luò)安全上,系統(tǒng)訪問控制依據(jù)最小化按需訪問策略進(jìn)行制定,主要通過防火墻限制訪問,通過協(xié)議和端口的限制,制定按需訪問控制策略。
1)智慧工地。在建筑工地上,建設(shè)工程往往涉及多家單位共同參與,設(shè)計(jì)、施工、監(jiān)理、審核,以及物料搬運(yùn)、存放等涉及多方人員交互(圖4),人多事雜,而且信息化程度不高,很多建筑工地的施工圖紙、合同等紙質(zhì)材料成堆存放,待工程完工后裝運(yùn)到總部歸檔,工期一久,存在字跡模糊不清、合同金額多次變動(dòng)等諸多問題,無(wú)法得到及時(shí)有效監(jiān)管。此外,文件材料成袋存放或裝運(yùn),有丟失或損壞風(fēng)險(xiǎn),如工地坍塌、意外失火、大雨淋濕等情況下極易造成文件損毀。智慧工地借助區(qū)塊鏈技術(shù),可以將設(shè)計(jì)圖紙、材料清單、合同等檔案材料及時(shí)上傳,加密上鏈保存,將文件以多副本形式存放在多個(gè)區(qū)塊鏈節(jié)點(diǎn)中,避免文件受損或被惡意篡改,及時(shí)得到有效的監(jiān)管,同時(shí),多副本區(qū)塊鏈存儲(chǔ)方式,也極大提高了文件的安全性。

圖4
2)智慧醫(yī)療。傳統(tǒng)醫(yī)療云存儲(chǔ)一般也是單文件存儲(chǔ)方式,醫(yī)療病歷、醫(yī)療影像相關(guān)數(shù)據(jù)安全可靠性達(dá)不到容災(zāi)的要求。將存儲(chǔ)文件的MD5 信息加密上鏈,利用區(qū)塊鏈可信、防篡改等特點(diǎn),保證醫(yī)療數(shù)據(jù)文件不被篡改和丟失,通過數(shù)字簽名實(shí)現(xiàn)了數(shù)據(jù)操作過程中的身份驗(yàn)證,并對(duì)數(shù)據(jù)操作進(jìn)行追蹤溯源。
3)法院卷宗。隨著信息化程度的不斷提高,與法院判決有效的電子記錄數(shù)量大規(guī)模增長(zhǎng),區(qū)塊鏈分布式存儲(chǔ)可以有效解決法院的電子記錄保存、更新方面長(zhǎng)期存在的問題,如法院判決、法院禁令記錄、犯罪前科記錄等相關(guān)信息,實(shí)現(xiàn)電子信息的及時(shí)準(zhǔn)確更新。此外,利用區(qū)塊鏈智能合約,可將對(duì)經(jīng)濟(jì)案件合同中的條款添加到區(qū)塊鏈上,當(dāng)違反合同約定條款等違約行為產(chǎn)生時(shí),即可自動(dòng)執(zhí)行賠償措施。
如今,國(guó)家明確指出要將區(qū)塊鏈作為核心技術(shù)自主創(chuàng)新的重要突破口,加速推動(dòng)區(qū)塊鏈技術(shù)和產(chǎn)業(yè)創(chuàng)新發(fā)展,區(qū)塊鏈存儲(chǔ)在當(dāng)前人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)的時(shí)代背景下,必將迎來廣闊的發(fā)展前景。