胡琪
摘要:云技術(shù)的快速發(fā)展讓基于海量數(shù)據(jù)的云存儲服務(wù)成了企業(yè)關(guān)注的重點,而云存儲的核心內(nèi)容正是數(shù)據(jù)信息的備份安全,即海量的數(shù)據(jù)能否安全地存儲在云當(dāng)中,在安全的前提下是否能具備系統(tǒng)效率等。當(dāng)前越來越多的大型企業(yè)在數(shù)據(jù)迅速增長的前提下關(guān)注私有云平臺系統(tǒng),此時涉及的服務(wù)性能問題也應(yīng)該展開針對性調(diào)整,才能讓系統(tǒng)的穩(wěn)定性、安全性始終處于可控制的范圍之內(nèi)。
關(guān)鍵詞:私有;云平臺;數(shù)據(jù)備份
中圖分類號:TP311 ? ? ?文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2021)35-0020-02
在企業(yè)信息化加深的背景之下,計算機(jī)軟硬件的更新發(fā)展使得業(yè)務(wù)模式發(fā)生了顯著改變,應(yīng)用數(shù)據(jù)在短時間內(nèi)出現(xiàn)大量更新膨脹。面對此類難題,最有效的方式就是采用云計算來進(jìn)行企業(yè)內(nèi)部的IT基礎(chǔ)架構(gòu)改革工作。云計算以平行計算、分布式計算等內(nèi)容為基礎(chǔ),融合網(wǎng)絡(luò)存儲、虛擬化等技術(shù)在內(nèi)實現(xiàn)了資源的合理分配,在云平臺之上直接開展軟硬件維護(hù)也克服了傳統(tǒng)架構(gòu)的擴(kuò)展性能問題,實現(xiàn)了數(shù)據(jù)信息的綜合調(diào)節(jié)分配。
1 私有云平臺的核心內(nèi)容
1.1 私有云平臺系統(tǒng)
私有云存儲本身伴隨著私有云的概念而產(chǎn)生,指的是讓企業(yè)在完全可控的狀態(tài)之下建立數(shù)據(jù)備份模式,讓數(shù)據(jù)可以被存儲在一個安全的范圍之內(nèi)。換言之,管理人員可以直接在基礎(chǔ)設(shè)施上部署相應(yīng)的應(yīng)用程序,不僅提升了基礎(chǔ)設(shè)施的使用率降低了成本消耗,同時還能在控制工作負(fù)擔(dān)的前提下支持更多的用戶數(shù)量,提供擴(kuò)張性良好的平臺空間。與傳統(tǒng)的存儲平臺相比,私有云系統(tǒng)更像是一個由網(wǎng)絡(luò)設(shè)備和存儲設(shè)備組成的架構(gòu),其中存儲層是平臺的基礎(chǔ)部分,基礎(chǔ)管理層則是最核心部分,完成多個設(shè)備之間的協(xié)同工作要求,能夠?qū)ν馓峁┩环N類型的服務(wù)。應(yīng)用層則是平臺當(dāng)中直接面向用戶的部分,針對不同的業(yè)務(wù)類型和安全性要求提供多接口的業(yè)務(wù)模塊,包括空間租賃、數(shù)據(jù)共享、數(shù)據(jù)備份等[1]。
可以看到,私有云平臺是一種開放性的系統(tǒng),海量的客戶端和服務(wù)器可以直接根據(jù)用戶的實際需求和數(shù)據(jù)規(guī)模來“彈性”地分配資源,數(shù)據(jù)本身也是完全對外開放的。此時的難點問題在于如何確保數(shù)據(jù)的安全性,例如利用平臺內(nèi)部的相關(guān)數(shù)據(jù)做好加密、管理等,特別是在出現(xiàn)故障時怎樣以良好的數(shù)據(jù)備份來保持安全性。
1.2 私有云平臺安全
私有云存儲平臺的建立之后,必然要涉及數(shù)據(jù)備份的安全問題。雖然私有云在控制層面與公共云有本質(zhì)區(qū)別,但面對大量的內(nèi)部訪問控制內(nèi)容,仍然要考慮到數(shù)據(jù)傳輸環(huán)節(jié)的安全要求,例如客戶端和管理節(jié)點之間的通信就需要安全機(jī)制的保障。對于隔離訪問數(shù)據(jù)方面而言,私有云進(jìn)行切分的前提是通過強(qiáng)隔離機(jī)制來獲取一些安全級別更低的數(shù)據(jù),然后標(biāo)記其中那些敏感部分的內(nèi)容。綜合來看嚴(yán)格的數(shù)據(jù)備份系統(tǒng)要通過訪問控制的方式來進(jìn)行安全層次的規(guī)劃。
1.3 數(shù)據(jù)備份需求
隨著現(xiàn)階段的數(shù)據(jù)量大幅增加,企業(yè)也面臨著新的商業(yè)發(fā)展形勢,在保障系統(tǒng)效率的前提之下,需要將數(shù)據(jù)中心從原有的成本中心轉(zhuǎn)型成為創(chuàng)造利潤的創(chuàng)新中心,并且在系統(tǒng)內(nèi)部滿足可用性和合規(guī)性的要求。要實現(xiàn)這一發(fā)展目標(biāo),就需要靈活的備份存儲技術(shù),例如私有云的支持,解決企業(yè)在多個方面的問題。包括業(yè)務(wù)支持、數(shù)據(jù)變化、資源共享發(fā)展部分的內(nèi)容等。
實際上中國很多大型企業(yè)開始建設(shè)自己的私有云平臺,認(rèn)為公共云服務(wù)很難滿足用戶對于安全監(jiān)管的要求。要想保障IT使用的效率,就要考慮到某些非功能需求,集成當(dāng)前現(xiàn)有的IT資源,同時關(guān)注基礎(chǔ)的功能需求[2]。具體而言,服務(wù)于企業(yè)信息化發(fā)展的私有云平臺系統(tǒng)要突出安全性要求,完成數(shù)據(jù)的備份和文件存儲管理,每個安全用戶都可以上傳文件但不可以修改其他用戶上傳的文件。
從可行性的角度而言,私有云平臺讓用戶控制數(shù)據(jù)之后,即便是某些私密處理的數(shù)據(jù)內(nèi)容也可以保證安全性能,即私有云提供了更加穩(wěn)定的擴(kuò)展性和用戶模式,后端變化程度更小。對于企業(yè)而言,現(xiàn)階段和未來很長一段時間內(nèi)的核心工作在于對存儲的信息資源進(jìn)行合理動態(tài)調(diào)整,并且在某個存儲節(jié)點出現(xiàn)故障時,在不同存儲區(qū)都有數(shù)據(jù)備份避免企業(yè)的信息遭到嚴(yán)重?fù)p壞,制定流程優(yōu)化層面的系統(tǒng)解決方案。
2 基于私有云平臺的系統(tǒng)備份技術(shù)
2.1 基于ID特征碼的數(shù)據(jù)備份
私有云平臺系統(tǒng)以集群應(yīng)用的方式保障不同的存儲節(jié)點可以協(xié)同工作,為用戶提供更加透明的數(shù)據(jù)管理服務(wù)。但需注意到的內(nèi)容在于存儲系統(tǒng)的數(shù)據(jù)是以文件為存儲單位,獨立節(jié)點的負(fù)載可能比較大,在客戶端請求存儲文件時也要保障服務(wù)器節(jié)點和客戶端的一對一傳輸,文件傳輸?shù)男时容^低。而基于ID特征碼的數(shù)據(jù)備份策略從根源上看是根據(jù)文件塊信息和監(jiān)控節(jié)點范圍的索性內(nèi)容來完成有效節(jié)點的分配,一方面降低了主服務(wù)器的CPU負(fù)荷,另一方面大幅地提升了系統(tǒng)效率,在第一個副本的存儲節(jié)點明確之后,后續(xù)各個部分的存儲節(jié)點在計算時保持的是相同的方式,用戶的數(shù)據(jù)信息都會有副本留存。
在實際的應(yīng)用環(huán)節(jié)涉及多個文件、數(shù)據(jù)塊的復(fù)雜要求,且當(dāng)客戶端發(fā)送請求后,服務(wù)器節(jié)點先對每個存儲區(qū)域的可用存儲節(jié)點進(jìn)行監(jiān)控,然后將反饋信息發(fā)送給主服務(wù)器的節(jié)點。假設(shè)所有的存儲節(jié)點都是可用的,那么接口服務(wù)器就會給每個子塊配置ID,然后將有關(guān)的信息發(fā)送給主服務(wù)器,根據(jù)監(jiān)控內(nèi)容和索性信息將這部分關(guān)鍵內(nèi)容寫入數(shù)據(jù)庫內(nèi)部。如有失效節(jié)點存在,那么接口服務(wù)器反饋之后也可以在計算機(jī)上對文件進(jìn)行篩選,最終整合成為一個完整的文件內(nèi)容。
本文所提到的基于ID特征碼的數(shù)據(jù)備份方式是通過存儲目錄的節(jié)點狀態(tài)信息將需要備份的數(shù)據(jù)對象存儲在不同的區(qū)域以確定系統(tǒng)的可靠性,例如我們熟悉的Hadoop分布式文件系統(tǒng)等。分片式的數(shù)據(jù)備份模式創(chuàng)建了多個副本,并且將內(nèi)容存放在不同的存儲節(jié)點當(dāng)中,無論是數(shù)據(jù)資源的使用效率還是資源可用性都得到了大幅提高,實現(xiàn)了負(fù)載均衡。因此,不同區(qū)域的存儲節(jié)點服務(wù)器可以通過并行運行的方式來確定索引表信息對應(yīng)的備份存儲區(qū)域提升數(shù)據(jù)安全性和傳輸效率。
2.2 數(shù)據(jù)完整協(xié)議
數(shù)據(jù)完整協(xié)議主要是基于訪問內(nèi)容的在線存儲系統(tǒng)、數(shù)據(jù)庫存儲系統(tǒng)等,而這里所指的數(shù)據(jù)完整性檢驗協(xié)議本質(zhì)上是客戶端將數(shù)據(jù)文件上傳到私有云平臺之后以隨機(jī)檢驗的方式生成特定的數(shù)據(jù)塊,讓客戶端對文件做出判斷,即便是一些較大的文件也可以減少系統(tǒng)資源產(chǎn)生的損耗情況[3]。
我們參考Google文件系統(tǒng)的設(shè)計標(biāo)準(zhǔn)將系統(tǒng)實體劃分為不同的角色,如果要把文件保存在私有云的存儲系統(tǒng)功能當(dāng)中,那么就可以通過交互的方式將數(shù)據(jù)進(jìn)行上傳、下載,最大限度地簡化客戶端層的執(zhí)行流程,數(shù)據(jù)庫內(nèi)部也會有用戶的信息降低了服務(wù)器的整體負(fù)載。整個平臺當(dāng)中數(shù)據(jù)完整性的檢驗過程不受到時間和空間的限制,可以隨時完成驗證任務(wù)。驗證方案劃分為準(zhǔn)備階段和驗證階段,對應(yīng)兩種不同的協(xié)議。
2.3 分布式文件系統(tǒng)
分布式文件系統(tǒng)的應(yīng)用場合是當(dāng)數(shù)據(jù)大小超越了獨立物理計算機(jī)的處理能力時,對內(nèi)容進(jìn)行分區(qū)域存儲,將其設(shè)置在不同的單獨計算機(jī)之上,且管理網(wǎng)絡(luò)當(dāng)中跨多臺計算機(jī)進(jìn)行存儲的文件系統(tǒng)也會成為分布式文件系統(tǒng)。整個系統(tǒng)架構(gòu)在網(wǎng)絡(luò)之上,會引入網(wǎng)絡(luò)編程的部分內(nèi)容,作為私有云的關(guān)鍵技術(shù)之一,在針對性的設(shè)計開發(fā)階段,能夠完成空間資源的最大化利用。即便存儲空間不足,也只需要增加服務(wù)器即可,不需要轉(zhuǎn)移整個網(wǎng)站,而基于策略的副本定制存放工作也能讓數(shù)據(jù)的完整性得到保障[4]。
2.4 數(shù)據(jù)加密
數(shù)據(jù)加密是未來系統(tǒng)數(shù)據(jù)備份的主要發(fā)展趨勢,尤其是在企業(yè)享受此類服務(wù)的過程當(dāng)中,必然要考慮到數(shù)據(jù)安全的有關(guān)要求,無論是基于技術(shù)規(guī)范層面還是行業(yè)發(fā)展層面都要做好數(shù)據(jù)的加密管理,包括對稱加密和非對稱加密兩種類型。
對稱加密是當(dāng)前已經(jīng)成熟應(yīng)用的加密算法,數(shù)據(jù)發(fā)送方將密鑰和數(shù)據(jù)同時加密后發(fā)送給對方,接收方接收數(shù)據(jù)之后利用密鑰和逆算法進(jìn)行解密,不過該方法對于密鑰的管理難度比較高,在一些分布式網(wǎng)絡(luò)系統(tǒng)當(dāng)中的應(yīng)用效率并不穩(wěn)定。
非對稱加密則是使用完全不同但匹配的私鑰和公鑰完成對于數(shù)據(jù)的加密過程,發(fā)送方要了解接收方的公鑰后才能加密數(shù)據(jù),然后接收方用私鑰完成密文的解析,如RSA。私有云平臺是涉及大量數(shù)據(jù)的服務(wù)平臺,用戶與內(nèi)部人員都要考慮到服務(wù)的穩(wěn)定性和連續(xù)性要求,用戶也可以自行選擇加密方式完成對于數(shù)據(jù)的備份和存儲。
3 平臺整體架構(gòu)設(shè)計
為了解決系統(tǒng)內(nèi)部對于數(shù)據(jù)的存儲和備份要求,就需要設(shè)計基于分布集群的私有云平臺系統(tǒng),完成整體的架構(gòu)框架設(shè)計實現(xiàn)文件的存儲、數(shù)據(jù)共享等。其中元數(shù)據(jù)大小可以通過參數(shù)來設(shè)定不同的范圍,用戶也不需要關(guān)注底層的實現(xiàn)方法。
在系統(tǒng)功能模塊設(shè)計角度分析,用戶管理模塊是其中最為基礎(chǔ)的部分,普通用戶的信息處理、資料審核直至最終的系統(tǒng)登錄內(nèi)容都高度依賴數(shù)據(jù)交互。客戶端部分基于瀏覽器實現(xiàn),其他頁面出現(xiàn)的數(shù)據(jù)也可以提供共享對象來解決此類問題。在私有云平臺系統(tǒng)設(shè)計當(dāng)中,登錄服務(wù)器端和云注冊端主要由主服務(wù)器完成,接口服務(wù)器對控制層進(jìn)行處理管控,并不需要考慮邏輯處理是否會有新的算法變化內(nèi)容等,只需要邏輯層提供接口調(diào)用模式[5]。
針對整個私有云平臺的登錄系統(tǒng),主服務(wù)器的邏輯層可以提供用戶的管理操作模塊,數(shù)據(jù)庫的連接方法會專門寫在某一類型的文件當(dāng)中,如果后續(xù)的操作涉及數(shù)據(jù)庫的修改等內(nèi)容,就不需要對每個邏輯處理函數(shù)都進(jìn)行修改,邏輯層的實現(xiàn)可以直接從客戶端接收數(shù)據(jù)然后判斷服務(wù)類型,按照服務(wù)類型調(diào)用不同的邏輯處理,然后將結(jié)果全部返回給云客戶端。
在文件系統(tǒng)組織結(jié)構(gòu)部分,涉及存儲表和文件表的內(nèi)容會做好標(biāo)記,即對應(yīng)的記錄信息屬于哪些用戶。以存儲表為例,用戶硬盤的使用信息全部備份在內(nèi),而文件表則是記錄用戶的索引信息,這樣一來用戶可以靈活地組織文件目錄然后進(jìn)行管理,相應(yīng)的工作流程和文件管理模塊會完成這些內(nèi)容的整體規(guī)劃。
4 結(jié)語
本次研究基于云平臺展開的數(shù)據(jù)存儲備份研究工作能夠?qū)崿F(xiàn)私有云存儲的基本功能,同時完成數(shù)據(jù)的加密傳輸、存儲從而保障數(shù)據(jù)的安全性。在今后的應(yīng)用環(huán)節(jié),可以在內(nèi)部通過私有云平臺實現(xiàn)文件資源的共享,從而降低管理成本保障數(shù)據(jù)安全。這樣一來,也能夠提升系統(tǒng)服務(wù)的價值,降低IT各項維護(hù)操作對于業(yè)務(wù)產(chǎn)生的影響。
參考文獻(xiàn):
[1] 熊偉.基于私有云存儲技術(shù)的重要檔案移交與異地備份的探討[J].蘭臺世界,2014(S3):71-72.
[2] 夏秀峰,王濤.私有云環(huán)境下基于HDFS的PDM數(shù)據(jù)備份策略[J].沈陽航空航天大學(xué)學(xué)報,2015,32(4):71-77.
[3] 李廣鵬,王柯.基于私有云環(huán)境全棧數(shù)據(jù)保護(hù)的研究及實踐[J].中國信息化,2019(10):56-57.
[4] 杜華,郭俊,劉華春.基于Swift的副本數(shù)據(jù)自適應(yīng)備份策略研究[J].計算機(jī)與現(xiàn)代化,2018(11):12-17.
[5] 胡新煒,史麗男,李湘南,等.基于Hadoop的煙臺市科技服務(wù)云災(zāi)備系統(tǒng)研究[J].科技視界,2017(7):268.
【通聯(lián)編輯:唐一東】