中圖分類號:G717 文獻(xiàn)標(biāo)志碼:A
0 引言
隨著信息化浪潮的不斷推動,教育領(lǐng)域正持續(xù)地從傳統(tǒng)教學(xué)模式向數(shù)字化教學(xué)模式轉(zhuǎn)型。傳統(tǒng)教育模式受時間、空間和資源配置的限制,難以滿足當(dāng)下教育個性化的需求。在此背景下,在線教育應(yīng)運(yùn)而生,數(shù)字課程資源的多樣化,為眾多學(xué)科的發(fā)展提供了更大的空間[1]。例如:房地產(chǎn)類專業(yè)課程實(shí)踐內(nèi)容豐富,但傳統(tǒng)教學(xué)方式課程缺乏互動性、與企業(yè)實(shí)際聯(lián)系不緊密,難以激發(fā)學(xué)生興趣。但在線教育為其提供了更多的案例和實(shí)踐機(jī)會。
數(shù)字課程資源建設(shè)過程中面臨著資源普適性不足、共享性差、個性化支持不足以及利用率低等問題,導(dǎo)致數(shù)字資源缺乏可擴(kuò)展性、可動態(tài)管理等特點(diǎn),使其無法用于專題教學(xué)。尤為關(guān)鍵的是,數(shù)據(jù)存儲管理環(huán)節(jié)潛藏著安全隱患,若發(fā)生數(shù)據(jù)泄露和篡改等事件,后果將不堪設(shè)想[2]。如何在現(xiàn)代信息技術(shù)的支持下,建立一個高效、安全和可擴(kuò)展的數(shù)字課程資源的儲存和管理系統(tǒng),是目前教育信息化面臨的一個重要問題。
針對該問題,文章開展Hadoop下房地產(chǎn)類課程數(shù)字化資源安全存儲方法的設(shè)計(jì)研究。
1Hadoop下數(shù)字化資源存儲隨機(jī)密鑰隱藏設(shè)計(jì)
在Hadoop分布式環(huán)境下,利用加密技術(shù)對教學(xué)資源進(jìn)行加密處理,以保障教學(xué)資源的隱私性和完整性。現(xiàn)有的密碼算法分為對稱加密算法和非對稱加密算法。對稱加密算法加密效率高、速度快,但是密鑰管理難度大;非對稱加密算法無須進(jìn)行密鑰協(xié)商,但加密效率較低,僅適用少量的數(shù)據(jù)的加密。房地產(chǎn)類課程數(shù)字化資源中的海量信息,如課程視頻、三維模型、案例等,對加密性能提出更高的要求。Hadoop下數(shù)字化資源存儲方案如圖1所示。
圖1中,摘要信息由信息簽名產(chǎn)生,密文是被加密的數(shù)據(jù),而密鑰是被隱藏的關(guān)鍵信息。
Hadoop上存儲的所有數(shù)據(jù)都是經(jīng)過加密的,沒有授權(quán)是不能被查看的[3]。采用預(yù)先產(chǎn)生的報文摘要,對報文的完整性進(jìn)行驗(yàn)證。若數(shù)據(jù)發(fā)生篡改,其摘要信息也會相應(yīng)改變。通過對比原始摘要信息和接收到的數(shù)據(jù)生成的摘要信息,以檢驗(yàn)報文的正確性。該方案將密鑰信息和密文分開存儲和管理,保證了數(shù)據(jù)的安全性和完整性。
針對對稱密碼體制中的密鑰管理問題,本文提出了一種專用的隨機(jī)密鑰隱藏算法。以房地產(chǎn)類課程數(shù)字化資源為研究對象,以課程編號、章節(jié)標(biāo)識、資源類型等屬性為基礎(chǔ),通過哈希值產(chǎn)生加密密鑰[4-5]在屬性設(shè)定中加入了賬號的密碼,在更改密碼的時候,無須對所有的資料進(jìn)行再次加密,提高了管理的效率。采用隨機(jī)填充法,防止字典攻擊和預(yù)計(jì)攻擊。
圖1Hadoop下數(shù)字化資源存儲方案

為進(jìn)一步提高存儲的安全性能,對房地產(chǎn)類課程數(shù)字化資源的屬性組合方式、消息摘要算法和哈希函數(shù)等進(jìn)行設(shè)計(jì)。以房地產(chǎn)評估實(shí)例為例,對其屬性進(jìn)行分析和參考。MetaTable表結(jié)構(gòu)設(shè)計(jì)包含3個主要部分:行關(guān)鍵字、時間戳、列族。
在不加密的情況下,使用隱藏密鑰的全零化身份,在完整性檢查中保持信息摘要。HBase具有高可靠與高性能的分布式計(jì)算平臺[,它對房地產(chǎn)類課程數(shù)字化資源,尤其是市場數(shù)據(jù)、案例庫等,收集、存儲的頻率非常高。傳統(tǒng)的關(guān)系數(shù)據(jù)庫很難支撐,而HBase存儲模式可以在海量數(shù)據(jù)中維持穩(wěn)定的性能。
2 密文訪問控制
為提高房地產(chǎn)類課程數(shù)字化資源存儲的安全性,對隨機(jī)密鑰加密后的密文進(jìn)行訪問控制。分別從云服務(wù)提供商(CloudServiceProvider,CSP)和用戶2個角度出發(fā),為存儲在Hadoop下的資源提供更加完善的訪問控制保障條件。基于CSP的訪問控制,依托Hadoop的用戶認(rèn)證和訪問控制列表,用于限制不具備讀取資源的普通用戶對密文的越權(quán)訪問[7]?;贑P-ABE(屬性加密)的權(quán)限控制,避免具備讀取資源的特權(quán)用戶惡意獲取數(shù)據(jù)內(nèi)容,確保僅授權(quán)用戶可解密數(shù)據(jù)[8]。將上述2種訪問控制方法相結(jié)合,形成一套更加適用于房地產(chǎn)類課程數(shù)字化資源的密文訪問控制方案[9]
訪問控制通過特定方式對主體、客體的訪問能力進(jìn)行控制。將房地產(chǎn)類課程數(shù)字化資源數(shù)據(jù)作為客體,將其定義為 D 。根據(jù)該定義對主體進(jìn)行分類:第一種,所有者(Owner,O)是資源數(shù)據(jù)的創(chuàng)建者,具備完整的控制權(quán)限,可以實(shí)現(xiàn)對資源數(shù)據(jù)的讀、寫、刪除和共享操作。第二種,共享者(Sharer,S)表示被所有者授權(quán)可進(jìn)行資源數(shù)據(jù)讀取的用戶,但不具備數(shù)據(jù)的修改和刪除權(quán)限。第三種,管理者(Manager,M)表示Hadoop下管理員,可對資源數(shù)據(jù)進(jìn)行刪除操作,但無法查看資源數(shù)據(jù)的內(nèi)容。第四種,無關(guān)者(Unrelated,U)表示不具備任何訪問權(quán)限的其他用戶。假設(shè)全部主體集合為 u ,則根據(jù)上述分析,各類主體之間應(yīng)當(dāng)滿足下述公式:
u=O∪S∪M∪U
U=u-(O∪S∪M)
在上述關(guān)系中,存在 S∩M≠φ 或 O∩M≠φ 的關(guān)系,表示同一名用戶身兼數(shù)職。各主體權(quán)限對其進(jìn)行訪問控制,提高資源存儲的安全性。
3房地產(chǎn)類課程數(shù)字化資源數(shù)據(jù)讀取
在Hadoop環(huán)境中,實(shí)現(xiàn)安全存取地產(chǎn)類課程數(shù)字化資源,必須保證數(shù)據(jù)的隱私性與完整性。其中,數(shù)據(jù)的讀出包含機(jī)密信息的取得和完整性的確認(rèn)。房地產(chǎn)類課程數(shù)字化資源數(shù)據(jù)讀取流程如圖2所示。
圖2房地產(chǎn)類課程數(shù)字化資源數(shù)據(jù)讀取流程

在數(shù)據(jù)讀取階段,從分布式文件系統(tǒng)(HadoopDistributedFileSystem,HDFS)獲取到加密后的密文,同時從HBase當(dāng)中獲取密鑰標(biāo)識、數(shù)字摘要等內(nèi)容。依據(jù)HBase當(dāng)中的密鑰信息,判斷HDFS中數(shù)據(jù)是否需要解密[10]。當(dāng)密鑰標(biāo)識為0時,數(shù)據(jù)為明文,無須進(jìn)行解密;當(dāng)密鑰標(biāo)識為非0時,數(shù)據(jù)為密文,須進(jìn)行解密操作。完成上述操作后,結(jié)合數(shù)據(jù)源的基本屬性,從安全存儲中獲取加密的密鑰并進(jìn)行恢復(fù)處理,生成對密文解密的隨機(jī)密鑰,使用隨機(jī)密鑰,對HDFS的密文進(jìn)行解密,獲取原始的房地產(chǎn)類課程數(shù)字化資源數(shù)據(jù)。在獲取明文數(shù)據(jù)后,通過對比數(shù)據(jù)生成的數(shù)字摘要和HBase中存儲的原始摘要信息來檢驗(yàn)數(shù)據(jù)的完整性。二者一致時,說明資源數(shù)據(jù)沒有被篡改,數(shù)據(jù)具備完整性;二者不一致時,說明數(shù)據(jù)可能遭受篡改,須觸發(fā)安全告警并終止此次讀取操作。通過上述操作,可以實(shí)現(xiàn)對房地產(chǎn)類課程數(shù)字化資源的安全讀取,確保數(shù)據(jù)在傳輸以及存儲的過程中具備保密性和完整性。
4實(shí)例應(yīng)用分析
4.1 實(shí)驗(yàn)環(huán)境
以虛擬主機(jī)為研究對象,將QXDrive原型系統(tǒng)在4個校園網(wǎng)絡(luò)服務(wù)器上運(yùn)行。4個虛擬主機(jī)都有2G的存儲空間、160G的硬盤、千兆以太網(wǎng)絡(luò)卡和Redhat9.0服務(wù)器操作系統(tǒng)。4個主機(jī)都在同一個網(wǎng)絡(luò)段,它們之間通過千兆以太網(wǎng)相連,它們都是由100M 的Ethernet網(wǎng)絡(luò)連接起來的,每個主機(jī)都有一個單獨(dú)的校園IP,編號是173.135.12.16-19,用IP地址代表相應(yīng)的主機(jī)。通過百兆網(wǎng)絡(luò)訪問服務(wù)器,實(shí)現(xiàn)對4個虛擬主機(jī)的遠(yuǎn)程配置和管理。管理主機(jī)也是客戶端的測試平臺,配備 2.6GHz 的雙核處理器、
2GB的存儲空間、百兆以太網(wǎng)絡(luò)卡和Ubuntu12.04桌面操作系統(tǒng)。
在實(shí)驗(yàn)環(huán)境中部署時,主機(jī)與角色關(guān)系如表1所示。
表1主機(jī)與決策關(guān)系

結(jié)合表1中主機(jī)與決策關(guān)系,構(gòu)建如圖3所示的邏輯拓?fù)浣Y(jié)構(gòu)。
圖3邏輯拓?fù)浣Y(jié)構(gòu)

在構(gòu)建的實(shí)驗(yàn)環(huán)境中,對提出的存儲方案存儲安全性能進(jìn)行檢驗(yàn)。3臺主機(jī)共提供120GB存儲空間,總存儲空間為 360GB 。當(dāng)副本的數(shù)量為2時,可以提供180G業(yè)務(wù)存儲空間,以此滿足房地產(chǎn)類課程數(shù)字化資源存儲需求。
4.2實(shí)驗(yàn)數(shù)據(jù)
在實(shí)驗(yàn)過程中,隨機(jī)選取6個文件大小在265~85200KB 之間的房地產(chǎn)類課程數(shù)字化資源數(shù)據(jù)集。表2記錄了所選資源類型以及對應(yīng)文件大小。
在進(jìn)行數(shù)據(jù)傳輸時,不進(jìn)行壓縮處理。
4.3存儲效果分析
針對資源文件,利用文章提出的方法進(jìn)行存儲,分別記錄具備資源讀取權(quán)限的用戶獲取到的文件和不具備資源讀取權(quán)限用戶獲取到的文件,如表3和表4所示。
表2所選資源類型以及對應(yīng)文件大小

通過表3和表4的對比可知,在應(yīng)用文章存儲方法后,資源訪問權(quán)限機(jī)制得以有效實(shí)施。具備資源讀取權(quán)限的用戶,能夠正常獲取如表3所示的實(shí)際數(shù)字化資源;而未具備相應(yīng)權(quán)限的用戶,僅可獲取如表4所示的表頭內(nèi)容,除表頭之外的所有內(nèi)容均以亂碼形式呈現(xiàn)。因此,文章提出的存儲方法可以實(shí)現(xiàn)對房地產(chǎn)類課程數(shù)字化資源的安全存儲,具備極高的安全性,保障課程資源不被泄露。
5結(jié)語
文章研究了在Hadoop下房地產(chǎn)類課程數(shù)字化資源安全存儲問題,提出一種全新的存儲方法。實(shí)驗(yàn)證明該存儲方法的可行性和有效性。將該方法應(yīng)用于實(shí)際可以保護(hù)房地產(chǎn)類課程數(shù)字化資源存儲的安全,研究成果將為房地產(chǎn)類數(shù)字教學(xué)資源的構(gòu)建提供技術(shù)支持,對其他學(xué)科的資源進(jìn)行有效的存儲和管理,促進(jìn)優(yōu)質(zhì)教育資源的跨地域、跨平臺共享,真正達(dá)到“無界”的教育服務(wù)。
表3具備資源讀取權(quán)限用戶獲取文件

表4不具備資源讀取權(quán)限用戶獲取文件

參考文獻(xiàn)
[1]王穎,張夢娜,董新良.學(xué)校安全教育數(shù)字化課程資源庫建設(shè)圖景及其實(shí)現(xiàn)[J].教學(xué)與管理,2024(19):12-17.
[2]張俊飛,吳小玲.數(shù)字化教學(xué)資源存儲方案設(shè)計(jì)[J].實(shí)驗(yàn)室研究與探索,2019(4):115-118,226.
[3]徐嘉誠,郭曉娜.基于Hadoop的云計(jì)算數(shù)據(jù)安全性研究[J].無線互聯(lián)科技,2023(6):143-145.
[4]曾夢,鄒北驥,張文生,等.多模態(tài)醫(yī)療數(shù)據(jù)中海量小文件存儲優(yōu)化方法[J].軟件學(xué)報,2023(3):1451-1469.
[5]饒?jiān)榈聜悾瑫r玉龍.基于區(qū)塊鏈的農(nóng)情數(shù)據(jù)可信融合共享模型設(shè)計(jì)與實(shí)現(xiàn)[J].安徽農(nóng)業(yè)大學(xué)學(xué)報,2023(3) :550-556.
[6]王恂.大數(shù)據(jù)背景下基于Hbase技術(shù)的移動統(tǒng)計(jì)平臺研究[J].無線互聯(lián)科技,2015(13):47-48.
[7]童飛,邵冉冉.基于區(qū)塊鏈的云上數(shù)據(jù)訪問控制模型研究[J].計(jì)算機(jī)科學(xué),2023(9):16-25.
[8]康佳,李育,黃紫涵,等.基于屬性加密的訪問控制系統(tǒng)[J].物聯(lián)網(wǎng)技術(shù),2023(9):47-50.
[9]趙健.基于hadoop的艦船通信網(wǎng)絡(luò)數(shù)據(jù)并行處理方法[J].艦船科學(xué)技術(shù),2023(7):158-161.
[10]劉曉宇,夏立斌,姜曉巍,等.HDFS分級存儲系統(tǒng)元數(shù)據(jù)管理方法的研究[J].計(jì)算機(jī)工程與應(yīng)用,2023(17) :257-265.
(編輯 王永超)
Secure storage method for digital resources of real estate courses under Hadoop
JIN Jing, XI Sha* (Schoolof Management,Changchun Universityof Architectureand Civil Engineering,Changchun 130ooo,China)
Abstract:To improvethe securityof digital resource storage forreal estate courses,research isbeing conducted on the design of secure storage methods for digital resources of real estatecourses under Hadoop.Inthe Hadoop environment, this study designedrandom key hiding for digital resource storageand selected HBase as the storage mode.Dividethe digital resource data ofreal estate courses into four subjects:owners,sharers,managers,and unrelated parties,and thenimplement access control for these subjects.For users with access to read resources,design digital resourcedata readingfor real estate courses to achieve secure storage of resources.The example proves that the new storage method can ensure that onlyauthorized users canaccess the plaintext of resources,meeting the securityrequirements of digital resource storage.
Key words: Hadoop; digitalization; resource security storage; course; real estate category