呂建富 彭楚風(fēng)



摘要:隨著“互聯(lián)網(wǎng)+教育”模式的持續(xù)推進(jìn)以及教育信息化2.0行動計劃的頒布,教育系統(tǒng)內(nèi)各類應(yīng)用匯聚了海量教育數(shù)據(jù),教育數(shù)據(jù)資源的安全存儲以及開放共享對實現(xiàn)教育現(xiàn)代化具有重要意義。區(qū)塊鏈的分布式容錯、難以篡改等技術(shù)特性可以有效解決教育數(shù)據(jù)資源存儲共享中面臨的技術(shù)難題。基于此,本文介紹了區(qū)塊鏈技術(shù)以及目前教育數(shù)據(jù)存儲共享管理中存在的主要問題,并針對這些問題提出一種基于聯(lián)盟鏈的教育數(shù)據(jù)存儲共享方案。
關(guān)鍵詞:教育數(shù)據(jù)資源;區(qū)塊鏈;聯(lián)盟鏈
中圖分類號:G434? 文獻(xiàn)標(biāo)識碼:A? 論文編號:1674-2117(2021)06-0076-04
“互聯(lián)網(wǎng)+”是利用互聯(lián)網(wǎng)手段對傳統(tǒng)行業(yè)進(jìn)行優(yōu)化升級,并推動其發(fā)展。而教育信息化是“互聯(lián)網(wǎng)+教育”模式的深度融合和不斷創(chuàng)新,目前教育信息化已經(jīng)逐步成為國家信息化發(fā)展的重要組成部分,是建設(shè)教育強(qiáng)國的重要載體。教育信息化在持續(xù)推進(jìn)的進(jìn)程中產(chǎn)生了海量的教育數(shù)據(jù)資源,然而,我國教育行業(yè)對海量數(shù)據(jù)沒有建立一套合理的對數(shù)據(jù)進(jìn)行存儲保護(hù)、分析共享的平臺,同時,教育行業(yè)長期以來注重信息化發(fā)展而忽視了網(wǎng)絡(luò)安全方面的管理,在信息系統(tǒng)建設(shè)、維護(hù)中,對數(shù)據(jù)的存儲保護(hù)不足容易導(dǎo)致數(shù)據(jù)被攻擊、泄露。另外,海量的教育數(shù)據(jù)并沒有被有效地分析利用。因此,本文提出了一種基于聯(lián)盟鏈的教育數(shù)據(jù)存儲共享方案,通過該方案可以有效地對數(shù)據(jù)進(jìn)行存儲保護(hù)、安全共享,實現(xiàn)去中心化、去信任、數(shù)據(jù)難以篡改的數(shù)據(jù)管理。
● 相關(guān)技術(shù)背景
1.區(qū)塊鏈技術(shù)
①區(qū)塊鏈概念。區(qū)塊鏈?zhǔn)侵斜韭斣凇侗忍貛牛阂环N點(diǎn)對點(diǎn)的電子現(xiàn)金系統(tǒng)》[1]一文中提出的。作為比特幣的核心技術(shù),區(qū)塊鏈技術(shù)并非作為一種新型的計算機(jī)技術(shù)出現(xiàn)的,而是分布式存儲、P2P網(wǎng)絡(luò)、加密算法等多種計算機(jī)技術(shù)的一種融合應(yīng)用模式。區(qū)塊鏈作為比特幣的底層技術(shù),利用數(shù)據(jù)塊來存儲特定時間段內(nèi)的交易數(shù)據(jù)信息,并按時間順序?qū)⒁粋€個的數(shù)據(jù)塊以鏈條的形式鏈接起來,如圖1所示。每個數(shù)據(jù)塊由區(qū)塊頭和區(qū)塊體兩部分構(gòu)成。區(qū)塊頭中存儲著時間戳、Merkle根節(jié)點(diǎn)等信息,并通過父哈希值鏈接到上一區(qū)塊;區(qū)塊體主要負(fù)責(zé)存儲所有的數(shù)據(jù)信息。
②區(qū)塊鏈特點(diǎn)。區(qū)塊鏈以其去信任、去中心化、數(shù)據(jù)防篡改以及數(shù)據(jù)可追溯的特點(diǎn)迅速引起各行各業(yè)的關(guān)注,各行各業(yè)可利用其技術(shù)特點(diǎn)解決行業(yè)難題,促進(jìn)行業(yè)發(fā)展創(chuàng)新。
③區(qū)塊鏈分類。根據(jù)網(wǎng)絡(luò)范圍和管理權(quán)限,區(qū)塊鏈演化出三種應(yīng)用模式,分別是公有鏈、聯(lián)盟鏈、私有鏈[2],不同應(yīng)用模式之間的區(qū)別如下表所示。公有鏈?zhǔn)峭耆_放的;私有鏈通常為私人或者私人機(jī)構(gòu)所建立,不對外開放;聯(lián)盟鏈?zhǔn)墙橛趦烧咧g的一種特殊架構(gòu),既一定程度上保證了去中心化的特點(diǎn),又便于監(jiān)管。
④應(yīng)用場景。區(qū)塊鏈技術(shù)是具有普適性的底層技術(shù)框架,可以為金融、經(jīng)濟(jì)、科技甚至政治等各領(lǐng)域帶來深刻變革。[2]區(qū)塊鏈技術(shù)最早被金融領(lǐng)域所關(guān)注,由全球銀行巨頭發(fā)起組建的R3聯(lián)盟,致力于發(fā)展區(qū)塊鏈技術(shù);在科技領(lǐng)域,為了推動區(qū)塊鏈技術(shù)在多行業(yè)的應(yīng)用,IBM聯(lián)合Linux基金會開發(fā)了一個區(qū)塊鏈開源項目超級賬本(Hyperledger)[3];在能源領(lǐng)域,國內(nèi)外企業(yè)已經(jīng)啟動相關(guān)能源區(qū)塊鏈項目,文獻(xiàn)[4]提出將區(qū)塊鏈技術(shù)應(yīng)用于電網(wǎng)電力交易市場、智能電網(wǎng)數(shù)據(jù)安全存儲管理等方面;在食品安全領(lǐng)域,文獻(xiàn)[5]提出將區(qū)塊鏈技術(shù)融入食品溯源中,以此來提供安全、透明的食品溯源系統(tǒng);在醫(yī)療健康領(lǐng)域,文獻(xiàn)[6]提出了基于區(qū)塊鏈的醫(yī)療記錄安全存儲方案;在教育領(lǐng)域,文獻(xiàn)[7]介紹了區(qū)塊鏈在教育領(lǐng)域的應(yīng)用前景以及現(xiàn)實挑戰(zhàn)。
2.教育數(shù)據(jù)資源
2015年,國務(wù)院啟動大數(shù)據(jù)國家戰(zhàn)略,發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》[8],提出要在依法加強(qiáng)安全保障和隱私保護(hù)的前提下,整合政府部門公共數(shù)據(jù)資源,穩(wěn)步推進(jìn)公共數(shù)據(jù)資源開放。2017年,國務(wù)院印發(fā)《國家教育事業(yè)發(fā)展“十三五規(guī)劃”》[9],明確指出要加快推進(jìn)教育大數(shù)據(jù)建設(shè)與開放共享,形成教育數(shù)據(jù)資源開放共享的制度與機(jī)制,該規(guī)劃為我國教育數(shù)據(jù)的開放共享指明了發(fā)展方向。經(jīng)過數(shù)年的發(fā)展,在國家教育政策的指引下,全國廣大師生積極參與,在各級教育行政部門以及電教戰(zhàn)線的共同努力下,國家教育資源公共服務(wù)平臺匯聚第三方優(yōu)質(zhì)資源及應(yīng)用,面向教育機(jī)構(gòu)、教師、學(xué)生、家長等各類用戶提供優(yōu)質(zhì)教育資源,自建設(shè)運(yùn)行以來,已經(jīng)積累了一大批業(yè)務(wù)數(shù)據(jù)以及日志數(shù)據(jù)、教育資源數(shù)據(jù)。目前,國家教育資源公共服務(wù)平臺是國家教育資源云服務(wù)的樞紐,在體系中承擔(dān)骨干樞紐、示范引領(lǐng)、探索創(chuàng)新、拾遺補(bǔ)缺的作用,是形成教育資源公共服務(wù)體系內(nèi)各平臺實現(xiàn)互聯(lián)互通和資源共享的中心。根據(jù)統(tǒng)計,國家教育資源公共服務(wù)平臺已發(fā)布60多個應(yīng)用和活動,匯聚了海量的教育資源,包括視頻、文件、圖片等,積累了PB級的數(shù)據(jù)。此外,疫情以來,國家提出“停課不停學(xué)”的號召,國家中小學(xué)云平臺同步上線了春季、秋季兩個學(xué)期的課程資源,根據(jù)瀏覽量,后臺已收集了大量的平臺訪問日志,然而這些日志并沒有得到充分利用。對如此海量的教育數(shù)據(jù)有效地進(jìn)行安全存儲和開放共享可以促使教育系統(tǒng)更加公開、透明地運(yùn)行,但過度地開放共享就會帶來隱私泄露等數(shù)據(jù)安全方面的問題。基于此,國內(nèi)學(xué)者主要從立法、數(shù)據(jù)倫理、行業(yè)自律和政府監(jiān)管等層面提出了對策。本文從技術(shù)層面考慮,提出了一種基于聯(lián)盟鏈的數(shù)據(jù)安全存儲共享方案。
● 基于聯(lián)盟鏈的教育大數(shù)據(jù)管理架構(gòu)
教育系統(tǒng)數(shù)據(jù)種類多、體量大,數(shù)據(jù)源分布廣泛,使用傳統(tǒng)的存儲管理方式效率低下且安全性較低,會影響到職能部門對數(shù)據(jù)價值的挖掘。區(qū)塊鏈技術(shù)在教育領(lǐng)域的探索還處于摸索階段,但該技術(shù)的出現(xiàn)從技術(shù)角度為破解教育數(shù)據(jù)共享難題提供了一條嶄新的思路。
1.基于聯(lián)盟鏈的教育數(shù)據(jù)存儲共享模型
根據(jù)教育數(shù)據(jù)的安全存儲共享需求,本文設(shè)計了一種基于聯(lián)盟鏈的教育數(shù)據(jù)的安全存儲共享模型,如下頁圖2所示。該模型采用聯(lián)盟鏈的架構(gòu),利用PBFT共識算法進(jìn)行區(qū)塊共識,并結(jié)合分布式存儲實現(xiàn)教育數(shù)據(jù)資源的存儲共享。
①分布式數(shù)據(jù)庫。區(qū)塊鏈中的區(qū)塊容量有限,難以實現(xiàn)海量數(shù)據(jù)的存儲,因此,可采用分布式數(shù)據(jù)庫+區(qū)塊鏈的方案,將數(shù)據(jù)資源利用加密算法存儲到分布式數(shù)據(jù)庫中,區(qū)塊鏈中存儲數(shù)據(jù)摘要、數(shù)據(jù)索引等安全性較高的重要數(shù)據(jù)。
②聯(lián)盟鏈。采用聯(lián)盟鏈的應(yīng)用模式構(gòu)建管理教育數(shù)據(jù)的區(qū)塊鏈可以保證教育數(shù)據(jù)開放共享的安全性。聯(lián)盟鏈?zhǔn)且环N多中心的區(qū)塊鏈架構(gòu),可以由教育行政部門制定準(zhǔn)入規(guī)則,參與教育數(shù)據(jù)的存儲共享。
②數(shù)據(jù)存儲參與者。經(jīng)過管理節(jié)點(diǎn)審核的用戶都可以加入到聯(lián)盟鏈網(wǎng)絡(luò)中獲取存儲和訪問數(shù)據(jù)的權(quán)限。
2.教育數(shù)據(jù)的存儲與共享
根據(jù)上文提出的數(shù)據(jù)存儲與共享模型分別介紹數(shù)據(jù)的安全存儲以及數(shù)據(jù)的開放共享過程,聯(lián)盟鏈的區(qū)塊共識過程利用PBFT算法。
①數(shù)據(jù)的安全存儲。
Step1數(shù)據(jù)擁有者發(fā)出上傳請求。
Step2輪值監(jiān)督節(jié)點(diǎn)對上傳節(jié)點(diǎn)的公鑰進(jìn)行驗證,確認(rèn)其上傳權(quán)限。
Step3如公式(1)所示,數(shù)據(jù)擁有者(Owner)利用哈希算法計算得出數(shù)據(jù)摘要,然后將摘要值利用自己的私鑰加密得出數(shù)字簽名) 。
Owner:
(1)
最后,如公式(2)利用輪值監(jiān)督節(jié)點(diǎn)j的公鑰加密數(shù)據(jù)得到密文數(shù)據(jù)。
(2)
Step4輪值監(jiān)督節(jié)點(diǎn)將數(shù)據(jù)摘要以及簽名后的數(shù)據(jù)摘要上傳至聯(lián)盟鏈中,將加密數(shù)據(jù)上傳至分布式數(shù)據(jù)庫中。
Step5設(shè)定數(shù)據(jù)量閾值,當(dāng)數(shù)據(jù)量達(dá)到設(shè)定閾值后輪值監(jiān)督節(jié)點(diǎn)打包數(shù)據(jù)記錄并計算出Merkle根節(jié)點(diǎn)的值,然后將Merkle根節(jié)點(diǎn)的值連同自己的公鑰放在區(qū)塊頭中,最后將完整區(qū)塊廣播給其他監(jiān)督節(jié)點(diǎn)進(jìn)行驗證。
Step6其他監(jiān)督節(jié)點(diǎn)收到廣播區(qū)塊數(shù)據(jù)后驗證區(qū)塊的合法性,驗證無誤,則將其鏈接到聯(lián)盟鏈上。
至此,完成了加密數(shù)據(jù)和數(shù)據(jù)摘要的存儲,分布式數(shù)據(jù)庫中存儲的是加密后端的真實數(shù)據(jù),聯(lián)盟鏈中存儲的是公鑰、數(shù)據(jù)哈希值以及元數(shù)據(jù)。公鑰可以確定數(shù)據(jù)的擁有者身份,數(shù)據(jù)哈希值可以查找數(shù)據(jù)的索引以及校驗數(shù)據(jù)的完整性,元數(shù)據(jù)主要是記錄數(shù)據(jù)的相關(guān)描述信息等。
②數(shù)據(jù)的開放與共享。
區(qū)塊鏈技術(shù)利用非對稱加密算法、哈希算法等密碼學(xué)技術(shù)實現(xiàn)數(shù)據(jù)的安全共享,數(shù)據(jù)訪問者請求數(shù)據(jù)首先應(yīng)申請授權(quán),獲得授權(quán)的用戶才能正常訪問數(shù)據(jù),基于此,數(shù)據(jù)共享過程主要包括以下幾個步驟。
Step1訪問授權(quán):數(shù)據(jù)訪問者申請訪問,請求獲取數(shù)據(jù)訪問權(quán)限。
Step2身份驗證:身份驗證通過執(zhí)行Step3,否則,權(quán)限不符,駁回申請。
Step3數(shù)據(jù)安全共享:數(shù)據(jù)擁有者利用訪問者的公鑰加密數(shù)據(jù)形成密文數(shù)據(jù),同時,數(shù)據(jù)擁有者通過哈希函數(shù)計算得出數(shù)據(jù)摘要,并利用自己的私鑰對數(shù)據(jù)摘要進(jìn)行數(shù)字簽名。數(shù)據(jù)擁有者將密文數(shù)據(jù)和簽名后的數(shù)據(jù)摘要一同發(fā)送給數(shù)據(jù)訪問者。
Step4數(shù)據(jù)校驗:數(shù)據(jù)訪問者接收到密文數(shù)據(jù)和數(shù)據(jù)摘要后,利用數(shù)據(jù)擁有者的公鑰解密簽名后的數(shù)據(jù)摘要,并利用自己的私鑰解密密文得到明文原始數(shù)據(jù),同時利用哈希函數(shù)計算出數(shù)據(jù)摘要,比較接收到的數(shù)據(jù)摘要值和計算出的摘要值,驗證數(shù)據(jù)的完整性。如驗證無誤,則數(shù)據(jù)沒有被篡改過;否則,數(shù)據(jù)被惡意篡改過。
3.安全性分析
基于聯(lián)盟鏈的教育數(shù)據(jù)存儲共享方案的安全性通過以下幾個方面得以保證。
①數(shù)據(jù)加密存儲。數(shù)據(jù)在整個過程中利用密碼學(xué)算法進(jìn)行傳輸存儲,整個過程無明文暴露,惡意攻擊者無法直接獲取明文數(shù)據(jù),且傳統(tǒng)攻擊者無法在短時間內(nèi)破解密文數(shù)據(jù)。
②去中心化。聯(lián)盟鏈在一定程度上保留了去中心化的特點(diǎn),同時又便于監(jiān)管。參與到教育數(shù)據(jù)聯(lián)盟鏈的節(jié)點(diǎn)都是經(jīng)過教育政務(wù)部門審核的節(jié)點(diǎn),同時,這些數(shù)據(jù)節(jié)點(diǎn)共同參與數(shù)據(jù)的管理和監(jiān)督,某一節(jié)點(diǎn)的損壞不會影響系統(tǒng)的正常運(yùn)行,這使得基于聯(lián)盟鏈的數(shù)據(jù)存儲共享方案具有較高的安全可靠性。區(qū)塊鏈內(nèi)的所有節(jié)點(diǎn)通過共識算法認(rèn)定一份數(shù)據(jù)信息的有效性,保證信息的真實可靠。通過共識算法區(qū)塊鏈無需依賴特定的第三方中心機(jī)構(gòu)來鑒定交易的有效性。
③數(shù)據(jù)難以被篡改。教育數(shù)據(jù)資源經(jīng)過共識過程鏈接到聯(lián)盟鏈上,攻擊者若想惡意篡改鏈上某一區(qū)塊中的數(shù)據(jù),就必須修改該區(qū)塊之后所有區(qū)塊的數(shù)據(jù),同時,也需要將網(wǎng)絡(luò)內(nèi)所有節(jié)點(diǎn)服務(wù)器上的備份數(shù)據(jù)進(jìn)行修改,且必須在特定的共識時間段內(nèi)完成篡改。因此,具備眾多節(jié)點(diǎn)的區(qū)塊鏈網(wǎng)絡(luò),系統(tǒng)的安全性較高,數(shù)據(jù)難以篡改。
④可追溯性。區(qū)塊鏈的鏈?zhǔn)酱鎯Y(jié)構(gòu)以及區(qū)塊頭中的可信時間戳屬性為數(shù)據(jù)的追本溯源提供了可行性,因此,鏈上存儲的每筆數(shù)據(jù)記錄都可以追溯。
⑤分布式存儲。該方案采用分布式數(shù)據(jù)庫存儲數(shù)據(jù),保證了數(shù)據(jù)的可用性、可靠性,惡意攻擊者對單個節(jié)點(diǎn)造成的惡意損壞不會影響整體數(shù)據(jù)的使用。
綜上所述,基于聯(lián)盟鏈的教育數(shù)據(jù)存儲共享方案可以保證數(shù)據(jù)的機(jī)密性、完整性、可用性。
● 結(jié)語
本文針對目前教育系統(tǒng)產(chǎn)生的大量教育數(shù)據(jù)資源的高價值性以及安全問題導(dǎo)致的開放共享程度低等問題,設(shè)計了一種基于聯(lián)盟鏈的教育大數(shù)據(jù)管理方案,該方法以區(qū)塊鏈技術(shù)為基礎(chǔ),改變了傳統(tǒng)的存儲管理模式,可促進(jìn)數(shù)據(jù)的共享利用,優(yōu)化教育數(shù)據(jù)的存儲模式。區(qū)塊鏈技術(shù)在教育系統(tǒng)內(nèi)的應(yīng)用還在初期階段,該架構(gòu)可作為一種基礎(chǔ)參考架構(gòu),在此基礎(chǔ)上可以利用人工智能技術(shù)對數(shù)據(jù)進(jìn)行進(jìn)一步開發(fā)利用,實現(xiàn)自動化的數(shù)據(jù)抽取、分析、利用,為決策層制定相關(guān)的教育政策提供數(shù)據(jù)依據(jù)。
參考文獻(xiàn):
[1]Nakamoto, Satoshi.Bitcoin: A peer-to-peer electronic cash system[Z]. Manubot, 2019.
[2]袁勇,王飛躍.區(qū)塊鏈技術(shù)發(fā)展現(xiàn)狀與展望[J].自動化學(xué)報,2016,42(04):481-494.
[3]何蒲,于戈,張巖峰,等.區(qū)塊鏈技術(shù)與應(yīng)用前瞻綜述[J].計算機(jī)科學(xué),2017(04):1-7.
[4]張俊,王飛躍.基于區(qū)塊鏈的電網(wǎng)大數(shù)據(jù)數(shù)字資產(chǎn)管理架構(gòu)[J].電力信息與通信技術(shù),2018.
[5]李明佳,汪登,曾小珊,等.基于區(qū)塊鏈的食品安全溯源體系設(shè)計[J].食品科學(xué),2019,40(03):288-294.
[6]梅穎.安全存儲醫(yī)療記錄的區(qū)塊鏈方法研究[J].江西師范大學(xué)學(xué)報:自然科學(xué)版,2017,41(05):481-487.
[7]楊現(xiàn)民,李新,吳煥慶,等.區(qū)塊鏈技術(shù)在教育領(lǐng)域的應(yīng)用模式與現(xiàn)實挑戰(zhàn)[J].現(xiàn)代遠(yuǎn)程教育研究,2017,34(02):45.
[8]中華人民共和國國務(wù)院.促進(jìn)大數(shù)據(jù)發(fā)展行動綱要[J].成組技術(shù)與生產(chǎn)現(xiàn)代化,2015(03):51-58.
[9]國務(wù)院.國家教育事業(yè)發(fā)展“十三五”規(guī)劃[Z/OL].(2017-01-19)[2019-04-17].http://www.gov.cn/zhengce/content/2017-01/19/content_5161341.htm,2006.f.