徐 華
內蒙古大學
隨著科技進步和社會經濟發展,人類生產生活中產生的數據量快速增加。對于圖書館來說,圖書資源、科技文獻、學習資料等資源也快速增加。為了充分利用和發揮圖書館資源的數據價值,圖書館內部、圖書館與其他圖書館之間已經開始加大數字資源的共享工作力度。在數字資源共享過程中,對于圖書館數字資源的擁有者來說,也逐漸具有了較強的個人信息保護意識。其中,最大的問題是如何實現數據資源的安全共享,防止出現數據隱私泄露、數據被篡改等問題。
為解決此問題,阮光冊等學者基于大數據挖掘技術,分析了圖書館用戶的行為,發現部分用戶在使用圖書館數據資源時存在知識侵權或信息泄露的問題。吳宗大等學者分析發現數據隱私在已有的管理制度下不能得到很好的保障。陳傳夫等學者研究了圖書館數字資源使用中存在的信息泄露、信息篡改、信息侵權等問題,提出圖書館需要加強行業制度建設。為有效解決數據共享中存在的數據安全問題,顧立平提出了信息化技術在圖書館轉型發展中的應用方案;郭春霞分析了多種類型的數據管理策略,有效解決了異構、異源、非結構等帶來的數據管理難題。王丹丹從數據使用特點的視角出發,提出了電子資源的評價方式,有效解決了圖書館數字資源評價標準多樣和不統一的問題。
為了發揮圖書館數字資源的價值,已有學者從管理制度建設、新技術應用等維度,對圖書館數字資源的安全使用問題進行了研究。但是,已有研究缺少對數據資源使用過程的詳細機制的探討,導致圖書館數字資源安全使用過程中仍然缺少可實施的機制。為解決此問題,本文提出基于區塊鏈的圖書館數字資源安全共享模型,包括基于聯盟鏈的數據管理架構、智能合約體系。同時,提出基于區塊鏈的圖書館數字資源安全共享機制,包括身份注冊流程、知識共享流程、數據獲取流程。最后,對于本文提出的數據安全共享機制的使用方法,給出了新建平臺和利舊基礎上新建兩種策略。
本文設計的基于區塊鏈的圖書館數字資源安全共享模型,主要包括區塊鏈和聯邦學習兩種技術框架。區塊鏈技術可以有效解決單點故障、數據被篡改的問題。考慮到高校的圖書館之間都互相聯系,并且具有可信任關系,在實施時,本文采用聯盟鏈技術構建區塊鏈平臺。聯邦學習模塊主要用于數據的安全共享工作。當圖書館之間需要共享的數據隱私性高時,聯邦學習技術可以有效解決隱私數據在傳輸過程中存在的數據泄露問題。
基于圖書館數據如何實現安全管理的問題,提出基于聯盟鏈的數據管理架構,如圖1所示,具體包括數據存儲平臺、各個圖書館、聯盟鏈、系統服務接口。
數據存儲平臺模塊,采用分布式數據存儲技術,可以有效防止數據丟失,提升數據訪問和使用效率。各個圖書館模塊主要實現訪問區塊鏈和數據存儲平臺的接入和安全認證。為此,采用聯盟鏈技術構建區塊鏈,可以有效簡化圖書館的訪問和操作。在身份驗證方面,通過智能合約技術,實現圖書館身份注冊和認證的自動化操作。在數據訪問管理方面,通過創建數據管理智能合約,實現圖書館的數據管理以及數據共享的自動執行。系統服務接口模塊,主要實現各個圖書館對區塊鏈的調用,并將數據存儲到數據存儲平臺。

圖1 基于聯盟鏈的數據管理架構
圖書館的數據類型多樣,來源途徑也比較多,給數據資源的共享帶來了較大的問題。為簡化各個圖書館對平臺和數據的訪問和使用,本部分采用RESTful接口實現。在聯盟鏈技術實現方面,為實現聯盟鏈平臺,本文使用Solidity編程語言,采用Remix IDE作為開發工具。考慮到聯盟鏈平臺的可靠性和構建效率,使用Ganache工具搭建聯盟鏈開發環境。
為實現圖書館數據的安全共享,本文采用聯邦學習技術。聯邦學習是一種分布式機器學習框架,可以應用于多種環境。對于行業相同、用戶范圍不同的業務,可以采用橫向聯邦學習技術實現;對于行業不同、用戶覆蓋范圍相似的業務,可以采用縱向聯邦學習技術實現;對于其他關聯性不大的業務,可以采用遷移聯邦學習技術實現。
在聯盟鏈中,為保障數據的安全性和靈活性,智能合約已成為業界公認的比較優化的策略其可以根據業務規則,自動執行數據的操作,有效避免人為失誤或故意篡改等事件導致的數據不一致性、被篡改等問題。
根據圖書館的業務特征,本文提出的智能合約包括圖書館身份管理合約、身份信息管理合約、知識管理合約。(1)圖書館身份管理合約,主要功能是完成圖書館在聯盟鏈中的身份創建和身份重置等。基于該合約,加入聯盟鏈的圖書館可以根據預定的身份創建規則,自動創建身份信息;根據預定的身份重置規則,自動對身份進行增刪查改等功能。(2)圖書館身份信息管理合約,主要功能是根據圖書館聯盟約定的圖書館身份標識、圖書館身份編號規則、圖書館密鑰管理規則,為每個加入聯盟鏈的圖書館生成相應的身份標識、身份編號、密鑰體系。(3)圖書館知識管理合約,主要功能是完成圖書館知識的存儲、知識共享等。根據圖書館約定,實現圖書館知識存儲合約、圖書館知識共享合約。圖書館知識存儲合約根據預定的知識存儲規則,對圖書館的知識進行分布式存儲。圖書館知識共享合約根據預定的知識共享規則,對圖書館知識在權限范圍內進行共享。
為實現智能合約的自動化執行,每個智能合約需要包含觸發條件、響應策略、合約執行3個子過程。在觸發條件子過程,每個智能合約的觸發條件是當前智能合約開始執行的基本條件。在響應策略子過程中,每個智能合約根據目的和功能不同,需要執行不同的響應策略。在合約執行子過程,每個智能合約根據合約策略和目標自動執行,并將執行結果返回給事件觸發者。在智能合約開發和部署完成后,每個子過程都會被自動保存和自動執行。
在模型的具體應用機制方面,設計了圖書館的身份注冊流程、圖書館的數據存儲流程、圖書館的數據共享流程。
圖書館申請加入區塊鏈時,需要將其身份注冊到區塊鏈中。在身份注冊時,需要得到n個節點的同意。圖書館的身份注冊包括圖書館發起身份注冊請求、區塊鏈節點發起投票、區塊鏈節點觸發身份注冊合約3個步驟。
步驟1:圖書館向區塊鏈節點發送公鑰信息和身份認證信息。圖書館將加入區塊鏈節點的請求發送到距離其最近的區塊鏈節點,由該區塊鏈節點創建智能投票合約。為保障圖書館身份信息的安全性,在圖書館向區塊鏈節點發送數據時,需要采用非對稱加密算法對身份信息進行加密。在非對稱加密算法中,本文采用的橢圓曲線算法是安全性和執行效率較高的一種。圖書館向區塊鏈節點發送的身份信息包括圖書館的名稱、圖書館的政府批文、圖書館的公鑰信息等。
步驟2:區塊鏈節點創建智能投票合約并收集投票結果。收到圖書館身份注冊請求的區塊鏈節點,使用智能投票合約規則,創建投票活動,并將圖書館相關信息發送給各個區塊鏈節點。收到投票活動請求的區塊鏈節點根據圖書館身份信息,給創建節點反饋投票結果。
步驟3:根據投票結果判斷是否為圖書館創建身份并返回結果。發起投票的區塊鏈節點根據條件判斷是否投票成功。當投票失敗后,不為圖書館創建身份信息。當投票成功后,為圖書館創建身份信息。為了給圖書館創建身份信息,需要調用圖書館身份管理合約,實現圖書館身份信息生成的自動化操作。當圖書館收到身份信息后,就可以實現數據的上傳、存儲、共享等操作。
圖書館的數據存儲流程包括圖書館發送數據存儲請求、區塊鏈實現數據驗證和存儲。
步驟1:圖書館對需要存儲的數據加密后發送數據存儲請求。為保證圖書館數據的安全性,在將數據存儲到區塊鏈時,先對數據進行簽名和加密,再將加密后的數據發送給區塊鏈節點。
步驟2:區塊鏈節點對數據進行驗證和存儲。區塊鏈節點收到數據存儲請求后,首先,對圖書館的身份進行驗證,驗證通過后,再根據圖書館存儲在區塊鏈中的公鑰信息對簽名進行驗證。其次,驗證通過后,調用數據存儲智能合約,為圖書館的數據分配編號并進行存儲。
圖書館獲取區塊鏈上的數據,包括獲取自己存儲的數據、獲取其他圖書館的數據兩種情況。獲取自己存儲的數據主要基于數據簽名和身份認證機制完成,主要包括以下步驟:
步驟1:圖書館發送需要的數據和身份信息到區塊鏈節點。為保證請求信息的安全,圖書館使用自己的私鑰信息將請求數據的編號信息、身份信息進行加密,將加密后的數據請求信息發送到距離自己最近的區塊鏈節點。
步驟2:區塊鏈節點對圖書館身份進行驗證。區塊鏈節點通過存儲在鏈上的圖書館公鑰信息對其身份信息進行驗證。驗證通過后,將數據請求信息和圖書館身份信息發送到數據存儲平臺。
步驟3:數據存儲平臺根據數據請求信息為圖書館返回數據。數據存儲平臺以圖書館提交的數據編號為依據,在數據存儲平臺數據庫中查找相應的數據。如查到相應的數據,將此數據提交返回給圖書館。如未查找到相應的數據,將出錯的原因返回給圖書館。
獲取其他圖書館數據主要采用聯邦學習算法完成數據模型創建,此過程包括以下3個步驟:
步驟1:建立信任關系列表。為簡化數據共享過程,并且保證數據的共享安全,本文提出數據共享信任列表技術。通過為每個圖書館創建一個數據共享信任列表,可以有效簡化數據共享的管理過程。圖書館A需要獲取圖書館B的數據時,需要先將圖書館A增加到圖書館B的信任列表中。在加入之前,圖書館A先將自己的身份信息發送到區塊鏈節點,區塊鏈節點驗證通過后,再將圖書館A的信息發送到圖書館B。此時,圖書館A加入圖書館B的信任列表中。
步驟2:提交數據獲取請求。以圖書館A需要獲取數據為例,為了獲取數據,圖書館A先將數據請求描述提交到區塊鏈節點,區塊鏈節點再將數據請求描述信息發送到數據存儲平臺。數據存儲平臺根據數據描述信息在數據庫中進行查找,并將包含相關數據的圖書館列表發送到區塊鏈節點,最后返回給圖書館A。
步驟3:數據模型訓練。圖書館A判斷是否已在相關圖書館的信任列表中。如不屬于部分圖書館的信任列表中的成員,需要使用步驟1中的信任關系建立步驟進行創建。創建之后,根據數據模型和圖書館數據特征,從橫向聯邦學習、縱向聯邦學習、遷移聯邦學習3種算法中,選擇合適的算法進行數據模型訓練。
下面對本文提出的基于區塊鏈的圖書館數字資源安全共享機制的應用方法進行分析。在使用本文資源共享機制時,可以采用新建平臺和利舊基礎上新建兩種策略。
對于新建平臺策略,最大的優勢是可以提升系統的穩定性。因為數據資源是圖書館最重要的資源,為保證平臺的穩定性和可擴展性,優先選擇此種機制。對于利舊基礎上新建策略,最大的優勢是能夠減少投資,但是容易導致平臺存在不可靠性隱私。為解決此問題,建議將利舊的設備應用在數據存儲冗余部分、圖書館的接入部分,以便最大化地減小利舊設備對平臺帶來的負面影響。
隨著圖書館數字資源的快速增加和大數據技術的廣泛應用,如何保障圖書館數字資源的安全共享,已成為一個急需解決的關鍵問題。為此,本文首先提出基于區塊鏈的圖書館數字資源安全共享模型。其次,基于此模型,提出了基于區塊鏈的圖書館數字資源安全共享機制。最后,給出了數據安全共享模型和機制使用兩種策略。隨著信息技術的快速發展,數字資源快速增加,當前圖書館的硬件平臺和軟件架構已不能適用于大數據場景下的業務需求。下一步工作中,基于本文研究成果,采用云計算技術、大數據技術,研究圖書館的硬件平臺和軟件架構,設計滿足當前及未來一段時間內圖書館數字資源存儲和使用的軟硬件平臺架構。'