999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

融合區(qū)塊鏈技術的機構知識庫科學數(shù)據(jù)監(jiān)護模型研究

2020-07-20 06:41:13師衍輝韓牧哲劉桂鋒
現(xiàn)代情報 2020年1期

師衍輝 韓牧哲 劉桂鋒

摘 要:[目的]建設可長期使用和保存的數(shù)據(jù)監(jiān)護平臺是開展科研數(shù)據(jù)監(jiān)護服務的核心環(huán)節(jié)和關鍵。[方法]文章針對機構知識庫科學數(shù)據(jù)監(jiān)護平臺存在的數(shù)據(jù)規(guī)范性、可信任度、安全性和隱私問題,利用區(qū)塊鏈技術的安全、公正和去中心化等特性,提出融入?yún)^(qū)塊鏈技術的機構知識庫科學數(shù)據(jù)監(jiān)護模型。[結果/結論]本模型能夠?qū)崿F(xiàn)機構知識庫科學數(shù)據(jù)監(jiān)護的基本功能,保障數(shù)據(jù)存儲的安全,提高科學數(shù)據(jù)共享的效率、利用率和知識產(chǎn)權保護力度。

關鍵詞:區(qū)塊鏈;機構知識庫;數(shù)據(jù)監(jiān)護;科學數(shù)據(jù);數(shù)據(jù)管理

DOI:10.3969/j.issn.1008-0821.2020.01.011

〔中圖分類號〕G250.76 〔文獻標識碼〕A 〔文章編號〕1008-0821(2020)01-0101-09

Research on Scientific Data Curation Model of Institutional Knowledge

Repository Integrated with Block Chain Technology

Shi Yanhui1 Han Muzhe2 Liu Guifeng3*

(1.Library,Jiangsu University of Science and Technology,Zhenjiang 212003,China;

2.School of Information Management,Central China Normal University,Wuhan 430079,China;

3.Institute of Science and Technology Information,Jiangsu University,Zhenjiang 212013,China)

Abstract:Building a data curation platform that can be used and saved for a long time is the core link and key of scientific research data curation service.Aiming at scientific data curation platform of institutional repository data standardization,dependability,security and privacy problem,using the block chain technology,such as security,justice and decentralized features,put forward chain technology into blocks of institutional repository of scientific data curation model.This model can realize the basic function of scientific data curation of institutional knowledge base,ensure the security of data storage,and improve the efficiency and utilization rate of scientific data sharing and intellectual property protection.

Key words:block chain;institutional knowledge repository;data curation;scientific data;data management

20世紀90年代開始,開放獲取運動(Open Access,OA)在圖書情報、編輯出版和新聞傳播領域快速興起[1]。這種旨在消除科學數(shù)據(jù)間的價格壁壘和許可壁壘,促進科學數(shù)據(jù)共享和廣泛使用的倡議很快獲得了廣泛關注。在開放獲取理念的倡導下,國內(nèi)外的高校和科研機構紛紛將機構知識庫的建設作為其科研信息服務的重點。設立機構知識庫的初衷主要是為實現(xiàn)兩點:其一是實現(xiàn)機構知識庫中科研成果的開放獲取,打破傳統(tǒng)的數(shù)據(jù)共享壁壘,促進知識的交流和再生產(chǎn);其二是可以長期保存建設機構的科研成果,提升機構的學術影響力和成果展示度,彰顯機構的學術聲望、學術水平和社會價值[2]。

機構知識庫在被提出來后發(fā)展迅速,但是在廣泛關注和快速發(fā)展的背后,機構知識庫的建設和應用也遇到了一些問題:一方面,承擔機構知識庫建設的高校和科研機構容易受制于自身知識資源儲備、專業(yè)人才儲備和資金及技術上的制約,服務范圍面向單一機構本身容易限制機構知識庫的可持續(xù)發(fā)展;另一方面機構知識庫與傳統(tǒng)的學科庫相比,用戶認知度和用戶參與度都并不理想,這主要是由于機構知識庫定位模糊而且服務理念尚不完善所致。針對這兩方面問題,需要由圖書館員通過協(xié)助學者完善數(shù)據(jù)和元數(shù)據(jù)來促進共享,積極幫助形成向各自領域的學科庫發(fā)布數(shù)據(jù)成果,建設可長期使用和保存的數(shù)據(jù)監(jiān)護平臺[3]。

當前數(shù)據(jù)監(jiān)護平臺在數(shù)據(jù)組織的持續(xù)性和可擴展性方面存在不足,存儲數(shù)據(jù)遭到破壞、更改、泄露或丟失風險[4],數(shù)據(jù)內(nèi)容揭示與服務方式深讀不夠[5],數(shù)據(jù)的異構性與數(shù)據(jù)格式標準化技術之間矛盾突出[6]等多種懸而未決的實際問題,方興未艾的區(qū)塊鏈技術則因其安全、公正、去中心化等特性為以上問題提供了一個可能的解決方案。本文嘗試將雙鏈式區(qū)塊鏈技術的相關思想融合到數(shù)據(jù)監(jiān)護服務中,并提出相應的模型架構,以此為未來的數(shù)據(jù)監(jiān)護服務開展提供思路。

1 區(qū)塊鏈技術理論基礎及構建機構知識庫科學數(shù)據(jù)監(jiān)護模型的可行性

1.1 區(qū)塊鏈技術理論基礎

區(qū)塊鏈(Blockchain)是由多個獨立節(jié)點參與的分布式數(shù)據(jù)庫系統(tǒng),也可理解為由這些獨立節(jié)點共同維護的分布式賬簿(DLT,Distributed Ledger Technology),這是一種基于去中心化、去信任思想的數(shù)據(jù)記錄方式。由此延伸可知區(qū)塊鏈技術是一種不依賴任何第三方、通過自身分布式節(jié)點進行數(shù)據(jù)交互、驗證、存儲的技術方案[7]。

區(qū)塊鏈技術之所以備受矚目,很大程度上是因為這種技術方案從根本上改變了人們的信任模式。傳統(tǒng)的信息交流和價值交換過程必須通過中介進行,中介作為信息交流和價值交換中的第三方,為網(wǎng)絡中互不信任的各個節(jié)點搭建橋梁,信息和價值被集中至中心節(jié)點,再由中心節(jié)點甄別后分配給目標節(jié)點。這種中心化的組織形式為信息和價值的交流活動增加了成本、降低了效率,且中心節(jié)點一旦遭受攻擊,就將會威脅到整個網(wǎng)絡的安全。而區(qū)塊鏈技術則提供了一種無需信任單個節(jié)點,并能創(chuàng)建共識網(wǎng)絡的方法解決了點對點通信中的基本問題,即拜占庭將軍問題(Byzantine Failures)。

區(qū)塊鏈的工作原理(見圖1)是將數(shù)據(jù)分成不同的區(qū)塊(Block),每個區(qū)塊的塊身(Body)存儲項目(Item),塊頭(Header)包含對前一區(qū)塊的塊頭進行哈希函數(shù)(Hash Function)計算所得到的哈希值,各個區(qū)塊之間都由其塊頭的哈希值與先前的區(qū)塊緊密相連成為一個鏈條(Chain)[8]。

圖1 區(qū)塊鏈工作原理示意圖

這種塊鏈結構是完全時序的,每一個區(qū)塊在創(chuàng)建之時都會被賦予一個無法篡改和偽造的時間戳,這使得整個數(shù)據(jù)庫擁有可回溯的完整歷史;網(wǎng)絡中的每個節(jié)點獨立作業(yè),它們享有同樣的權利和義務,這保證了網(wǎng)絡中絕不存在有特殊權力的中心節(jié)點,真正實現(xiàn)了去中心化;整個網(wǎng)絡中的所有數(shù)據(jù)都是開放的,所有節(jié)點都存儲著相同的信息,同時它們也在監(jiān)督和驗證其他節(jié)點所存儲信息的可靠性,并通過投票形成共識網(wǎng)絡,當網(wǎng)絡中少于1/3的節(jié)點惡意作弊或遭到攻擊時,系統(tǒng)仍然可以正常工作,這種分布式記錄、傳播和存儲技術為網(wǎng)絡構建了高容錯的安全環(huán)境。區(qū)塊鏈技術的上述關鍵要素和特性使得它在數(shù)字貨幣和金融領域異彩紛呈,而在本文著重探討的科學數(shù)據(jù)監(jiān)護服務領域,區(qū)塊鏈的上述特性也能夠幫助解決科學數(shù)據(jù)的組織、共享、保存、增值以及涉及知識產(chǎn)權保護和信息安全的相關問題。

1.2 區(qū)塊鏈技術構建機構知識庫科學數(shù)據(jù)監(jiān)護模型的可行性

目前,機構數(shù)據(jù)庫建設成為高校圖書館管理和服務模式創(chuàng)新的重要領域,功能完備的機構知識庫可以不斷擴展圖書館資源,提供專業(yè)的科學數(shù)據(jù)管理和知識共享服務。運用機構知識庫進行數(shù)據(jù)監(jiān)護在取得明顯成績的同時也存在很多問題。主要體現(xiàn)在各部門、各科研人員所提交的科學數(shù)據(jù)組織規(guī)范性不夠,數(shù)據(jù)提交質(zhì)量參差不齊[9],科學數(shù)據(jù)間互聯(lián)互通困難,信息共享和協(xié)同困難;存在中心化困擾,大多數(shù)機構知識庫由單一機構中心化管理,若數(shù)據(jù)被篡改,用戶無法驗證真實性[10];缺乏對數(shù)據(jù)內(nèi)容深度標引,無法為科學研究者提供一站式檢索服務;知識庫建設和管理過程中,存在安全性和隱私問題,知識產(chǎn)權問題亟需得到保障[11]。

區(qū)塊鏈技術對解決機構數(shù)據(jù)庫中存在的問題具有可行性。作為由多個獨立節(jié)點參與的分布式數(shù)據(jù)庫系統(tǒng),區(qū)塊鏈本身就是一種數(shù)據(jù)庫技術,它的應用、存儲對象和技術要素本身與機構知識庫就是相同的。科學數(shù)據(jù)具有數(shù)據(jù)的生命周期,區(qū)塊鏈技術的時間鏈特性也完全匹配這一期望,可見用區(qū)塊鏈技術解決機構知識庫科學數(shù)據(jù)監(jiān)護中存在的問題是完全可行的[12]。

融合區(qū)塊鏈技術構建機構知識庫科學數(shù)據(jù)監(jiān)護模型具有以下優(yōu)勢。一是區(qū)塊鏈去中心化的特點,能夠使構建的機構知識庫平臺更具安全性和可信任度,使收集的科研數(shù)據(jù)更加準確規(guī)范。二是區(qū)塊鏈技術中的分布式賬本、塊鏈式數(shù)據(jù)結構、非對稱性加密算法和智能合約的技術,能保證機構數(shù)據(jù)庫中的科學數(shù)據(jù)不可篡改,為保障機構數(shù)據(jù)庫中的數(shù)據(jù)存儲安全提供保障。三是區(qū)塊鏈技術的去中心化,使得網(wǎng)絡中的信息傳播速度和資源利用效率大大提高,可以為用戶一站式檢索和使用提供極大方便。四是運用區(qū)塊鏈中的全民記賬和非對稱加密算法,可以對上傳科學數(shù)據(jù)的用戶提供知識產(chǎn)權保護,只有得到用戶提供者解密許可才能下載使用信息,數(shù)據(jù)安全性和隱私問題能夠得到解決。因此,下文就結合區(qū)塊鏈的基本思想對機構知識庫科學數(shù)據(jù)監(jiān)護模型的功能需求及工作原理進行闡述。

2 科學數(shù)據(jù)監(jiān)護模型的功能需求

以機構知識庫為基礎的科學數(shù)據(jù)監(jiān)護服務需要按照特定的目標、遵循特定的流程、設置相應的功能,再根據(jù)功能需求設定功能模塊和層次架構,并進一步闡述模型的工作原理和過程。

一個完整的科學數(shù)據(jù)監(jiān)護平臺應涉及數(shù)據(jù)生命周期的各個環(huán)節(jié),涵蓋從數(shù)據(jù)產(chǎn)生之初到數(shù)據(jù)存儲、數(shù)據(jù)利用的循環(huán)過程。英國數(shù)據(jù)監(jiān)護中心(DCC,Digital Curation Centre)提出的數(shù)據(jù)監(jiān)護模型從全局上將數(shù)據(jù)生命周期劃分為4個階段,分別為信息描述和表示、數(shù)據(jù)保存計劃、組織觀察和參與、數(shù)據(jù)監(jiān)護和保存;并提出了數(shù)據(jù)監(jiān)護服務的一般工作和具體工作,涉及數(shù)據(jù)生產(chǎn)、數(shù)據(jù)組織、數(shù)據(jù)共享、數(shù)據(jù)存儲等多個環(huán)節(jié),其服務范圍遍及從科研項目構思到科研成果利用的整個循環(huán)過程[13]。

參照DCC的流程劃分和功能設定,本文將科學數(shù)據(jù)監(jiān)護劃分為數(shù)據(jù)采集與評價、數(shù)據(jù)組織與處理、數(shù)據(jù)存儲與發(fā)布、數(shù)據(jù)共享與利用四大基本功能,其中的每一項都可以進一步詳細劃分為幾個相互關聯(lián)的具體功能,融合雙鏈式區(qū)塊鏈技術的相關原理,將能夠?qū)崿F(xiàn)特定功能的基本模塊按照工作流程有機整合,即可獲得整體的科學數(shù)據(jù)監(jiān)護模型。本文所構建的科學數(shù)據(jù)監(jiān)護模型擬具備的具體功能如表1所示。

3 融合區(qū)塊鏈技術的科學數(shù)據(jù)監(jiān)護模型的構建及功能闡述

服務項目,它會在其原有的服務理念范疇內(nèi)不斷融合新的技術,以實現(xiàn)對科學數(shù)據(jù)更好地保存、共享和增值。以上四大基本功能和15種具體功能,需要依靠融合了各種技術的不同功能模塊加以實現(xiàn),其中許多環(huán)節(jié)在現(xiàn)實中已經(jīng)有較為成功的實踐案例。因而本文在之后的模型構建環(huán)節(jié),將著重從總體上闡釋雙鏈式區(qū)塊鏈技術在面向機構知識庫或機構知識庫聯(lián)盟的科學數(shù)據(jù)監(jiān)護服務中的作用方式,較大程度上保持科學數(shù)據(jù)監(jiān)護平臺在具體功能選擇上的靈活性和可擴展性。

3.1 模型整體架構

融合區(qū)塊鏈技術的機構知識庫科學數(shù)據(jù)監(jiān)護模型是針對機構知識庫聯(lián)盟構建的,結合上述科學數(shù)據(jù)監(jiān)護的相關功能和區(qū)塊鏈技術的相關特點,可以將模型從整體上分為3個層次,分別是上層的用戶界面、中間的機構設置、下層的聯(lián)盟設置。3個層次的設置分別為:

1)用戶界面。用戶界面向服務范圍內(nèi)的所有用戶提供交互平臺,支持PC端和移動終端互操作,可以同時提供網(wǎng)頁版本和App應用兩種形式的用戶界面,并開發(fā)可以嵌入其他常用開源軟件的API平臺。用戶界面的作用主要是指導用戶按照要求提交、獲取和使用科學數(shù)據(jù),并提供相應的接口。當前的用戶界面具有5種基本功能,并可以根據(jù)具體需求進行增減。

2)機構設置。以高校和科研院所圖書館、信息中心為主的成員機構是機構知識庫聯(lián)盟的主體,同時也是數(shù)據(jù)監(jiān)護服務的主要倡導者和執(zhí)行者,高校圖書館和信息中心從硬件設施、人員配置、專業(yè)基礎方面都可以為數(shù)據(jù)監(jiān)護服務工作開展的提供保障和平臺[14]。機構知識庫聯(lián)盟的成員機構可以在相對統(tǒng)一的技術框架內(nèi),遵循一定的數(shù)據(jù)存儲協(xié)議分別建立自身的數(shù)據(jù)組織平臺和數(shù)據(jù)倉儲,并能夠按照相應的數(shù)據(jù)共享協(xié)議向聯(lián)盟中的其他成員進行數(shù)據(jù)共享。機構設置層主要是負責數(shù)據(jù)監(jiān)護中的數(shù)據(jù)采集與評價、數(shù)據(jù)描述與處理兩個方面的功能,這兩方面功能的實現(xiàn)主要利用信息采集、信息檢索、知識組織、數(shù)據(jù)挖掘、計量分析和可視化方法完成的。

3)聯(lián)盟設置。機構知識庫聯(lián)盟的數(shù)據(jù)監(jiān)護平臺是區(qū)塊鏈的運行層,內(nèi)設區(qū)塊鏈授時服務器、3個相互獨立且能通過連接件同步狀態(tài)的區(qū)塊鏈、以及可以通過指令調(diào)用的分布式倉儲服務器。聯(lián)盟設置中的區(qū)塊鏈系統(tǒng)是本文所提出數(shù)據(jù)監(jiān)護模型與傳統(tǒng)模型的核心區(qū)別,這一設計旨在摒棄以傳統(tǒng)的數(shù)據(jù)庫管理系統(tǒng)為依托所帶來的各種弊端,融合區(qū)塊鏈技術構建一種效率更高、更加安全且具有法律效力的數(shù)據(jù)監(jiān)護平臺。

以目前占主流的分布式機構知識庫聯(lián)盟為例,各個成員機構的圖書館和信息中心通常都擁有一定的數(shù)據(jù)存儲和組織能力,并可以擁有進行數(shù)據(jù)發(fā)布和獲取的門戶,因此,可以為機構知識庫聯(lián)盟的成員機構建立賬戶區(qū)塊鏈(ABC)。但是對于同一個機構而言,它既可以是數(shù)據(jù)的發(fā)布方,也可以是數(shù)據(jù)的使用方,以這種方式可以將每一個成員機構按照其所扮演角色的不同分別建立兩條獨立的ABC:數(shù)據(jù)發(fā)布時的賬戶區(qū)塊鏈ABC-S,數(shù)據(jù)使用時的賬戶區(qū)塊鏈ABC-U。之所以進行采用設計,一方面是為了負載平衡,另一方面同一機構內(nèi)部的用戶對自身數(shù)據(jù)資源的維護和利用也可以得到清晰獨立地展現(xiàn)。ABC只負責查詢、保存賬目、建塊,并不執(zhí)行交易。模型中的兩條ABC分別用于存儲各個成員機構所發(fā)布和使用的數(shù)據(jù),并根據(jù)用戶操作建塊(對科學數(shù)據(jù)的發(fā)布、刪除、維護、更新),實時進行狀態(tài)更新,確保所存儲的數(shù)據(jù)不被篡改。

機構之間或機構用戶內(nèi)部對數(shù)據(jù)資源的訪問、下載、引用、維護都可以視為交易行為,這種“交易行為”并不是傳統(tǒng)意義上的貨幣交易,但是科學數(shù)據(jù)作為信息資源,對其分享和利用本身也屬于一種價值交換行為,使用者需要遵循相應的使用條件獲取數(shù)據(jù),并履行相應的義務,而數(shù)據(jù)發(fā)布者則可因此獲得業(yè)界聲望、同行評議、合作機會甚至經(jīng)濟利益,所以這種價值交換行為也可視作交易行為。在區(qū)塊鏈的架構中,交易行為是由TBC執(zhí)行的,它是交易和結算的通道,它不保存交易雙方的賬戶信息,只負責建塊和執(zhí)行交易。在科學數(shù)據(jù)監(jiān)護服務中,對科學數(shù)據(jù)的訪問、下載、引用、維護等不同的交易行為都可以在鏈上代碼或應用系統(tǒng)中完成,TBC負責響應用戶請求,根據(jù)用戶指令建塊,自動執(zhí)行交易行為(對科學數(shù)據(jù)的訪問、下載、引用進行授權)、驗證支付(廣播使用記錄并保證ABC信息同步)、保存交易記錄并將交易后狀態(tài)實時同步到ABC中,并通過賬戶服務器展現(xiàn)給用戶[15]。

3.2 數(shù)據(jù)存儲與訪問控制

3.2.1 數(shù)據(jù)存儲

為統(tǒng)一機構知識庫聯(lián)盟中各成員機構的數(shù)據(jù)存儲方式,以便于快捷完成數(shù)據(jù)檢索和利用,本數(shù)據(jù)監(jiān)護模型采用鏈下存儲方式,鏈上只存儲數(shù)據(jù)地址,原數(shù)據(jù)經(jīng)過加密后存儲在底層數(shù)據(jù)庫,由各成員機構維護。當數(shù)據(jù)達到閾值后,成員機構將數(shù)據(jù)經(jīng)過對稱加密后存放至底層數(shù)據(jù)庫,同時將數(shù)據(jù)的輸入時間戳、區(qū)塊長度及前一個區(qū)塊的哈希值作為區(qū)塊頭,根據(jù)訪問控制樹將數(shù)據(jù)位置索引、明文形式的訪問控制策略和數(shù)據(jù)Merkle根加密后打包成塊,存儲至區(qū)塊體中,其后上傳至數(shù)據(jù)倉庫中[16]。其數(shù)據(jù)存儲結構如圖3所示。

3.2.2 訪問控制

1)初始化:機構知識庫聯(lián)盟的數(shù)據(jù)監(jiān)護平臺設置統(tǒng)一的安全參數(shù),由數(shù)據(jù)監(jiān)護中心CA執(zhí)行產(chǎn)生主密鑰mk和公共參數(shù)pp。

2)身份注冊:通過用戶界面向模型第二層次機構設置提出注冊申請,獲取其真實身份對應的標識UID及屬性集合SU。

3)密鑰分發(fā):按照密鑰分發(fā)算法KeyGen(mk,Su),CA根據(jù)注冊者屬性集U∈SU,計算其屬性私鑰、屬性參數(shù),并由此計算出使用者的私鑰SK,將其通過安全信道發(fā)送給使用者保存。

區(qū)塊頭區(qū)塊體時間戳區(qū)塊長度父區(qū)塊Hash值數(shù)據(jù)1存儲位置索引數(shù)據(jù)1的訪問策略數(shù)據(jù)Merkle根數(shù)據(jù)2存儲位置索引數(shù)據(jù)2的訪問策略數(shù)據(jù)Merkle根數(shù)據(jù)3存儲位置索引數(shù)據(jù)3的訪問策略數(shù)據(jù)Merkle根………圖3 區(qū)塊體存儲結構

4)加密數(shù)據(jù):數(shù)據(jù)文件需經(jīng)過文件初篩、質(zhì)量評價、文件分類生成文件元數(shù)據(jù)和語義元數(shù)據(jù),所有數(shù)據(jù)文件需遵循一定的數(shù)據(jù)關聯(lián)規(guī)則從而保證科學數(shù)據(jù)的組織規(guī)范。為保證數(shù)據(jù)存儲安全,數(shù)據(jù)上傳者可根據(jù)訪問者的屬性對數(shù)據(jù)制定訪問控制策略樹StrGen(Su)→Tcom,隨機生成對稱加密密鑰rs,數(shù)據(jù)經(jīng)過對稱加密計算后放入機構數(shù)據(jù)庫聯(lián)盟分布式倉儲的底層數(shù)據(jù)庫中,對稱加密算法可以表示為

SEncrs((d1,d2,d3,…,dn))→cph

5)數(shù)據(jù)上傳:機構數(shù)據(jù)庫聯(lián)盟中,各個成員機構的圖書館和信息中心擁有進行數(shù)據(jù)發(fā)布和獲取的門戶,用戶通過成員機構數(shù)據(jù)發(fā)布時的賬戶區(qū)塊鏈ABC-S向聯(lián)盟上傳數(shù)據(jù)。各成員機構間的區(qū)塊鏈節(jié)點根據(jù)訪問控制策略樹對數(shù)據(jù)索引地址add、對稱加密密鑰rs進行加密,并將其廣播至區(qū)塊鏈。同時節(jié)點生成該數(shù)據(jù)索引id與鏈上數(shù)據(jù)的映射,將其放入底層數(shù)據(jù)庫。

AddGen(cph)→add

SEncCOM(add,rs)→CPH

6)訪問密文:訪問者根據(jù)數(shù)據(jù)索引id在成員機構數(shù)據(jù)使用時的賬戶區(qū)塊鏈ABC-U上查得該數(shù)據(jù)的地址與對稱加密密鑰。若該訪問者沒有權限訪問此數(shù)據(jù),則無法得到密鑰rs,無法對索引地址進行解密,也就無法訪問原數(shù)據(jù)。若該訪問者屬性滿足訪問控制策略,則其可以解密得到地址add與密鑰rs,然后系統(tǒng)通過TBC響應用戶請求,將檢索到的數(shù)據(jù)副本位置信息反饋給用戶,用戶至機構數(shù)據(jù)庫聯(lián)盟分布式倉儲的底層數(shù)據(jù)庫訪問該數(shù)據(jù)[17]。

3.3 數(shù)據(jù)監(jiān)護模型的功能闡述

除上文中所述的數(shù)據(jù)監(jiān)護四大基本功能以外,科學數(shù)據(jù)監(jiān)護模型還要具備用戶管理和用戶服務功能,本節(jié)從過程角度對這5種功能及其所對應的模型中的各個部分進行展開。

3.3.1 用戶管理與服務功能

1)用戶界面—“用戶注冊/登錄”界面:提供用戶管理功能的交互平臺,按照用戶元數(shù)據(jù)標準提供用戶信息采集接口,采集用戶注冊時提供的信息并上傳至用戶數(shù)據(jù)庫,在用戶嘗試登錄系統(tǒng)時驗證其訪問權限。

上傳信息供機構設置—“用戶信息數(shù)據(jù)庫”模塊繼承。

2)機構設置—“用戶信息數(shù)據(jù)庫”模塊:制定用戶元數(shù)據(jù)標準(聯(lián)盟標準用戶元數(shù)據(jù)選項+機構擴展用戶元數(shù)據(jù)選項);接收并響應由“用戶注冊/登錄”界面上傳的信息和請求,對用戶信息進行審核、管理、驗證;按照機構元數(shù)據(jù)標準(聯(lián)盟標準機構元數(shù)據(jù))和聯(lián)盟標準用戶元數(shù)據(jù)選項向聯(lián)盟共享本機構及注冊用戶信息。

共享信息供聯(lián)盟設置—“區(qū)塊鏈”平臺繼承。

3.3.2 數(shù)據(jù)采集與評價功能

1)用戶界面—“文件上傳/數(shù)據(jù)維護”界面:為上傳文件、項目信息以及其他附加信息提供接口,引導用戶按照文件用途、類型、格式對文件進行分類上傳,并對上傳文件的形式、格式、規(guī)模進行初步審查,對成功上傳的文件添加時間標記和用戶信息標記。

上傳信息供機構設置—“文件初篩”模塊繼承。

2)機構設置—“文件初篩”模塊:接收并響應“文件上傳/數(shù)據(jù)維護”界面上傳的信息和請求,審查新上傳數(shù)據(jù)的可讀取性、完整性、規(guī)范性,與數(shù)據(jù)庫中的既有數(shù)據(jù)內(nèi)容進行重合比率檢測,篩查所上傳數(shù)據(jù)的合法性;對未通過篩查的數(shù)據(jù)進行攔截,并向提供者反饋,通過篩查的數(shù)據(jù)將進入質(zhì)量評價程序。

上傳信息供機構設置—“文件質(zhì)量評價”模塊繼承。

3)機構設置—“文件質(zhì)量評價”模塊:接收“文件初篩”模塊上傳的信息,由機構內(nèi)相應的數(shù)據(jù)監(jiān)護人員協(xié)助作者或項目負責人對文件中科研成果的成熟度、數(shù)據(jù)內(nèi)容的新穎性和學術價值進行質(zhì)量評價,制定相應的數(shù)據(jù)管理計劃,選擇合適的數(shù)據(jù)共享和存儲策略;通過質(zhì)量評價的文件將按照其管理計劃進行備份、歸檔,分配文件編號,在索引列表中創(chuàng)建文件索引條目。

上傳信息供機構設置—“文件分類”模塊繼承;生成信息供機構設置—“文件描述”模塊、“搜索引擎”模塊和聯(lián)盟設置—“機構數(shù)據(jù)集倉儲”模塊繼承。

3.3.3 數(shù)據(jù)組織與處理功能

1)機構設置—“文件分類”模塊:接收“文件質(zhì)量評價”模塊上傳的信息,按照文件中數(shù)據(jù)的用途、形式、成熟度、開放程度進行分類,為不同類型的數(shù)據(jù)分別匹配相應的數(shù)據(jù)組織策略;按照數(shù)據(jù)類型所對應的文件格式標準進行格式轉換,使其保存為方便存儲的通用文件格式。

生成信息供機構設置—“文件描述”模塊和聯(lián)盟設置—“機構數(shù)據(jù)集倉儲”模塊繼承。

2)機構設置—“文件描述”模塊:按照文件及其所包含數(shù)據(jù)的不同分類,選取或制定相應的元數(shù)據(jù)標準,并向聯(lián)盟成員共享。接收“文件質(zhì)量評價”模塊和“文件分類”模塊生成的信息,進行文件描述,這部分工作可分為文件信息描述和內(nèi)容信息描述兩部分:前者按照文獻編目規(guī)則描述文件外部信息,生成文件元數(shù)據(jù);后者按照數(shù)據(jù)關聯(lián)規(guī)則對文件中的數(shù)據(jù)內(nèi)容進行知識元提取和語義關聯(lián)組織,生成語義元數(shù)據(jù),為數(shù)據(jù)共享和利用工作提供便利。

生成信息供機構設置—“搜索引擎”模塊和聯(lián)盟設置—“區(qū)塊鏈”平臺、“機構數(shù)據(jù)集倉儲”模塊繼承。

3.3.4 數(shù)據(jù)存儲與發(fā)布功能

1)聯(lián)盟設置—“機構數(shù)據(jù)集倉儲”模塊:遵循“文件質(zhì)量評價”模塊確定的數(shù)據(jù)存儲策略為從“文件分類”模塊接收的標準文件和索引文件匹配相應的數(shù)據(jù)存儲計劃,設定數(shù)據(jù)保存期和數(shù)據(jù)備份計劃;參照“文件描述”模塊的文件和語義元數(shù)據(jù)標準分別在本地構建文件倉儲和語義數(shù)據(jù)集,兩個數(shù)據(jù)集通過設定的數(shù)據(jù)關聯(lián)規(guī)則進行關聯(lián)。

機構數(shù)據(jù)集倉儲是聯(lián)盟中各成員機構的本地倉儲,其中向聯(lián)盟共享的部分需要遵循聯(lián)盟統(tǒng)一的元數(shù)據(jù)標準進行組織和存儲,并能通過一定的數(shù)據(jù)共享協(xié)議遠程調(diào)用;其他非共享數(shù)據(jù)可以由成員機構自行設定組織和存儲策略。

2)聯(lián)盟設置—“分布式倉儲聯(lián)盟”模塊:該模塊實際上是按照機構知識庫聯(lián)盟的數(shù)據(jù)共享協(xié)議構建的聯(lián)盟分布式存儲平臺,它將各成員機構所構建的本地數(shù)據(jù)倉儲中的共享部分按照相對統(tǒng)一的數(shù)據(jù)組織標準、數(shù)據(jù)存儲協(xié)議、數(shù)據(jù)共享協(xié)議、數(shù)據(jù)訪問與傳輸協(xié)議整合成一個整體的分布式數(shù)據(jù)倉儲聯(lián)盟[18]。

分布式數(shù)據(jù)倉儲聯(lián)盟本身可以不提供存儲空間,其主要職責是對聯(lián)盟成員的所存儲的數(shù)據(jù)資源進行統(tǒng)籌和協(xié)調(diào),制定、接收并更新面向聯(lián)盟成員的數(shù)據(jù)組織和存儲規(guī)范,優(yōu)化成員機構的數(shù)據(jù)存儲結構,并在必要的情況下對各成員機構的數(shù)據(jù)存儲任務進行協(xié)調(diào),促使整個機構知識庫聯(lián)盟的存儲能力最大化。

3)機構設置—“數(shù)據(jù)發(fā)布”模塊:協(xié)助作者或項目負責人按照數(shù)據(jù)共享策略對上傳的數(shù)據(jù)資源進行發(fā)布,為其后的數(shù)據(jù)共享和利用做準備。數(shù)據(jù)共享策略中所嵌入的基本問題主要包括對于指定的數(shù)據(jù)資源,是否保密(保密級別、保密期限、保密范圍)、是否向聯(lián)盟內(nèi)部共享、是否共享全文(共享全文內(nèi)容、共享部分內(nèi)容、僅共享題錄)、是否向聯(lián)盟外部共享(其他機構知識庫或機構庫聯(lián)盟、外部學科庫)、是否發(fā)布為關聯(lián)數(shù)據(jù)等。

3.3.5 數(shù)據(jù)共享與利用功能

1)用戶界面—“信息檢索”界面:提供信息資源接口,接收“搜索引擎”模塊的檢索結果并向用戶反饋,提供多樣化、多語種、可限定范圍的檢索窗口,對于公開資源可以嵌入第三方搜索引擎的檢索界面和檢索功能。

上傳信息供機構設置—“搜索引擎”模塊繼承。

2)機構設置—“搜索引擎”模塊:接收并響應“信息檢索”界面上傳的用戶請求,調(diào)用聯(lián)盟共享的文獻索引和元數(shù)據(jù)倉儲,定位已發(fā)布的數(shù)據(jù)資源,向“分布式倉儲聯(lián)盟”提出數(shù)據(jù)請求,并將檢索結果展現(xiàn)給用戶。

生成信息供用戶界面—“信息檢索”界面、“數(shù)據(jù)訪問與下載”界面繼承。

3)用戶界面—“數(shù)據(jù)訪問與下載”界面:為用戶提供數(shù)據(jù)獲取門戶,支持對數(shù)據(jù)資源的線上瀏覽、使用、獲取,按照共享協(xié)議和用戶權限向用戶呈現(xiàn)相關的訪問和下載條件。根據(jù)“搜索引擎”所提供的數(shù)字資源定位信息,生成相應的數(shù)據(jù)訪問和下載鏈接,并按照用戶的信息需求和獲取權限向用戶呈現(xiàn)。

這一界面僅是與用戶進行信息交換的門戶,具體的數(shù)據(jù)資源共享過程由聯(lián)盟設置—“區(qū)塊鏈”平臺完成。

4)聯(lián)盟設置—“區(qū)塊鏈”平臺:區(qū)塊鏈平臺是在整個模型中充當信息樞紐,數(shù)據(jù)的上傳、存儲、更新、共享、獲取、利用的各個環(huán)節(jié)中所存在的信息交換都會以區(qū)塊鏈的方式來完成。因此,區(qū)塊鏈平臺實際上是多功能的。

5)機構設置—“統(tǒng)計分析與可視化”模塊:科學數(shù)據(jù)監(jiān)護模型可以采集數(shù)據(jù)生命周期內(nèi)的所有開放動態(tài)進行統(tǒng)計分析,并進行可視化展示,方便科研工作者對學術動態(tài)進行真實的掌握,從而促進科學數(shù)據(jù)的進一步共享和利用。用戶界面—“統(tǒng)計分析”界面是該模塊的用戶終端門戶。

4 結 語

相比于傳統(tǒng)的數(shù)據(jù)監(jiān)護模型,本研究所建立的模型通過融合雙鏈式區(qū)塊鏈技術,實現(xiàn)了用戶管理與服務、數(shù)據(jù)采集與評價、數(shù)據(jù)組織與處理、數(shù)據(jù)存儲與發(fā)布、數(shù)據(jù)共享與利用五大基本功能,完整的實現(xiàn)了機構知識庫科學數(shù)據(jù)監(jiān)護和管理的整個流程,解決了知識庫中不同機構、用戶和標準間的協(xié)調(diào)問題,以及面對用戶需求并發(fā)帶來的計算量激增和數(shù)據(jù)傳輸存儲安全問題。

這種融合雙鏈式區(qū)塊鏈技術的數(shù)據(jù)監(jiān)護模型可以實現(xiàn)科學數(shù)據(jù)自助、及時、安全的共享,在整個過程中完全可以在無需聯(lián)盟監(jiān)視和代理的情況下對用戶需求做出全天候及時響應,不僅極大地提高了數(shù)據(jù)共享的效率和利用率,也能夠通過區(qū)塊鏈技術不可篡改的時間戳和智能合約保證數(shù)據(jù)共享的安全性和知識產(chǎn)權保護。

參考文獻

[1]鐘源.我國圖書情報類期刊開放存取現(xiàn)狀調(diào)查分析[J].數(shù)字圖書館論壇,2015,(11):64-68.

[2]黃筱瑾,黃扶敏,王倩.我國機構知識庫聯(lián)盟發(fā)展現(xiàn)狀及比較研究[J].圖書館學研究,2014,(12):92-97.

[3]楊鶴林.從數(shù)據(jù)監(jiān)護看美國高校圖書館的機構庫建設新思路——來自DataStaR的啟示[J].大學圖書館學報,2012,(2):23-28.

[4]封潔,司莉.高校科研數(shù)據(jù)機構庫聯(lián)盟運行風險調(diào)查分析[J].圖書館,2019,(3):58-62,68.

[5]司莉,陳玄凝.科研數(shù)據(jù)機構庫建設現(xiàn)狀的調(diào)查分析[J].圖書館,2017,(4):6-11.

[6]程結晶,劉佳美,楊起虹.基于耗散結構理論的科研數(shù)據(jù)管理系統(tǒng)概念模型及運行策略[J].現(xiàn)代情報,2018,38(1):31-36.

[7]陳曉靜.基于區(qū)塊鏈的政務大數(shù)據(jù)平臺設計探索[J].信息系統(tǒng)工程,2018,(4):127-128.

[8]蔡維德,郁蓮,王榮,等.基于區(qū)塊鏈的應用系統(tǒng)開發(fā)方法研究[J].軟件學報,2017,(6):1474-1487.

[9]司莉,曾粵亮.機構科研數(shù)據(jù)知識庫聯(lián)盟數(shù)據(jù)治理框架研究[J].圖書館論壇,2018,38(8):61-67.

[10]焦通,申德榮,聶鐵錚,等.區(qū)塊鏈數(shù)據(jù)庫:一種可查詢且防篡改的數(shù)據(jù)庫[J/OL].軟件學報:1-15.https://doi.org/10.13328/j.cnki.jos.005776,2019-04-26.

[11]劉桂鋒,濮靜蓉,錢錦琳.科研數(shù)據(jù)共享影響因素分析及作用闡釋[J].圖書館論壇,2018,38(11):10-17,26.

[12]呂方婷.區(qū)塊鏈技術在機構知識庫中的應用研究[J].圖書館工作與研究,2019,(4):70-73.

[13]曹冉,王瓊,耿騫,等.數(shù)據(jù)監(jiān)護人才需求驅(qū)動的教育教學變革研究[J].大學圖書館學報,2017,(2):81-87.

[14]周淑云,伍丹.基于信息生命周期的高校圖書館數(shù)據(jù)監(jiān)護流程分析[J].山東圖書館學刊,2016,(3):26-29.

[15]蔡維德,郁蓮,王榮,等.基于區(qū)塊鏈的應用系統(tǒng)開發(fā)方法研究[J].軟件學報,2017,(6):1474-1487.

[16]王秀利,江曉舟,李洋,等.一種應用區(qū)塊鏈的數(shù)據(jù)訪問控制與共享模型[J/OL].軟件學報:1-9.https://doi.org/10.13328/j.cnki.jos.005742,2019-06-16.

[17]周耀.區(qū)塊鏈技術在智慧圖書館中的應用研究[J].現(xiàn)代情報,2019,39(4):94-102.

[18]陳美華,劉文云,畢煜,等.美國機構知識庫聯(lián)盟的建設研究及對我國的啟示[J].圖書館,2015,(11):59-64.

(責任編輯:郭沫含)

主站蜘蛛池模板: 免费毛片视频| 午夜a级毛片| 亚洲激情区| 国产自在线播放| 女同国产精品一区二区| 久久婷婷综合色一区二区| 日本免费a视频| 国产成人午夜福利免费无码r| 91久久天天躁狠狠躁夜夜| 亚洲高清无在码在线无弹窗| 99re免费视频| 亚洲综合经典在线一区二区| 91精品国产一区| 国产精品女在线观看| 精品国产免费人成在线观看| 91小视频在线观看| 欧美日韩va| 在线精品自拍| 高清久久精品亚洲日韩Av| yjizz视频最新网站在线| 久久久久人妻精品一区三寸蜜桃| 中文字幕免费视频| 国产成人亚洲精品无码电影| 熟妇丰满人妻| 制服丝袜国产精品| 国产精品3p视频| 亚洲精品第一在线观看视频| 亚洲成a人片7777| 欧美区一区| 国产人成在线视频| 毛片大全免费观看| 无码一区18禁| 亚洲婷婷六月| 不卡无码网| 伊人久久久久久久| 久久久噜噜噜| 亚洲欧美一区二区三区蜜芽| 亚洲成av人无码综合在线观看| 亚洲国产中文欧美在线人成大黄瓜| 国产美女丝袜高潮| 99精品免费在线| 中文字幕波多野不卡一区| 色AV色 综合网站| 亚洲欧美一区二区三区麻豆| 成年人国产视频| 婷婷激情亚洲| 亚洲欧洲国产成人综合不卡| 日本在线欧美在线| 免费不卡视频| 一本综合久久| 国产免费精彩视频| 国产99在线| 亚洲AV无码久久精品色欲| 在线视频亚洲色图| 影音先锋亚洲无码| 波多野结衣无码中文字幕在线观看一区二区 | 国产成人精品午夜视频'| 精品一区国产精品| 日韩免费中文字幕| 久久精品波多野结衣| 福利一区三区| 国产精品久久久久无码网站| 免费人成黄页在线观看国产| 毛片网站免费在线观看| 亚洲精品视频免费看| 亚洲网综合| 欧美日韩国产系列在线观看| 亚洲综合经典在线一区二区| 亚洲欧美日韩精品专区| 97超碰精品成人国产| 国国产a国产片免费麻豆| 久久国产高潮流白浆免费观看| 香蕉综合在线视频91| 最新日本中文字幕| 中文字幕中文字字幕码一二区| 国产精品视频第一专区| 亚洲天堂在线免费| 在线精品亚洲国产| 91在线精品免费免费播放| 国产精品视频a| 91在线精品麻豆欧美在线| 无码久看视频|