文·李景
自2008年比特幣誕生,區(qū)塊鏈技術(shù)的應(yīng)用逐漸被世界各國(guó)布局研究。我國(guó)高度重視區(qū)塊鏈的發(fā)展,尤其是在2019年10月24日,習(xí)近平總書記在中共中央第十八次集體學(xué)習(xí)中強(qiáng)調(diào),要把區(qū)塊鏈作為核心技術(shù)自主創(chuàng)新的重要突破口,加快推動(dòng)區(qū)塊鏈技術(shù)和產(chǎn)業(yè)創(chuàng)新發(fā)展。目前,我國(guó)區(qū)塊鏈產(chǎn)業(yè)蓬勃發(fā)展,產(chǎn)業(yè)規(guī)模和企業(yè)數(shù)量不斷增加,國(guó)際競(jìng)爭(zhēng)力顯著提升,垂直行業(yè)應(yīng)用落地項(xiàng)目不斷涌現(xiàn),國(guó)家各部委及各地方政府先后推出近300余條政策,鼓勵(lì)區(qū)塊鏈技術(shù)和產(chǎn)業(yè)創(chuàng)新發(fā)展。國(guó)內(nèi)互聯(lián)網(wǎng)巨頭企業(yè)也紛紛布局區(qū)塊鏈應(yīng)用,阿里、華為、百度、騰訊、京東等企業(yè)紛紛推出區(qū)塊鏈平臺(tái),包括央行和四大國(guó)有商業(yè)銀行在內(nèi)的36家銀行機(jī)構(gòu)也紛紛開(kāi)展區(qū)塊鏈應(yīng)用,并取得優(yōu)異成果。
檔案數(shù)據(jù)是國(guó)家各行業(yè)的重要信息資源,隨著技術(shù)的革新和社會(huì)的發(fā)展,檔案數(shù)據(jù)共享成為主流趨勢(shì),但在共享過(guò)程中,存在中心化存儲(chǔ)整合效率低、孤島現(xiàn)象嚴(yán)重、信任度低、安全性差、隱私保護(hù)難等問(wèn)題,無(wú)法適應(yīng)社會(huì)對(duì)檔案數(shù)據(jù)共享的發(fā)展要求。區(qū)塊鏈技術(shù)的出現(xiàn)和應(yīng)用,有效解決了以上問(wèn)題,因此,深化區(qū)塊鏈技術(shù)在檔案數(shù)據(jù)共享中的應(yīng)用勢(shì)在必行。
區(qū)塊鏈作為一項(xiàng)創(chuàng)新的技術(shù)架構(gòu),是一種分布式記賬技術(shù),其核心是去中心化。它是可以在眾多參與方之間共享和復(fù)制的數(shù)據(jù)庫(kù),并且這個(gè)數(shù)據(jù)庫(kù)只能通過(guò)遵循預(yù)先建立的規(guī)則進(jìn)行更新,一旦更新它將與所有各方共享,實(shí)現(xiàn)價(jià)值的傳遞。諸如在銀行卡、支付寶、Paypal等電子現(xiàn)金的交易過(guò)程中,區(qū)塊鏈不需要任何中心化記賬人,而是通過(guò)被稱為共識(shí)機(jī)制的算法再結(jié)合一系列密碼學(xué)與博弈論的巧妙設(shè)計(jì),實(shí)現(xiàn)透明化的共同記賬。由于區(qū)塊鏈?zhǔn)且粋€(gè)點(diǎn)對(duì)點(diǎn)網(wǎng)絡(luò),它為事件設(shè)置時(shí)間戳,因此不需要第三方來(lái)驗(yàn)證記錄,這種形式的記錄暗示了共識(shí)和信任,并且是無(wú)法篡改的,確保了賬本數(shù)據(jù)庫(kù)的一致性與準(zhǔn)確性。
區(qū)塊鏈包含三個(gè)部分:區(qū)塊、鏈和網(wǎng)絡(luò)。區(qū)塊包含事件列表,這些事件可以是任何類型的活動(dòng),記錄的規(guī)則是在首次創(chuàng)建網(wǎng)絡(luò)時(shí)建立的,例如限制事件的大小或數(shù)量。當(dāng)塊達(dá)到最大時(shí),它就會(huì)被通過(guò)哈希值連接成鏈。哈希值是一種從可變數(shù)據(jù)字符串生成固定長(zhǎng)度值的算法,就是將一個(gè)塊的哈希值插入到下一個(gè)塊中,再將新塊與前一個(gè)塊鏈接起來(lái)。對(duì)未修改的數(shù)據(jù)塊重復(fù)使用,哈希值連接將始終生成相同的固定長(zhǎng)度的值,如果數(shù)據(jù)塊被更改,哈希值的輸出將會(huì)不同。因此,不同的哈希值輸出表明原始?jí)K已被篡改,不值得繼續(xù)信任,可以將多個(gè)哈希值組合在一起并再次賦予哈希值,從而創(chuàng)建一個(gè)新的哈希值或Merkle根,附加的哈希值被添加到根目錄中,從而創(chuàng)建一個(gè)Merkle樹(shù)。區(qū)塊鏈網(wǎng)絡(luò)由節(jié)點(diǎn)組成,每個(gè)節(jié)點(diǎn)包含所有事件的完整記錄,不存在集中式副本,也不存在比其他節(jié)點(diǎn)更受信任的節(jié)點(diǎn),數(shù)據(jù)完整性由所有節(jié)點(diǎn)上復(fù)制的區(qū)塊鏈維護(hù)。
區(qū)塊鏈網(wǎng)絡(luò)有三種類型:公共的、得到許可的和私有的。公共網(wǎng)絡(luò)通常是一個(gè)大型網(wǎng)絡(luò),它允許任何人參與,比如用于加密貨幣交換的網(wǎng)絡(luò)。一個(gè)得到許可的網(wǎng)絡(luò)僅限于某些方面,但也可能很大;最小的網(wǎng)絡(luò)是私有網(wǎng)絡(luò),它受到嚴(yán)格控制,通常在可信實(shí)體之間建立以共享機(jī)密信息。
支持使用區(qū)塊鏈技術(shù)應(yīng)用到檔案管理,其原因在于區(qū)塊鏈技術(shù)可以提供一種對(duì)記錄有效性建立信任的方法。檔案記錄的關(guān)鍵在于公眾的信任,擔(dān)心政府權(quán)力的濫用有可能破壞檔案數(shù)據(jù)的真實(shí)性,而區(qū)塊鏈技術(shù)的特征卻能夠證明記錄的真實(shí)性,并使逃脫記錄的篡改嘗試變得不可能。需要指出的是,區(qū)塊鏈在檔案管理中的應(yīng)用并非能夠解決一切難題,自身不存在任何問(wèn)題的靈丹妙藥,通過(guò)閱讀研究國(guó)外實(shí)踐的經(jīng)驗(yàn),區(qū)塊鏈技術(shù)在應(yīng)用的道路上需要解決以下兩點(diǎn)重要問(wèn)題:
其一,區(qū)塊鏈技術(shù)只能說(shuō)明在添加到區(qū)塊鏈之后的記錄沒(méi)有被修改過(guò),在鏈接到區(qū)塊鏈之前,它無(wú)法說(shuō)明記錄內(nèi)容的有效性的真實(shí)性。對(duì)于區(qū)塊鏈技術(shù)本身而言,提供完全信任的存儲(chǔ)記錄仍然是十分必要的。
其二,區(qū)塊鏈技術(shù)減少了驗(yàn)證憑證的文書處理量,并且增加了對(duì)機(jī)構(gòu)的信任。然而,這也引發(fā)了新的擔(dān)憂,區(qū)塊鏈實(shí)現(xiàn)可能會(huì)解決短期問(wèn)題,但是需要仔細(xì)考慮將這些記錄與這種類型的技術(shù)綁定在一起的長(zhǎng)期可行性,包括考慮如何在必要時(shí)將記錄從區(qū)塊鏈遷移出去而不使其失去可信度。
區(qū)塊鏈遷移數(shù)據(jù)的能力越來(lái)越重要。以歐盟(EU)和加州的新數(shù)據(jù)隱私法為例,歐盟《一般數(shù)據(jù)保護(hù)條例》(GDPR)和加州《消費(fèi)者隱私法案》(CCPA)都允許個(gè)人直接控制他們的部分個(gè)人數(shù)據(jù),允許他們從網(wǎng)上刪除這些數(shù)據(jù),這將給鏈本身帶來(lái)潛在風(fēng)險(xiǎn)。系統(tǒng)的真實(shí)性意味著數(shù)據(jù)的刪除需要某種版本的硬分叉(hard fork)才能滿足數(shù)據(jù)刪除的請(qǐng)求。區(qū)塊鏈上有兩種“叉子”,軟叉和硬叉,兩者都是對(duì)管理區(qū)塊鏈操作規(guī)則的更改。軟叉是向后兼容的,而硬叉不是。硬叉是一種激進(jìn)的措施,可以通過(guò)改變網(wǎng)絡(luò)上的規(guī)則,并指定網(wǎng)絡(luò)在前進(jìn)時(shí)將訪問(wèn)哪些舊數(shù)據(jù),從而使區(qū)塊鏈網(wǎng)絡(luò)上以前有效的數(shù)據(jù)無(wú)效。然而,雖然硬分叉可以改變數(shù)據(jù)塊的有效性狀態(tài),但無(wú)法將它們從網(wǎng)絡(luò)上刪除,要完全刪除數(shù)據(jù),需要從運(yùn)行該區(qū)塊鏈的每個(gè)節(jié)點(diǎn)進(jìn)行刪除,這將使區(qū)塊鏈無(wú)法存儲(chǔ)任何受隱私法約束的數(shù)據(jù)。
以上是區(qū)塊鏈技術(shù)應(yīng)用到檔案管理中可能出現(xiàn)的問(wèn)題,需要在未來(lái)的實(shí)踐和應(yīng)用中通過(guò)技術(shù)研究加以解決。最重要的是,目前對(duì)區(qū)塊鏈的研究主要來(lái)自計(jì)算機(jī)科學(xué)和金融行業(yè),這對(duì)于一種根本上只是記錄保存形式的技術(shù)來(lái)說(shuō),它的開(kāi)發(fā)明顯缺乏來(lái)自記錄人員和檔案管理人員的參與。本文通過(guò)對(duì)國(guó)外此類實(shí)踐經(jīng)驗(yàn)進(jìn)行總結(jié)介紹,以期對(duì)我國(guó)檔案管理的實(shí)踐應(yīng)用和技術(shù)研究提供有效經(jīng)驗(yàn)。
愛(ài)沙尼亞是前蘇聯(lián)加盟共和國(guó),1991年獲得獨(dú)立。從1940年到1991年的51年時(shí)間里,愛(ài)沙尼亞一直作為前蘇聯(lián)加盟共和國(guó)的身份,參與國(guó)際政治大家庭。當(dāng)年獨(dú)立的時(shí)候,整個(gè)國(guó)家只有一條電話線是通向外部世界的,甚至連這個(gè)國(guó)家獨(dú)立的信息,還是由芬蘭政府幫助向外部世界發(fā)布的。但是2017年在克羅地亞舉行的In Future會(huì)議上,愛(ài)沙尼亞代表報(bào)告說(shuō),區(qū)塊鏈技術(shù)已經(jīng)在愛(ài)沙尼亞的公共系統(tǒng)中使用了,每個(gè)愛(ài)沙尼亞人都可以隨時(shí)在任何公共機(jī)構(gòu)訪問(wèn)他的電子數(shù)據(jù),區(qū)塊鏈系統(tǒng)也會(huì)記錄訪問(wèn)的歷史,從而確保了數(shù)據(jù)的透明性、安全性和真實(shí)性。在2017年DLM論壇會(huì)議上,愛(ài)沙尼亞國(guó)家檔案館電子檔案(Kuldar Aas)副館長(zhǎng)Kuldar也談到了在電子健康系統(tǒng)、地籍管理、法律登記、遺囑等領(lǐng)域使用區(qū)塊鏈技術(shù)的經(jīng)驗(yàn),而且他提出建議,檔案工作者現(xiàn)在也應(yīng)該了解這項(xiàng)技術(shù),并評(píng)估其解決數(shù)字資料長(zhǎng)期保存的問(wèn)題。
愛(ài)沙尼亞已經(jīng)將所有公民的檔案記錄數(shù)字化,并連接了區(qū)塊鏈系統(tǒng),因此愛(ài)沙尼亞是世界上第一個(gè)在區(qū)塊鏈上建立數(shù)字公民身份的國(guó)家。甚至,德國(guó)總理默克爾、法國(guó)總統(tǒng)馬克龍、日本首相安倍晉三等都是該國(guó)的數(shù)字公民。愛(ài)沙尼亞曾提出了名為e-Estonia的項(xiàng)目,即“數(shù)字愛(ài)沙尼亞”計(jì)劃。該計(jì)劃有三個(gè)支柱:X-Road、數(shù)字身份證和區(qū)塊鏈系統(tǒng)。X-road是一個(gè)跨國(guó)家、跨部門的信息共享基礎(chǔ)設(shè)施,打通了愛(ài)沙尼亞、芬蘭、瑞典等數(shù)百個(gè)不同的政府部門、大型公關(guān)企業(yè)和銀行機(jī)構(gòu)的數(shù)據(jù)庫(kù),實(shí)現(xiàn)數(shù)據(jù)的互聯(lián)和互通。數(shù)字身份證項(xiàng)目使愛(ài)沙尼亞公民皆能擁有屬于自己的電子身份證卡,用于服務(wù)公民在生活中各方各面的需求,如在網(wǎng)絡(luò)上投票、自動(dòng)化報(bào)稅、申請(qǐng)社會(huì)福利、銀行服務(wù)等方面。愛(ài)沙尼亞曾宣布將數(shù)字公民身份向全世界公民開(kāi)放,推出了e-Residency 項(xiàng)目,區(qū)塊鏈系統(tǒng)項(xiàng)目則是愛(ài)沙尼亞兩位教授2007年開(kāi)發(fā)的KSI無(wú)簽名區(qū)塊鏈系統(tǒng),目前已在國(guó)家的行政、司法、商業(yè)、醫(yī)療、交通體系中得到充分應(yīng)用。
加拿大不列顛哥倫比亞大學(xué)電子財(cái)務(wù)文件研究中心主任、著名專家Victoria Lemieux提出了一個(gè)問(wèn)題,“使用區(qū)塊鏈技術(shù)進(jìn)行文檔管理是幫助還是炒作?”從檔案學(xué)的意義上講,區(qū)塊鏈技術(shù)是一種文檔管理技術(shù),提供了從形成、使用到存儲(chǔ)控制文檔的新方式,通過(guò)分布式記賬以實(shí)現(xiàn)記錄不可篡改的目的。例如改變對(duì)文檔進(jìn)行身份驗(yàn)證的方式,從依賴受信任的第三方到基于系統(tǒng)自身的身份驗(yàn)證方法。但是在某些情況下,人們高估了區(qū)塊鏈技術(shù)用于文檔管理的期望值,例如我們認(rèn)為可以運(yùn)用區(qū)塊鏈技術(shù)長(zhǎng)期確保電子文檔的真實(shí)性和完整性,但實(shí)際上區(qū)塊鏈并不提供長(zhǎng)期的數(shù)據(jù)可用性。顯然,人們對(duì)區(qū)塊鏈應(yīng)用于檔案管理的理論和實(shí)踐知之甚少。盡管區(qū)塊鏈技術(shù)的本質(zhì)是一種文檔技術(shù),并且有許多新項(xiàng)目專注于在檔案管理中使用該技術(shù),但是關(guān)于區(qū)塊鏈技術(shù)對(duì)檔案管理影響的研究相對(duì)較少,我們需要檔案管理領(lǐng)域的研究者與區(qū)塊鏈技術(shù)的研究者之間更緊密的互動(dòng),這將有助于雙方的發(fā)展。
為了了解區(qū)塊鏈對(duì)檔案管理的潛在影響,美國(guó)國(guó)家檔案與文件署(NARA)在2018年專門開(kāi)展了一項(xiàng)研究,隨后NARA將主要的研究發(fā)現(xiàn)匯集并在2019年2月發(fā)布了《區(qū)塊鏈白皮書》。該白皮書旨在幫助聯(lián)邦檔案管理人員更好地了解區(qū)塊鏈技術(shù),并考慮其所在機(jī)構(gòu)使用它。
NARA指出,數(shù)字簽名作為一種常見(jiàn)的數(shù)據(jù)交流形式,可以存儲(chǔ)在區(qū)塊鏈上。目前,當(dāng)我們對(duì)電子文本文檔(如PDF)進(jìn)行數(shù)字簽名時(shí),簽名存儲(chǔ)在文檔本身中,這些簽名必須按順序進(jìn)行,如果證書過(guò)期,文檔的有效性可能會(huì)被質(zhì)疑。區(qū)塊鏈技術(shù)一方面可以消除順序簽名和對(duì)證書的要求,從而保證文檔的有效性,這對(duì)于土地契約和遺囑等需要長(zhǎng)期保存的文件尤其有用;另一方面區(qū)塊鏈可用于確定實(shí)物或不動(dòng)產(chǎn)的真實(shí)性,比如在藝術(shù)界,由于真品證書保留在區(qū)塊鏈中無(wú)法偽造,因此能夠確保購(gòu)買的畫是真實(shí)的;第三,區(qū)塊鏈可用于檔案真實(shí)性檢驗(yàn),當(dāng)組織向用戶提供文件時(shí),通常可以提供出處和認(rèn)證,證明它是真實(shí)準(zhǔn)確的副本,之后如果有任何問(wèn)題,則必須將其與原件進(jìn)行比較,但如果真實(shí)性證書保留在區(qū)塊鏈中,則可以重新對(duì)文件進(jìn)行哈希運(yùn)算以確定文件是否被更改或調(diào)整。
英國(guó)的ARCHANGEL項(xiàng)目是薩里大學(xué)與英國(guó)國(guó)家檔案館和開(kāi)放數(shù)據(jù)研究所(ODI)合作建設(shè)的區(qū)塊鏈檔案管理項(xiàng)目,其目的是通過(guò)設(shè)計(jì)、開(kāi)發(fā)、試用區(qū)塊鏈技術(shù)來(lái)確保數(shù)字檔案的長(zhǎng)期可持續(xù)性,以促進(jìn)可訪問(wèn)性和確保內(nèi)容的完整性。同時(shí)通過(guò)新穎的商業(yè)模式最大程度地發(fā)揮其影響力,例如英國(guó)國(guó)家檔案館是世界上最大、最古老的檔案和記憶機(jī)構(gòu)(AMI)之一,負(fù)責(zé)保存英國(guó)政府的數(shù)字記錄,包括官員做出的重要決定和收到的建議。這些信息中有些是公開(kāi)的,有些則一直秘密封存數(shù)十年。AMI是建立在公眾信任和中立的基礎(chǔ)之上,其不可篡改性和完整性對(duì)于維持其客觀性至關(guān)重要。通過(guò)使用區(qū)塊鏈來(lái)記錄和校驗(yàn)數(shù)據(jù),此項(xiàng)目允許在長(zhǎng)達(dá)100年的時(shí)間跨度內(nèi)驗(yàn)證它們的完整性,這些數(shù)據(jù)來(lái)自于掃描的物理記錄或原本就以數(shù)字形態(tài)記錄的數(shù)據(jù),通過(guò)點(diǎn)對(duì)點(diǎn)分布和一致性檢查永久保存,從而不需要可信的第三方。
從技術(shù)角度來(lái)看,ARCHANGEL利用尖端的機(jī)器學(xué)習(xí)技術(shù),收集物理的和原生數(shù)字化數(shù)據(jù)進(jìn)行存儲(chǔ)。用于呈現(xiàn)內(nèi)容并驗(yàn)證其來(lái)源和完整性的簽名和程序代碼都將在區(qū)塊鏈中進(jìn)行編碼。新型的商業(yè)模式將成為支撐此項(xiàng)目的基礎(chǔ),例如利用多個(gè)AMI在創(chuàng)建和使用ARCHANGEL中的貢獻(xiàn)建立商業(yè)運(yùn)營(yíng)模型。這種方案可以移植到任何數(shù)字檔案中,如大學(xué)的數(shù)據(jù)存儲(chǔ)庫(kù),跨國(guó)公司的財(cái)務(wù)和法規(guī)記錄,科技公司中的技術(shù)記錄等。
通過(guò)對(duì)國(guó)外實(shí)踐經(jīng)驗(yàn)的了解,筆者發(fā)現(xiàn),區(qū)塊鏈技術(shù)在檔案管理中應(yīng)用的程度存在相當(dāng)大的國(guó)別差異,愛(ài)沙尼亞作為波羅的海三小國(guó)之一,其人口和經(jīng)濟(jì)科技實(shí)力并非出類拔萃,但在此一方面卻世界領(lǐng)先。這說(shuō)明發(fā)展區(qū)塊鏈技術(shù)的應(yīng)用關(guān)鍵之處在于理念上的重視,另外,產(chǎn)學(xué)研相結(jié)合也十分重要。以英國(guó)為例,高校和國(guó)家機(jī)構(gòu)的合作研究成果卓著,ARCHANGEL已經(jīng)十分成功,并探索出了可持續(xù)運(yùn)營(yíng)的商業(yè)模式,這一點(diǎn)對(duì)于一項(xiàng)新興技術(shù)的生命力和可復(fù)制性來(lái)說(shuō)至關(guān)重要。
在這方面,我國(guó)也進(jìn)行了大量實(shí)踐,比如,2019年,中石化開(kāi)展了電子文件歸檔管理區(qū)塊鏈應(yīng)用試點(diǎn),拉開(kāi)了實(shí)踐層面的探索序幕。中科院合肥分院、沈陽(yáng)市檔案館等多家單位緊隨其后,開(kāi)展了各有特色的應(yīng)用。從2020年國(guó)家檔案局科技項(xiàng)目申報(bào)情況來(lái)看,涉及區(qū)塊鏈技術(shù)的推薦項(xiàng)目占信息化和現(xiàn)代化項(xiàng)目總數(shù)的24.4%。從立項(xiàng)情況看,涉及區(qū)塊鏈技術(shù)的立項(xiàng)項(xiàng)目共14項(xiàng),占信息化與現(xiàn)代化項(xiàng)目立項(xiàng)總數(shù)的17.5%,占各類科技項(xiàng)目立項(xiàng)總數(shù)的11.7%。獲得立項(xiàng)的14個(gè)具體項(xiàng)目中,除了1個(gè)軟課題外,其余均聚焦具體的應(yīng)用場(chǎng)景或系統(tǒng)建設(shè)。可以預(yù)計(jì),檔案界的區(qū)塊鏈應(yīng)用將在未來(lái)一段時(shí)間內(nèi)迅速發(fā)展。
