文·李景
自2008年比特幣誕生,區(qū)塊鏈技術(shù)的應(yīng)用逐漸被世界各國布局研究。我國高度重視區(qū)塊鏈的發(fā)展,尤其是在2019年10月24日,習近平總書記在中共中央第十八次集體學習中強調(diào),要把區(qū)塊鏈作為核心技術(shù)自主創(chuàng)新的重要突破口,加快推動區(qū)塊鏈技術(shù)和產(chǎn)業(yè)創(chuàng)新發(fā)展。目前,我國區(qū)塊鏈產(chǎn)業(yè)蓬勃發(fā)展,產(chǎn)業(yè)規(guī)模和企業(yè)數(shù)量不斷增加,國際競爭力顯著提升,垂直行業(yè)應(yīng)用落地項目不斷涌現(xiàn),國家各部委及各地方政府先后推出近300余條政策,鼓勵區(qū)塊鏈技術(shù)和產(chǎn)業(yè)創(chuàng)新發(fā)展。國內(nèi)互聯(lián)網(wǎng)巨頭企業(yè)也紛紛布局區(qū)塊鏈應(yīng)用,阿里、華為、百度、騰訊、京東等企業(yè)紛紛推出區(qū)塊鏈平臺,包括央行和四大國有商業(yè)銀行在內(nèi)的36家銀行機構(gòu)也紛紛開展區(qū)塊鏈應(yīng)用,并取得優(yōu)異成果。
檔案數(shù)據(jù)是國家各行業(yè)的重要信息資源,隨著技術(shù)的革新和社會的發(fā)展,檔案數(shù)據(jù)共享成為主流趨勢,但在共享過程中,存在中心化存儲整合效率低、孤島現(xiàn)象嚴重、信任度低、安全性差、隱私保護難等問題,無法適應(yīng)社會對檔案數(shù)據(jù)共享的發(fā)展要求。區(qū)塊鏈技術(shù)的出現(xiàn)和應(yīng)用,有效解決了以上問題,因此,深化區(qū)塊鏈技術(shù)在檔案數(shù)據(jù)共享中的應(yīng)用勢在必行。
區(qū)塊鏈作為一項創(chuàng)新的技術(shù)架構(gòu),是一種分布式記賬技術(shù),其核心是去中心化。它是可以在眾多參與方之間共享和復(fù)制的數(shù)據(jù)庫,并且這個數(shù)據(jù)庫只能通過遵循預(yù)先建立的規(guī)則進行更新,一旦更新它將與所有各方共享,實現(xiàn)價值的傳遞。諸如在銀行卡、支付寶、Paypal等電子現(xiàn)金的交易過程中,區(qū)塊鏈不需要任何中心化記賬人,而是通過被稱為共識機制的算法再結(jié)合一系列密碼學與博弈論的巧妙設(shè)計,實現(xiàn)透明化的共同記賬。由于區(qū)塊鏈是一個點對點網(wǎng)絡(luò),它為事件設(shè)置時間戳,因此不需要第三方來驗證記錄,這種形式的記錄暗示了共識和信任,并且是無法篡改的,確保了賬本數(shù)據(jù)庫的一致性與準確性。
區(qū)塊鏈包含三個部分:區(qū)塊、鏈和網(wǎng)絡(luò)。區(qū)塊包含事件列表,這些事件可以是任何類型的活動,記錄的規(guī)則是在首次創(chuàng)建網(wǎng)絡(luò)時建立的,例如限制事件的大小或數(shù)量。當塊達到最大時,它就會被通過哈希值連接成鏈。哈希值是一種從可變數(shù)據(jù)字符串生成固定長度值的算法,就是將一個塊的哈希值插入到下一個塊中,再將新塊與前一個塊鏈接起來。對未修改的數(shù)據(jù)塊重復(fù)使用,哈希值連接將始終生成相同的固定長度的值,如果數(shù)據(jù)塊被更改,哈希值的輸出將會不同。因此,不同的哈希值輸出表明原始塊已被篡改,不值得繼續(xù)信任,可以將多個哈希值組合在一起并再次賦予哈希值,從而創(chuàng)建一個新的哈希值或Merkle根,附加的哈希值被添加到根目錄中,從而創(chuàng)建一個Merkle樹。區(qū)塊鏈網(wǎng)絡(luò)由節(jié)點組成,每個節(jié)點包含所有事件的完整記錄,不存在集中式副本,也不存在比其他節(jié)點更受信任的節(jié)點,數(shù)據(jù)完整性由所有節(jié)點上復(fù)制的區(qū)塊鏈維護。
區(qū)塊鏈網(wǎng)絡(luò)有三種類型:公共的、得到許可的和私有的。公共網(wǎng)絡(luò)通常是一個大型網(wǎng)絡(luò),它允許任何人參與,比如用于加密貨幣交換的網(wǎng)絡(luò)。一個得到許可的網(wǎng)絡(luò)僅限于某些方面,但也可能很大;最小的網(wǎng)絡(luò)是私有網(wǎng)絡(luò),它受到嚴格控制,通常在可信實體之間建立以共享機密信息。
支持使用區(qū)塊鏈技術(shù)應(yīng)用到檔案管理,其原因在于區(qū)塊鏈技術(shù)可以提供一種對記錄有效性建立信任的方法。檔案記錄的關(guān)鍵在于公眾的信任,擔心政府權(quán)力的濫用有可能破壞檔案數(shù)據(jù)的真實性,而區(qū)塊鏈技術(shù)的特征卻能夠證明記錄的真實性,并使逃脫記錄的篡改嘗試變得不可能。需要指出的是,區(qū)塊鏈在檔案管理中的應(yīng)用并非能夠解決一切難題,自身不存在任何問題的靈丹妙藥,通過閱讀研究國外實踐的經(jīng)驗,區(qū)塊鏈技術(shù)在應(yīng)用的道路上需要解決以下兩點重要問題:
其一,區(qū)塊鏈技術(shù)只能說明在添加到區(qū)塊鏈之后的記錄沒有被修改過,在鏈接到區(qū)塊鏈之前,它無法說明記錄內(nèi)容的有效性的真實性。對于區(qū)塊鏈技術(shù)本身而言,提供完全信任的存儲記錄仍然是十分必要的。
其二,區(qū)塊鏈技術(shù)減少了驗證憑證的文書處理量,并且增加了對機構(gòu)的信任。然而,這也引發(fā)了新的擔憂,區(qū)塊鏈實現(xiàn)可能會解決短期問題,但是需要仔細考慮將這些記錄與這種類型的技術(shù)綁定在一起的長期可行性,包括考慮如何在必要時將記錄從區(qū)塊鏈遷移出去而不使其失去可信度。
區(qū)塊鏈遷移數(shù)據(jù)的能力越來越重要。以歐盟(EU)和加州的新數(shù)據(jù)隱私法為例,歐盟《一般數(shù)據(jù)保護條例》(GDPR)和加州《消費者隱私法案》(CCPA)都允許個人直接控制他們的部分個人數(shù)據(jù),允許他們從網(wǎng)上刪除這些數(shù)據(jù),這將給鏈本身帶來潛在風險。系統(tǒng)的真實性意味著數(shù)據(jù)的刪除需要某種版本的硬分叉(hard fork)才能滿足數(shù)據(jù)刪除的請求。區(qū)塊鏈上有兩種“叉子”,軟叉和硬叉,兩者都是對管理區(qū)塊鏈操作規(guī)則的更改。軟叉是向后兼容的,而硬叉不是。硬叉是一種激進的措施,可以通過改變網(wǎng)絡(luò)上的規(guī)則,并指定網(wǎng)絡(luò)在前進時將訪問哪些舊數(shù)據(jù),從而使區(qū)塊鏈網(wǎng)絡(luò)上以前有效的數(shù)據(jù)無效。然而,雖然硬分叉可以改變數(shù)據(jù)塊的有效性狀態(tài),但無法將它們從網(wǎng)絡(luò)上刪除,要完全刪除數(shù)據(jù),需要從運行該區(qū)塊鏈的每個節(jié)點進行刪除,這將使區(qū)塊鏈無法存儲任何受隱私法約束的數(shù)據(jù)。
以上是區(qū)塊鏈技術(shù)應(yīng)用到檔案管理中可能出現(xiàn)的問題,需要在未來的實踐和應(yīng)用中通過技術(shù)研究加以解決。最重要的是,目前對區(qū)塊鏈的研究主要來自計算機科學和金融行業(yè),這對于一種根本上只是記錄保存形式的技術(shù)來說,它的開發(fā)明顯缺乏來自記錄人員和檔案管理人員的參與。本文通過對國外此類實踐經(jīng)驗進行總結(jié)介紹,以期對我國檔案管理的實踐應(yīng)用和技術(shù)研究提供有效經(jīng)驗。
愛沙尼亞是前蘇聯(lián)加盟共和國,1991年獲得獨立。從1940年到1991年的51年時間里,愛沙尼亞一直作為前蘇聯(lián)加盟共和國的身份,參與國際政治大家庭。當年獨立的時候,整個國家只有一條電話線是通向外部世界的,甚至連這個國家獨立的信息,還是由芬蘭政府幫助向外部世界發(fā)布的。但是2017年在克羅地亞舉行的In Future會議上,愛沙尼亞代表報告說,區(qū)塊鏈技術(shù)已經(jīng)在愛沙尼亞的公共系統(tǒng)中使用了,每個愛沙尼亞人都可以隨時在任何公共機構(gòu)訪問他的電子數(shù)據(jù),區(qū)塊鏈系統(tǒng)也會記錄訪問的歷史,從而確保了數(shù)據(jù)的透明性、安全性和真實性。在2017年DLM論壇會議上,愛沙尼亞國家檔案館電子檔案(Kuldar Aas)副館長Kuldar也談到了在電子健康系統(tǒng)、地籍管理、法律登記、遺囑等領(lǐng)域使用區(qū)塊鏈技術(shù)的經(jīng)驗,而且他提出建議,檔案工作者現(xiàn)在也應(yīng)該了解這項技術(shù),并評估其解決數(shù)字資料長期保存的問題。
愛沙尼亞已經(jīng)將所有公民的檔案記錄數(shù)字化,并連接了區(qū)塊鏈系統(tǒng),因此愛沙尼亞是世界上第一個在區(qū)塊鏈上建立數(shù)字公民身份的國家。甚至,德國總理默克爾、法國總統(tǒng)馬克龍、日本首相安倍晉三等都是該國的數(shù)字公民。愛沙尼亞曾提出了名為e-Estonia的項目,即“數(shù)字愛沙尼亞”計劃。該計劃有三個支柱:X-Road、數(shù)字身份證和區(qū)塊鏈系統(tǒng)。X-road是一個跨國家、跨部門的信息共享基礎(chǔ)設(shè)施,打通了愛沙尼亞、芬蘭、瑞典等數(shù)百個不同的政府部門、大型公關(guān)企業(yè)和銀行機構(gòu)的數(shù)據(jù)庫,實現(xiàn)數(shù)據(jù)的互聯(lián)和互通。數(shù)字身份證項目使愛沙尼亞公民皆能擁有屬于自己的電子身份證卡,用于服務(wù)公民在生活中各方各面的需求,如在網(wǎng)絡(luò)上投票、自動化報稅、申請社會福利、銀行服務(wù)等方面。愛沙尼亞曾宣布將數(shù)字公民身份向全世界公民開放,推出了e-Residency 項目,區(qū)塊鏈系統(tǒng)項目則是愛沙尼亞兩位教授2007年開發(fā)的KSI無簽名區(qū)塊鏈系統(tǒng),目前已在國家的行政、司法、商業(yè)、醫(yī)療、交通體系中得到充分應(yīng)用。
加拿大不列顛哥倫比亞大學電子財務(wù)文件研究中心主任、著名專家Victoria Lemieux提出了一個問題,“使用區(qū)塊鏈技術(shù)進行文檔管理是幫助還是炒作?”從檔案學的意義上講,區(qū)塊鏈技術(shù)是一種文檔管理技術(shù),提供了從形成、使用到存儲控制文檔的新方式,通過分布式記賬以實現(xiàn)記錄不可篡改的目的。例如改變對文檔進行身份驗證的方式,從依賴受信任的第三方到基于系統(tǒng)自身的身份驗證方法。但是在某些情況下,人們高估了區(qū)塊鏈技術(shù)用于文檔管理的期望值,例如我們認為可以運用區(qū)塊鏈技術(shù)長期確保電子文檔的真實性和完整性,但實際上區(qū)塊鏈并不提供長期的數(shù)據(jù)可用性。顯然,人們對區(qū)塊鏈應(yīng)用于檔案管理的理論和實踐知之甚少。盡管區(qū)塊鏈技術(shù)的本質(zhì)是一種文檔技術(shù),并且有許多新項目專注于在檔案管理中使用該技術(shù),但是關(guān)于區(qū)塊鏈技術(shù)對檔案管理影響的研究相對較少,我們需要檔案管理領(lǐng)域的研究者與區(qū)塊鏈技術(shù)的研究者之間更緊密的互動,這將有助于雙方的發(fā)展。
為了了解區(qū)塊鏈對檔案管理的潛在影響,美國國家檔案與文件署(NARA)在2018年專門開展了一項研究,隨后NARA將主要的研究發(fā)現(xiàn)匯集并在2019年2月發(fā)布了《區(qū)塊鏈白皮書》。該白皮書旨在幫助聯(lián)邦檔案管理人員更好地了解區(qū)塊鏈技術(shù),并考慮其所在機構(gòu)使用它。
NARA指出,數(shù)字簽名作為一種常見的數(shù)據(jù)交流形式,可以存儲在區(qū)塊鏈上。目前,當我們對電子文本文檔(如PDF)進行數(shù)字簽名時,簽名存儲在文檔本身中,這些簽名必須按順序進行,如果證書過期,文檔的有效性可能會被質(zhì)疑。區(qū)塊鏈技術(shù)一方面可以消除順序簽名和對證書的要求,從而保證文檔的有效性,這對于土地契約和遺囑等需要長期保存的文件尤其有用;另一方面區(qū)塊鏈可用于確定實物或不動產(chǎn)的真實性,比如在藝術(shù)界,由于真品證書保留在區(qū)塊鏈中無法偽造,因此能夠確保購買的畫是真實的;第三,區(qū)塊鏈可用于檔案真實性檢驗,當組織向用戶提供文件時,通常可以提供出處和認證,證明它是真實準確的副本,之后如果有任何問題,則必須將其與原件進行比較,但如果真實性證書保留在區(qū)塊鏈中,則可以重新對文件進行哈希運算以確定文件是否被更改或調(diào)整。
英國的ARCHANGEL項目是薩里大學與英國國家檔案館和開放數(shù)據(jù)研究所(ODI)合作建設(shè)的區(qū)塊鏈檔案管理項目,其目的是通過設(shè)計、開發(fā)、試用區(qū)塊鏈技術(shù)來確保數(shù)字檔案的長期可持續(xù)性,以促進可訪問性和確保內(nèi)容的完整性。同時通過新穎的商業(yè)模式最大程度地發(fā)揮其影響力,例如英國國家檔案館是世界上最大、最古老的檔案和記憶機構(gòu)(AMI)之一,負責保存英國政府的數(shù)字記錄,包括官員做出的重要決定和收到的建議。這些信息中有些是公開的,有些則一直秘密封存數(shù)十年。AMI是建立在公眾信任和中立的基礎(chǔ)之上,其不可篡改性和完整性對于維持其客觀性至關(guān)重要。通過使用區(qū)塊鏈來記錄和校驗數(shù)據(jù),此項目允許在長達100年的時間跨度內(nèi)驗證它們的完整性,這些數(shù)據(jù)來自于掃描的物理記錄或原本就以數(shù)字形態(tài)記錄的數(shù)據(jù),通過點對點分布和一致性檢查永久保存,從而不需要可信的第三方。
從技術(shù)角度來看,ARCHANGEL利用尖端的機器學習技術(shù),收集物理的和原生數(shù)字化數(shù)據(jù)進行存儲。用于呈現(xiàn)內(nèi)容并驗證其來源和完整性的簽名和程序代碼都將在區(qū)塊鏈中進行編碼。新型的商業(yè)模式將成為支撐此項目的基礎(chǔ),例如利用多個AMI在創(chuàng)建和使用ARCHANGEL中的貢獻建立商業(yè)運營模型。這種方案可以移植到任何數(shù)字檔案中,如大學的數(shù)據(jù)存儲庫,跨國公司的財務(wù)和法規(guī)記錄,科技公司中的技術(shù)記錄等。
通過對國外實踐經(jīng)驗的了解,筆者發(fā)現(xiàn),區(qū)塊鏈技術(shù)在檔案管理中應(yīng)用的程度存在相當大的國別差異,愛沙尼亞作為波羅的海三小國之一,其人口和經(jīng)濟科技實力并非出類拔萃,但在此一方面卻世界領(lǐng)先。這說明發(fā)展區(qū)塊鏈技術(shù)的應(yīng)用關(guān)鍵之處在于理念上的重視,另外,產(chǎn)學研相結(jié)合也十分重要。以英國為例,高校和國家機構(gòu)的合作研究成果卓著,ARCHANGEL已經(jīng)十分成功,并探索出了可持續(xù)運營的商業(yè)模式,這一點對于一項新興技術(shù)的生命力和可復(fù)制性來說至關(guān)重要。
在這方面,我國也進行了大量實踐,比如,2019年,中石化開展了電子文件歸檔管理區(qū)塊鏈應(yīng)用試點,拉開了實踐層面的探索序幕。中科院合肥分院、沈陽市檔案館等多家單位緊隨其后,開展了各有特色的應(yīng)用。從2020年國家檔案局科技項目申報情況來看,涉及區(qū)塊鏈技術(shù)的推薦項目占信息化和現(xiàn)代化項目總數(shù)的24.4%。從立項情況看,涉及區(qū)塊鏈技術(shù)的立項項目共14項,占信息化與現(xiàn)代化項目立項總數(shù)的17.5%,占各類科技項目立項總數(shù)的11.7%。獲得立項的14個具體項目中,除了1個軟課題外,其余均聚焦具體的應(yīng)用場景或系統(tǒng)建設(shè)。可以預(yù)計,檔案界的區(qū)塊鏈應(yīng)用將在未來一段時間內(nèi)迅速發(fā)展。
