羅亞利/浙江大學(xué)
2021年,習(xí)近平總書(shū)記在致世界互聯(lián)網(wǎng)大會(huì)的賀信中指出,我國(guó)應(yīng)“優(yōu)化數(shù)字社會(huì)環(huán)境,構(gòu)建數(shù)字合作格局,筑牢數(shù)字安全屏障”[1]。這對(duì)數(shù)字檔案安全保存提出了更高要求。檔案學(xué)界應(yīng)結(jié)合實(shí)踐,在現(xiàn)有研究基礎(chǔ)上,進(jìn)一步深化數(shù)字檔案安全保存風(fēng)險(xiǎn)管理的理論研究和實(shí)踐探索。
我國(guó)現(xiàn)有關(guān)于數(shù)字檔案保存風(fēng)險(xiǎn)的研究主要以理論探討為主,或是從宏觀層面提出期望[2],或是對(duì)已有的數(shù)字檔案保存系統(tǒng)進(jìn)行分析[3],或是從數(shù)字技術(shù)實(shí)現(xiàn)的角度提出系統(tǒng)的設(shè)計(jì)構(gòu)想[4]。但在具體實(shí)踐中,檔案從業(yè)人員普遍缺乏數(shù)字技術(shù)專(zhuān)業(yè)知識(shí),對(duì)數(shù)字檔案保存風(fēng)險(xiǎn)的理解是狹隘的或靜態(tài)的,因此不能對(duì)風(fēng)險(xiǎn)進(jìn)行科學(xué)的分析或評(píng)估。為了使檔案從業(yè)人員能應(yīng)對(duì)不斷變化的風(fēng)險(xiǎn)環(huán)境,急需構(gòu)建一個(gè)易理解的數(shù)字檔案保存風(fēng)險(xiǎn)評(píng)估模型。然而,我國(guó)檔案學(xué)界對(duì)此尚無(wú)相關(guān)研究。
在國(guó)際檔案界,英國(guó)較早關(guān)注數(shù)字檔案保存風(fēng)險(xiǎn)管理實(shí)踐[5]。2020年,英國(guó)國(guó)家檔案館構(gòu)建了數(shù)字檔案保存風(fēng)險(xiǎn)評(píng)估模型(Digital Archiving Risk Assessment Model,以下簡(jiǎn)稱(chēng)DARAM),協(xié)助檔案從業(yè)人員應(yīng)對(duì)數(shù)字檔案保存風(fēng)險(xiǎn)[6]。本文介紹DARAM構(gòu)建背景、愿景、結(jié)構(gòu)及多學(xué)科合作的構(gòu)建過(guò)程,以期為我國(guó)數(shù)字檔案保存風(fēng)險(xiǎn)管理實(shí)踐提供有益借鑒,為開(kāi)展相關(guān)理論研究提供新的視角。
英國(guó)國(guó)家檔案館認(rèn)為,每一代數(shù)字技術(shù)都會(huì)帶來(lái)一系列新風(fēng)險(xiǎn),數(shù)字檔案保存工作必然涉及評(píng)估和處置復(fù)雜多變的風(fēng)險(xiǎn)因素。2018年,英國(guó)政府基于簡(jiǎn)易風(fēng)險(xiǎn)評(píng)估模型SPOT(Simple Property-Oriented Threat Model)[7],出臺(tái)了《ISO 31000:2018風(fēng)險(xiǎn)管理指南》,提出了數(shù)字保存風(fēng)險(xiǎn)管理6項(xiàng)標(biāo)準(zhǔn),即可用性、可標(biāo)識(shí)性、持久性、可呈現(xiàn)性、可理解性和真實(shí)性[8]。為了與此類(lèi)標(biāo)準(zhǔn)兼容,歸檔人員必須使數(shù)字檔案符合指定的相應(yīng)元素。但是,依據(jù)這些標(biāo)準(zhǔn),并不能提前預(yù)測(cè)多變的風(fēng)險(xiǎn)因素,無(wú)法衡量風(fēng)險(xiǎn)等級(jí),更不能提供風(fēng)險(xiǎn)援助的先后次序。因此,在特定情況下,過(guò)分依賴(lài)既定標(biāo)準(zhǔn)的數(shù)字風(fēng)險(xiǎn)管理,導(dǎo)致數(shù)字檔案保存措施出現(xiàn)滯后性,其本身成為風(fēng)險(xiǎn)來(lái)源之一。2019年,英國(guó)檔案服務(wù)認(rèn)證機(jī)構(gòu)(UK Archive Service Accreditation)要求各檔案館對(duì)數(shù)字檔案保存風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè)和評(píng)估。然而,同年9月,英國(guó)數(shù)字保存聯(lián)盟(Digital Preservation Coalition,DPC)指出當(dāng)前英國(guó)檔案行業(yè)的數(shù)字技術(shù)力量很難為存量數(shù)字檔案提供可持續(xù)的安全保存,數(shù)字檔案的增量也已經(jīng)逼近檔案機(jī)構(gòu)接收能力和管理能力的臨界點(diǎn)[9]。因此,急需易理解、可推廣的數(shù)字檔案保存風(fēng)險(xiǎn)管理模型,幫助檔案從業(yè)人員識(shí)別數(shù)字檔案保存風(fēng)險(xiǎn)因素,并根據(jù)風(fēng)險(xiǎn)級(jí)別,有針對(duì)性地提出規(guī)避方案和處置措施。2020年初,該聯(lián)盟提出了數(shù)字檔案保存風(fēng)險(xiǎn)管理模型的概念[10],目標(biāo)是讓檔案從業(yè)人員能夠理解和分析數(shù)字檔案保存的風(fēng)險(xiǎn)。同年7月,英國(guó)國(guó)家檔案館在推進(jìn)保護(hù)國(guó)家記憶項(xiàng)目的過(guò)程中,以此概念為基礎(chǔ)構(gòu)建了數(shù)字檔案保存風(fēng)險(xiǎn)評(píng)估模型DARAM。
基于數(shù)字檔案保存風(fēng)險(xiǎn)管理的現(xiàn)狀和需求,英國(guó)國(guó)家檔案館為DARAM設(shè)定如下愿景。
第一,使檔案從業(yè)人員理解數(shù)字檔案保存風(fēng)險(xiǎn)。建立模型,直觀地顯示數(shù)字檔案保存風(fēng)險(xiǎn)因素之間的邏輯關(guān)系,使用戶(hù)在實(shí)際工作場(chǎng)景中明了各種風(fēng)險(xiǎn)因素之間相互影響的機(jī)制。
第二,使檔案從業(yè)人員能夠?qū)?shù)字檔案保存風(fēng)險(xiǎn)進(jìn)行級(jí)別排序。DARAM將支持用戶(hù)直接比較不同類(lèi)型的風(fēng)險(xiǎn)事件對(duì)數(shù)字檔案保存的影響程度,使檔案從業(yè)人員能夠做出更明智的決定,并采取有針對(duì)性的行動(dòng),提高其在具體操作環(huán)境中實(shí)時(shí)處置風(fēng)險(xiǎn)的能力。
第三,提高相關(guān)群體對(duì)數(shù)字檔案保存風(fēng)險(xiǎn)的認(rèn)識(shí),擴(kuò)大風(fēng)險(xiǎn)評(píng)估模型的使用范圍。英國(guó)國(guó)家檔案館計(jì)劃與地方政府、企業(yè)和學(xué)術(shù)組織開(kāi)展廣泛交流,尋求項(xiàng)目合作,推廣模型應(yīng)用,推動(dòng)跨學(xué)科融合,為數(shù)字檔案安全保存爭(zhēng)取更多的技術(shù)支持[11]。
2017年,英國(guó)國(guó)家檔案館的數(shù)字檔案管理綜合決策支持系統(tǒng)(Integrated Decision Support System,IDSS),通過(guò)整合數(shù)字檔案保存的相關(guān)信息、數(shù)據(jù)和因素,構(gòu)建了一個(gè)基礎(chǔ)模型,用以預(yù)測(cè)數(shù)字檔案保存風(fēng)險(xiǎn)。該模型表述了呈現(xiàn)工具、專(zhuān)業(yè)技能、文件格式、數(shù)字對(duì)象、內(nèi)容元數(shù)據(jù)等因素之間的邏輯關(guān)系,即數(shù)字檔案“呈現(xiàn)工具”的選擇取決于“文件格式”和檔案從業(yè)人員的“專(zhuān)業(yè)技能”水平,“文件格式”取決于“數(shù)字對(duì)象”的類(lèi)型,而“數(shù)字對(duì)象”的數(shù)據(jù)屬性信息則由“內(nèi)容元數(shù)據(jù)”來(lái)描述[12](見(jiàn)圖1)。2020年,英國(guó)國(guó)家檔案館保護(hù)國(guó)家記憶項(xiàng)目團(tuán)隊(duì)在風(fēng)險(xiǎn)管理實(shí)踐中對(duì)IDSS建立的基礎(chǔ)模型進(jìn)行細(xì)化,更全面地、更綜合地考量數(shù)字檔案保存風(fēng)險(xiǎn)管理所涉及的相關(guān)因素,構(gòu)建數(shù)字檔案保存風(fēng)險(xiǎn)評(píng)估模型(DARAM)。根據(jù)DARAM的愿景,項(xiàng)目團(tuán)隊(duì)中的計(jì)算機(jī)軟件開(kāi)發(fā)者、統(tǒng)計(jì)技術(shù)人員及檔案從業(yè)人員經(jīng)過(guò)反復(fù)的交流和研究,提出以可呈現(xiàn)能力(Renderability)和智能控制(Intellectual Control)作為評(píng)估數(shù)字檔案保存風(fēng)險(xiǎn)的基準(zhǔn),并明確了相關(guān)影響因素的層級(jí)結(jié)構(gòu)[13](見(jiàn)圖2)。
第一,可呈現(xiàn)能力指數(shù)字檔案管理系統(tǒng)能安全地呈現(xiàn)原始數(shù)字文檔,并能順暢地提供訪問(wèn)。影響可呈現(xiàn)能力的因素,可以分為三個(gè)層級(jí):第一層級(jí)包括呈現(xiàn)工具、技術(shù)元數(shù)據(jù)和可保存數(shù)據(jù);第二層級(jí)包括保存期限、數(shù)據(jù)淘汰和數(shù)據(jù)完整性;第三層級(jí)包括運(yùn)行環(huán)境、復(fù)制更新、物理災(zāi)難、存儲(chǔ)介質(zhì)、專(zhuān)業(yè)技能、數(shù)字對(duì)象、信息管理和系統(tǒng)安全。影響第一層級(jí)呈現(xiàn)工具和技術(shù)元數(shù)據(jù)的因素比較單一,主要是第三層級(jí)中檔案從業(yè)人員的數(shù)字專(zhuān)業(yè)技能水平和數(shù)字對(duì)象的類(lèi)型。而影響第一層級(jí)中可保存數(shù)據(jù)的因素則較多,涉及第二層級(jí)和第三層級(jí)中的所有因素,其邏輯關(guān)系為:數(shù)據(jù)保存期限受數(shù)字檔案管理系統(tǒng)運(yùn)行環(huán)境、數(shù)據(jù)復(fù)制更新頻率、潛在災(zāi)害及存儲(chǔ)介質(zhì)壽命等因素的影響;數(shù)據(jù)是否被淘汰由存儲(chǔ)介質(zhì)的使用壽命和數(shù)字檔案從業(yè)人員的數(shù)字專(zhuān)業(yè)技能決定;數(shù)據(jù)完整性受檔案從業(yè)人員信息管理的有效性和數(shù)字檔案管理系統(tǒng)的安全性等因素的影響。

圖2:DARAM層級(jí)結(jié)構(gòu)
第二,智能控制指檔案從業(yè)人員面對(duì)可呈現(xiàn)的數(shù)字檔案時(shí),能完全了解其來(lái)源、管理其內(nèi)容,并能控制其開(kāi)放和利用。影響智能控制的因素,同樣可以分為三個(gè)層級(jí):第一層級(jí)包括數(shù)據(jù)標(biāo)識(shí)、利用條件;第二層級(jí)包括內(nèi)容元數(shù)據(jù)和信息管理;第三層級(jí)是數(shù)字對(duì)象。數(shù)據(jù)標(biāo)識(shí)和利用條件,直接影響檔案從業(yè)人員對(duì)數(shù)字檔案的智能控制。根據(jù)層級(jí)之間的邏輯關(guān)系,影響數(shù)據(jù)標(biāo)識(shí)的因素是第二層級(jí)的內(nèi)容元數(shù)據(jù)和信息管理,內(nèi)容元數(shù)據(jù)是描述數(shù)據(jù)屬性信息的,由第三層級(jí)的數(shù)字對(duì)象決定。影響利用條件的因素比較單一,主要是第三層級(jí)的數(shù)字對(duì)象。
DARAM的創(chuàng)新之處在于根據(jù)檔案從業(yè)人員的數(shù)字專(zhuān)業(yè)技能水平,把數(shù)字檔案保存所涉及的各種復(fù)雜風(fēng)險(xiǎn)因素用層級(jí)結(jié)構(gòu)加以清晰地呈現(xiàn),并進(jìn)行統(tǒng)計(jì)量化,設(shè)計(jì)出易理解的、可操作的數(shù)字檔案風(fēng)險(xiǎn)評(píng)估模型結(jié)構(gòu)。英國(guó)國(guó)家檔案館將DARAM設(shè)定為可持續(xù)使用的模型,為各級(jí)檔案管理機(jī)構(gòu)的數(shù)字檔案保存風(fēng)險(xiǎn)評(píng)估提供常規(guī)服務(wù)。即使數(shù)字檔案保存的環(huán)境不斷變化,按照這一模型,檔案從業(yè)人員依然可以定期進(jìn)行風(fēng)險(xiǎn)評(píng)估[14]。
在數(shù)字檔案保存領(lǐng)域,檔案從業(yè)人員和計(jì)算機(jī)軟件開(kāi)發(fā)者之間的合作比較普遍。然而,DARAM在構(gòu)建過(guò)程中,運(yùn)用了統(tǒng)計(jì)學(xué)的相關(guān)知識(shí),首次在檔案學(xué)科、統(tǒng)計(jì)學(xué)科和計(jì)算機(jī)學(xué)科之間建立了合作關(guān)系。三方充分溝通、交叉協(xié)作,明確彼此需求、及時(shí)調(diào)整方案,各方均為模型的成功構(gòu)建做出了貢獻(xiàn)。
第一,統(tǒng)計(jì)技術(shù)人員,主要負(fù)責(zé)風(fēng)險(xiǎn)因素和數(shù)據(jù)的統(tǒng)計(jì)和分析工作。在模型構(gòu)建過(guò)程中,統(tǒng)計(jì)技術(shù)人員結(jié)合檔案從業(yè)人員提供的相關(guān)信息和數(shù)據(jù),采用貝葉斯“支持某項(xiàng)屬性的事件發(fā)生得愈多,則該屬性成立的可能性就愈大”[15]的理論,對(duì)DARAM結(jié)構(gòu)中各因素發(fā)生風(fēng)險(xiǎn)的概率進(jìn)行量化,使層級(jí)結(jié)構(gòu)更加直觀和明晰。他們與檔案從業(yè)人員保持溝通,建議其做好數(shù)字檔案保存工作的信息記錄,協(xié)助解讀統(tǒng)計(jì)結(jié)果的相關(guān)數(shù)據(jù),從而準(zhǔn)確理解風(fēng)險(xiǎn)評(píng)估模型,對(duì)數(shù)字檔案保存風(fēng)險(xiǎn)進(jìn)行科學(xué)評(píng)估。
第二,軟件開(kāi)發(fā)者,主要負(fù)責(zé)DARAM模型及相關(guān)系統(tǒng)的軟件開(kāi)發(fā)。在模型構(gòu)建過(guò)程中,軟件開(kāi)發(fā)人員需要與檔案從業(yè)人員全程對(duì)接。在開(kāi)發(fā)初期,開(kāi)發(fā)人員向用戶(hù)方展示DARAM的初始功能,聽(tīng)取反饋意見(jiàn),不斷改進(jìn)設(shè)計(jì),確保DARAM能夠滿(mǎn)足最新需求。在開(kāi)發(fā)中期,不定時(shí)地舉辦研討會(huì),收集一線(xiàn)檔案從業(yè)人員更詳細(xì)、更具體的建議,開(kāi)發(fā)人員據(jù)此調(diào)整開(kāi)發(fā)思路,提供更直觀的界面,滿(mǎn)足具有不同數(shù)字技能水平的檔案從業(yè)人員的需求。在模型維護(hù)階段,開(kāi)發(fā)人員采用的特定編程技術(shù),允許任何具有基本編程知識(shí)的人對(duì)模型進(jìn)行簡(jiǎn)單的維護(hù)和更改,使DARAM模型具備可持續(xù)發(fā)展的特性。
第三,作為用戶(hù)方的檔案從業(yè)者人員,主要負(fù)責(zé)提出需求和提供數(shù)據(jù)。檔案從業(yè)人員向項(xiàng)目組其他學(xué)科的專(zhuān)家詳細(xì)闡釋檔案管理工作的內(nèi)容和流程,提出數(shù)字檔案保存風(fēng)險(xiǎn)評(píng)估的迫切需求。同時(shí),負(fù)責(zé)收集數(shù)字檔案的相關(guān)數(shù)據(jù)和信息,為模型各個(gè)節(jié)點(diǎn)的定位提供有效的、完備的數(shù)據(jù)支持,并參與模型每個(gè)變量和每個(gè)節(jié)點(diǎn)的調(diào)整工作。隨著開(kāi)發(fā)過(guò)程的推進(jìn),檔案從業(yè)人員主動(dòng)接觸其他學(xué)科,全程積極參與討論,逐漸理解模型構(gòu)建的結(jié)構(gòu),能更從容地應(yīng)對(duì)動(dòng)態(tài)變化的數(shù)字檔案保存環(huán)境。
英國(guó)國(guó)家檔案館與各級(jí)地方檔案管理機(jī)構(gòu)緊密聯(lián)系、深入調(diào)查,對(duì)檔案從業(yè)者的數(shù)字技能以及相關(guān)知識(shí)儲(chǔ)備進(jìn)行調(diào)研,根據(jù)需求確定愿景。DARAM的軟件開(kāi)發(fā)者向檔案從業(yè)人員收集具體問(wèn)題和建議,匯集風(fēng)險(xiǎn)數(shù)據(jù),建立風(fēng)險(xiǎn)證據(jù)數(shù)據(jù)庫(kù),構(gòu)建了可量化的數(shù)字檔案保存風(fēng)險(xiǎn)評(píng)估模型。我國(guó)目前尚無(wú)關(guān)于數(shù)字檔案保存風(fēng)險(xiǎn)管理的實(shí)用策略,也沒(méi)有具有可操作性的風(fēng)險(xiǎn)評(píng)估模型。我國(guó)檔案學(xué)界可以參考英國(guó)的做法,深化數(shù)字檔案保存風(fēng)險(xiǎn)管理的實(shí)踐探討。檔案管理機(jī)構(gòu)的決策者和數(shù)字檔案管理系統(tǒng)的開(kāi)發(fā)者應(yīng)深入檔案工作一線(xiàn),調(diào)查數(shù)字檔案保存風(fēng)險(xiǎn)管理的具體實(shí)踐以及存在的具體問(wèn)題,收集相關(guān)數(shù)據(jù)和信息,分析數(shù)字檔案保存所涉及的各種風(fēng)險(xiǎn)因素,設(shè)計(jì)適用于我國(guó)數(shù)字檔案保存的風(fēng)險(xiǎn)評(píng)估模型。
英國(guó)國(guó)家檔案館在DARAM構(gòu)建過(guò)程中,應(yīng)用了統(tǒng)計(jì)學(xué)科的相關(guān)知識(shí),看似與檔案學(xué)關(guān)聯(lián)度不高的統(tǒng)計(jì)學(xué)解決了數(shù)字檔案保存風(fēng)險(xiǎn)因素的統(tǒng)計(jì)問(wèn)題。目前,我國(guó)檔案管理機(jī)構(gòu)在開(kāi)展檔案數(shù)字化工作時(shí),尋求的合作對(duì)象多為計(jì)算機(jī)軟件開(kāi)發(fā)商。隨著信息技術(shù)的發(fā)展和檔案數(shù)字化建設(shè)的推進(jìn),數(shù)字檔案保存的技術(shù)環(huán)境更加復(fù)雜,所面臨的風(fēng)險(xiǎn)更加多樣[16],檔案管理部門(mén)需要更多學(xué)科的支持。我國(guó)檔案管理機(jī)構(gòu)可以借鑒英國(guó)的經(jīng)驗(yàn),打破思維定勢(shì),加強(qiáng)交流互動(dòng),學(xué)習(xí)其他學(xué)科的知識(shí),推動(dòng)數(shù)字檔案管理工作的發(fā)展。檔案工作者應(yīng)樹(shù)立多學(xué)科融合的理念,探討跨學(xué)科合作的可能性,并創(chuàng)新合作方式、拓寬研究視野、提升理論水平。
目前,我國(guó)檔案數(shù)字化大多采用服務(wù)外包的方式,基層檔案管理機(jī)構(gòu)缺乏信息技術(shù)人才。久而久之,數(shù)字檔案保存的風(fēng)險(xiǎn)管理工作會(huì)越來(lái)越依賴(lài)檔案服務(wù)企業(yè)的信息技術(shù)人員,這給數(shù)字檔案安全保存帶來(lái)了隱患。我國(guó)檔案管理機(jī)構(gòu)的決策者可以借鑒英國(guó)的做法,在檔案數(shù)字化外包的過(guò)程中,要求信息技術(shù)人員與檔案工作人員全程對(duì)接,并以舉辦研討會(huì)、座談會(huì)等形式,加強(qiáng)雙方的協(xié)作和交流。在彼此充分了解的基礎(chǔ)上,信息技術(shù)人員可以根據(jù)檔案從業(yè)人員數(shù)字技能水平和整體需求,設(shè)計(jì)易理解的、可簡(jiǎn)單維護(hù)的數(shù)字檔案管理系統(tǒng)或模型。最終,檔案從業(yè)人員就能有效參與數(shù)字檔案保存風(fēng)險(xiǎn)管理工作,降低對(duì)外包的依賴(lài)。