摘 要:國家數據治理體系和可信數據空間建設等是檔案事業發展規劃制定的重要背景,也是檔案事業發展規劃實現從“內向型”向“外向型”轉型時必須關注的重要因素。文章在闡釋可信數據空間基本涵義、主要任務等基礎上,對檔案機構參與可信數據空間建設的主要短板進行了分析;從理念、目標、行動與能力等方面,對將檔案機構作為可信數據空間重要節點、強化檔案數據處理流程的可信控制與經驗復制、深化多源數據融合利用與場景創新和確認檔案機構的可信數據第三方認證定位等進行了探討。將檔案數據治理融入國家數據治理體系與可信數據空間建設是“十五五”檔案事業發展規劃制定的重要原則。
關鍵詞:檔案事業;可信數據空間;十五五;規劃
分類號:G271
Archival Action in the Development of Trusted Data Space: A New Perspective from the 15th Five-Year Plan
Zhou Yi
( 1. Institute of Intelligent Society and Data Governance, Soochow University, Suzhou, Jiangsu 215127; 2. School of Social Science, Soochow University, Suzhou, Jiangsu 215127 )
Abstract: The development of the national data governance system and the trusted data space are important backgrounds for the formulation of the development plan of the archival undertaking, and they are also key factors that must be considered when the development plan of the archival undertaking transforms from an \"inward-oriented\" to an \"outward-oriented\" model. Based on the explanation of the basic meaning and main tasks of the trusted data space, this paper analyzes the main shortcomings of archival institutions in participating in the development of the trusted data space. From the aspects of concept, goal, action and ability, it discusses the positioning of archival institutions as important nodes in the trusted data space, strengthening the trusted control and experience replication of the archival data processing process, deepening the integration and utilization of multi-source data and scenario innovation, and confirming the positioning of archival institutions as third-party certification for trusted data. Integrating archival data governance into the national data governance system and the development of the trusted data space are an important principle for formulating the development plan of the archival undertaking in the \"15th Five-Year Plan\".
Keywords: Archival Undertaking; Trusted Data Space; the 15th Five-Year Plan; Planning
檔案事業發展規劃不僅要關注檔案事業自身發展需求,更要關注國家戰略對檔案事業帶來的新機遇、新挑戰與新要求。在國家數據治理體系建設等重大背景下,檔案事業如何融入國家數據治理體系并發揮獨特作用,是制定全國檔案事業“十五五”發展規劃時必須關注的問題。數據要素流通、數據要素市場建設、數據授權運營等問題是近年來國家數據治理中的熱點問題,回答并解決上述問題的關鍵之一是通過可信數據空間的建設來推動數據共享開放與融合應用。數據供需主體關系可信、數據質量與安全可信和數據流通應用生態可信等是決定數據要素流通狀態、數據要素市場活躍水平和數據要素價值實現程度的重要因素。本文通過解析可信數據空間的基本涵義,分析檔案機構融入數據治理體系的主要障礙及其在可信數據空間建設中的可能行為,從而改變我國檔案事業發展整體上所呈現出的“內向型”特征[1],為我國檔案事業發展規劃制定提供一個新視角。
1 研究背景、進展述評與問題提出
1.1 研究背景
在數字城市、智慧城市等建設中,全國各地特別是經濟發達地區以數據局(或大數據管理局)、數字城市運營管理中心、大數據公司等為依托或支撐,以公共數據流通為基礎,不同程度推進了“一網通辦”“一網通用”“一網統管”和“一屏總覽”等工程建設,并在有關地區陸續試點啟動建設城市生命線項目,嘗試構建城市層面的風險感知立體網絡,以數據聯動預判、數據關聯分析等為手段,對城市運營風險進行全方位、立體化感知,實現場景間數據共享、跨部門聯動處置和行業綜合監督。從全國各試點城市已陸續上線的城市生命線項目和相關應用場景看,目前遠沒有實現基于“應急場景”“突發事件”為中心的多源異構數據共享與融合應用,距離基于數據的風險預警與治理目標仍有一定差距。在實際調研中發現,產生上述現狀的主要原因是“數據共享與復用”的瓶頸未獲得突破,從數據要素市場上獲得的數據產品與服務質量有限[2],它們與智慧城市、數字城市及其生命線項目、數字經濟發展等需求并不匹配。雖然法律法規已對數據共享與開放有了明確規定,但在實踐中主觀上因擔心數據安全不愿共享、客觀上因數據標準不統一難以共享等極大地阻礙了基于數據的應用場景與服務創新。目前各級各類檔案機構基本游離于智慧城市及其生命線建設等重大應用場景之外,檔案數據要素如何進入流通渠道等也是困擾業界的基本問題。
1.2 研究與實踐進展
數據空間概念經歷了從數據空間到公共數據空間再到可信數據空間的認識深化。現在一般認為明確界定不同主體之間數據關系的數據空間概念是由米歇爾·富蘭克林(Michael Franklin)等人在2005年提出[3]。此后,一些國家和地區陸續開展相關實踐。德國于2014年提出“工業數據空間行動”。2016年歐盟提出建立國際數據空間(International Data Space, IDS)的倡議,并在其后出臺的《數據法案》中提出建立“歐盟共同數據空間”。2019年4月“國際數據空間參考架構模型3.0版”誕生,它涵蓋了數據提供者、數據使用者、中間經紀、認證中心等多種數據參與主體。2020年歐盟發布《歐洲數據戰略》,計劃打造涵蓋金融、農業、交通、能源、健康等十個領域數據要素共享交換的“共同數據空間”平臺,擬通過建立“歐洲云和數據基礎設施”,創建歐盟“數據空間”[4]。有專家認為公共數據空間是一種“加強版”數據空間[5]。可信數據空間則可以看作對公共數據空間的升級,其目標是構建一個可信安全的數據流通環境。在我國,2022年中國信息通信研究院聯合一些頭部企業和研究機構共同提出可信數據空間,并發布可信數據空間建設白皮書和系統架構標準[6]。江蘇、重慶、浙江等地分別在工業數據、政務數據與社會數據融合、產業或行業數據(如醫療健康數據[7]、鞋革產業數據[8]等)等領域開展可信數據空間實踐試點。有關研究較為系統地論證了數據空間的邏輯框架與技術實現[9],并對基于數據空間的產業數據、科研數據等流通利用進行了實證分析[10]。
目前學界對公共數據共享開放及其影響因素等問題的研究已較豐富。雖然近年來我國各地陸續出臺了一些公共數據共享與開放政策[11],公共數據共享與開放平臺建設也取得了較大進展,但因各單位或部門的數據分類分級工作進展緩慢、數據標準不統一等原因,公共數據在管理上聯動性弱、合力不強、數據質量不高、獲取存在障礙等問題較為突出[12]。也有研究對檔案數據治理的基本維度[13]和檔案機構參與公共數據開放的現狀、影響因素與進路選擇進行了初步分析,提出檔案機構應加強公共數據開放的“參與”設想[14]。這表明,雖然業界普遍認識到應加強公共數據共享與開放和數據交易,但因各種因素的影響,公共數據流通并未達到理想效果,檔案機構也未深度有效參與。
隨著國家數據治理體系的逐步完善,國家數據局、國家檔案局成為并行的數據管理職能機構。學界近年來對檔案機構如何處理與各級數據局的關系,實現檔案機構的職能轉型[15],如何優化檔案數據化與數據檔案化的方法和建立可信檔案數據體[16]等問題也有涉及,但這些研討多是立足于以檔案機構為中心所進行的“內向型”思路與方法設計,很少將檔案機構納入國家數據治理體系構建、可信數據空間建設中進行角色定位的重新思考。有研究表明,目前檔案管理與數據管理在同一個組織內的相對割裂已成為普遍現象[17]。如果檔案機構不主動融入國家數據治理體系和數字城市建設進程,不主動研究其在公共數據歸集、歸檔和流通中的職能,這將會使檔案工作失去前沿陣地,有令檔案管理面臨被邊緣化的危險[18]。
1.3 問題提出
雖然目前公共數據共享與開放、檔案數據治理等在制度導向、規則約束和行動實踐上已取得了很大進步,但如何進一步以“人”“事件”“業務流程”等為中心,培養以應用場景導向的數據共享開放與融合服務能力,迫切需要通過建立“可信數據空間”來有效破解數據共享開放難、融合應用難和市場開發交易難等問題。在智慧城市建設和數據要素市場發展的大背景中,如何對待檔案機構在可信數據空間建設中的作用,如何理解可信數據空間的內涵與特征,如何推動以應用場景導向的數據共享與融合利用,如何確立檔案機構參與可信數據空間構建的行動定位等就成為基本理論問題。在回答上述理論問題時,將目前基本處于隔離狀態的檔案機構納入數據治理體系,尋找和發現檔案機構在可信數據空間建設中的短板和行動方向,有效推動檔案機構主動融入國家數據治理格局就成為一個重要議題。檔案機構在制定檔案事業“十五五”發展規劃時有必要將其置于國家數據治理體系構建框架中重新思考其行動定位與主要任務。
2 可信數據空間的基本涵義及其主要內容
2.1 可信數據空間的基本涵義
國家數據局在印發的《可信數據空間發展行動計劃(2024—2028年)》(以下簡稱《行動計劃》)中明確了可信數據空間的定義,即基于共識規則,聯接多方主體,實現數據資源共享共用的一種數據流通利用基礎設施,是數據要素價值共創的應用生態,是支撐構建全國一體化數據市場的重要載體[19]。上述定義明確的可信數據空間基本涵義包括:
一是可信數據空間建設的基本條件。可信數據空間建設首先需要有一個多方主體認同并遵守的共同規則。這個共同規則要規定參與可信數據空間的相關主體及其權益關系、數據流通客體及其授權方式、數據流通過程規范與控制方法等。在數據流通利用過程中,哪些相關主體有資質參與,怎樣判斷參與流通的數據是可信的,哪些場景、服務、業務可以融合利用何種數據等都需要有制度、規則予以明確,并通過一系列規范流程來保證其實現。確定上述這些基本條件的最終目標是為了讓數據有序自由流動,從而創造更多價值。因此,各類政策與制度主體、參與主體等需要在上述內容上協調行動。
二是可信數據空間的數據來源。可信數據空間的數據來源是多源異構的,它們可以來源于數據形成者與保管者的共享開放,也可以來源于數據要素市場上的數據產品與服務交易。在數據類型上可以是結構化數據,也可以是非結構化數據。不管其來源與類型如何,其基本要求是數據的合法合規和可信可用。例如,城市可信數據空間可以由公共數據、個人數據、企業數據或其他社會數據等多種不同來源與類型的數據共同組成,它是一個可信、可控、可用的數據集合體。
三是可信數據空間的主要類型。《行動計劃》提出,未來幾年國家將積極推廣企業可信數據空間、重點培育行業可信數據空間、鼓勵創建城市可信數據空間、穩慎探索個人可信數據空間、探索構建跨境可信數據空間等多種不同類型的可信數據空間建設。上述可信數據空間類型仍可進一步細分。例如,企業或行業可信數據空間可以依企業性質、所屬產業、行業內容等進行細分,城市可信數據空間可依交通、通訊、供水、供電、消防等生命線項目進行細分。
四是可信數據空間的表現形式。其既可以是一種數據基礎設施,也可以是一種數據應用生態,同時也是一種數據融合利用載體。作為一種數據基礎設施,可信數據空間本質上首先是數據流通與融合利用的系統性架構設計與基礎設施建設過程,通過將訪問權限控制、加密、記錄、審計、交互、分析等功能集成,承載促進多主體間的數據流通利用;作為一種數據應用生態,重點是解決數據標準、數據核驗、數據授權、數據審計、數據重用、數據關聯、數據安全、流程溯源等相關的政策、制度和流程問題,克服數據要素安全可信流通的技術、管理和法律障礙;作為一種重要載體,就是要通過這個載體實現多源數據流通與融合利用,影響數據流通利用的有關障礙因素如安全、信任、價格、服務等均能在空間載體內得到解決。
2.2 可信數據空間建設的主要內容
可信數據空間是一個從數據源到數據加工處理和流通利用全過程所有環節都處于可控、可信的狀態。為了實現這個目標,其主要工作內容是:
第一,數字基礎設施安全可信。數字基礎設施可信是在現有信息網絡上搭建數據集聚、流通和利用的分布式關鍵數字基礎設施,通過體系化的技術安排確保數據流通制度與協議的確認、履行和維護,解決數據提供方、使用方、服務方等主體間的安全與信任問題。體系化的技術主要包括安全技術、隱私計算技術、存證溯源技術、數據控制技術、管理技術和語義互操作技術等。通過體系化的技術安排、關鍵數字基礎設施的科學架構,促進參與數據流通的各方主體間建立起信任關系,有效擴大數據流通與應用范圍,加大數據價值釋放。
第二,數據供需主體關系可信。此處是指參與可信數據空間的供給、需求主體之間具有可信任關系基礎,并依法律法規或相關規定就數據共享、供給與使用等達成共識或契約。信任是數據流通關系確立的基礎,信任既源于供需主體以往發生的數據合作行為,也來源于制度與契約的約束安排。對數據供給者而言,可以信賴數據使用者遵守有關數據使用約定,以合乎道德和法律且安全和負責的方式使用數據,不會給數據提供者帶來困擾或風險[20]。對數據需求者而言,它信任有關提供者共享的數據,對數據來源的合法與合規性、數據的真實性與可靠性等質量要求表示信賴,并認為合法使用和開發這些數據不會給自身帶來風險。目前我國數據流通容易陷入“不敢”“不愿”“不能”的尷尬現象[21],其重要原因之一就是數據供需主體相互之間的信任關系尚未很好建立起來。即使是在公共管理系統內部,不同部門之間也普遍存在數據共享的“不敢”“不愿”“不能”等現象。在公共數據授權運營中,目前較多的是將公共數據授權給國資控股的大數據公司進行運營,政府除有利益因素的考量外,也有出于對數據安全風險可控的因素。這表明,數據供需主體之間和不同類型數商之間的信任關系并未很好建立。主體之間的信任關系既需要通過具體的數據流通過程及其體驗來建立,也要通過專門的數據治理機制來保障,即數據流通過程需要治理,而治理的可信度關系到數據流通關系的信任[22],可信的數據治理機制才能保證形成可信的數據流通關系。
第三,數據來源及其質量可信。數據可信是指數據提供者所提供的數據是合法合規的,是符合數據標準和數據質量要求的可用數據[23]。數據產生與應用的場景性導致數據來源和形式的多樣性與異構性,數據是否可理解、內容是否準確、格式是否一致、機器是否可識讀、數據是否具有互操作性等是評價數據質量的主要維度,它們也是影響數據可用的主要因素。因此,數據可信意味著有關數據治理主體應通過數據清洗整理、分類分級和數據標準化等治理活動來提高數據質量,數據提供者能通過有關機制或手段(如建立數據來源和數據信任標準、進行檔案數據的“四性檢測”等)保證數據可信,并從制度、技術等維度上消除數據可用性的障礙。當前已有國際組織在智慧城市建設框架下努力建立數據標準,涉及元數據、詞匯表、數據來源等。也有學者基于ISO文件管理國際標準的協同應用,具體研究了可信數據的內涵及其實現路徑[24]。
第四,數據處理與流通過程可控可信。它是指數據歸集與處理、流通利用等過程是在安全可控的環境和規則約束下進行。數據處理與流通是數據脫離原數據持有者控制環境,滿足不特定主體在新場景下或為新目的而進行加工與使用。數據處理與流通在全面受控的環境或平臺系統中完成,應使處理、流通和使用過程可記錄、可控制、可審計,以便在出現違約或違法責任時能夠查明事實和明確責任。這樣的環境或系統應由可信的第三方建立并控制。由第三方構建數據處理與流通系統環境,建立雙方可信賴的數據流通規則,建立流通和使用過程日志,使過程可被控制、監督和審計,這就成為數據處理與流通的必然要求。在非營利性的檔案機構或圖書館,營利性數據中介機構、數據交易所、數據公司等主體中,哪些主體能夠成為可信的第三方或是唯一的第三方等是需要討論的問題。從數據流通方式上看,數據共享、開放和交易等是數據流通的具體方式。數據中介機構、數據交易所等主要面向數據交易這種流通方式,而大數據局、具有國資背景的大數據公司及其主導建設的公共數據開放平臺、檔案機構或圖書館等則可能成為面向數據共享與開放的可信第三方主體。
3 可信數據空間建設中檔案機構的存在問題
檔案機構參與可信數據空間建設有著先天優勢。例如,檔案數據的形成過程經過了嚴格控制,其本身就是可信數據;檔案機構特別是綜合檔案館是國家檔案數據資源保管基地,因有國家信任和政府力量支撐,公眾對其帶有天然的信任感;檔案機構在數字化轉型中已經形成了作為可信第三方主體的基本環境,電子檔案單軌制管理的業務流程與控制程序等均可以復制并作為可信第三方主體的業務過程等。但檔案機構在參與可信數據空間建設中也存在一系列短板。主要表現在:
第一,理念上的滯后。檔案機構及其工作人員尚未形成自覺融入智慧城市、數據要素市場、可信數據空間及各類應用場景建設的主動意識,一個重要的表現就是目前在各類數據制度、數據標準、數據應用場景開發等工作中很少看到有檔案機構的主動參與。據對全國各地30多個公共數據治理政策文本的量化統計分析后發現,目前僅有《蘇州市數據條例》涉及對存量檔案進行數據化管理的相關規定[25]。絕大多數檔案機構至今仍未認識到其管理的就是數據,也沒有主動與地方數據局、大數據中心等發生業務聯系[26],檔案數字化、智慧檔案館建設等也未進入智慧城市建設體系和地方數據治理整體框架。雖然檔案數字化與數據化已初步形成共識,但如何從檔案中提取檔案數據要素、建立檔案數據語義關聯、開展檔案數據加工開發等工作仍處于起步階段。如何在保證檔案數據治理特色的同時,將檔案數據治理融入國家數據治理體系、數據要素流通體系和可信數據空間建設的大局,這在理念上需要檔案機構及其工作人員作出重大調整。
第二,制度上的疏離。檔案管理、數據管理目前是兩個相對獨立和隔離的系統,對此檔案界已有學者從體制與機制上進行過一定分析[27]。檔案管理制度、數據管理制度相互獨立,在內容上并未實現兼容。例如,在公共數據共享與開放等政策文本中極少有涉及存量檔案數字化、檔案數據經審核后進入共享開放平臺等相關規定。無論是檔案管理制度還是數據管理制度,一般都對有關基礎數據庫、專業數據庫是否歸檔以及如何實施歸檔等缺少應有規定,這在科學數據管理中表現得較為突出。雖然有關政策規定科學數據是屬于應當歸檔的科研文件材料,但科研機構將科學數據匯集到單位數據中心或區域與國家科學數據中心的過程,這是否意味著就完成了歸檔這一法律程序,即賦予科學數據檔案身份并使其獲得法律上的憑證價值?對此,目前我國《科學技術研究檔案管理規定》和《科學數據管理辦法》等均未明確。如果對標《中華人民共和國檔案法》中關于電子檔案 “來源可靠、程序規范、要素合規”的構成要件要求,不管單位數據中心或國家區域性、行業性科學數據中心等是否具備對科學數據進行鑒定的資質與能力也需分析。產生這些問題的主要原因在于檔案管理與數據治理兩個政策系統在制定相關規定時較少進行有效溝通與協調行動。
第三,行動上的缺位。雖然近年來全國數字檔案館建設取得了顯著成效,至2023年底,通過省級及以上檔案主管部門認證的數字檔案館已達369個[28],全國檔案查詢利用服務平臺也在2022年成功上線,但在檔案服務行動實踐上,數字檔案館與全國檔案查詢利用服務平臺仍局限于檔案目錄、檔案文本等的查詢,即使是檔案內容全文檢索服務也沒有充分實現,更沒有深入到檔案數據層面。由于基層檔案室和各級綜合檔案館一般以立檔單位為中心的“機關全宗”為單元開展檔案管理,除城建檔案等個別專業性較強的檔案類型外,面向業務對象(以業務活動為中心的多個數據來源)的“客體全宗”思維尚未成為檔案管理的主導行動,這就導致同一業務活動處于不同流程的檔案數據可能分散于不同立檔單位的“機關全宗”。基于相同或相近的“業務流程”“項目”“事件”等中心的檔案數據挖掘與關聯服務也就無法實現。在電子文件單軌制管理、數據檔案化和數據融合應用等背景下,如何在保證同一單位“主體全宗”電子文件聯系性、完整性和系統性的同時,以對象為中心將多個主體形成的數據按業務活動進行歸集并形成客體全宗,從而為檔案數據服務創造條件,這是以應用場景為導向實現數據價值共創與增值需要解決的問題。對此應引起檔案機構和數據管理部門的關注。
第四,能力上的不足。檔案機構是否能夠成為可信數據空間的重要節點,不僅取決于檔案機構保存有何種數據,而且取決于其是否具有數據流通利用可信管控能力、數據資源交互能力和數據價值共創能力。可信管控能力是指能夠支持對空間內主體身份、數據資源等開展可信認證,支持對數據流通利用全過程動態管控,支持實時存證和全程溯源。雖然目前學界已經提出要從數字檔案館實現向智慧檔案館轉型,但要形成一種無形的、可遠程動態存取的檔案數據管理與利用基本環境還有很長的路要走;檔案事業系統作為可信數據空間運營者的存證體系、溯源體系和權益保障體系建設等,若要取得實質性進展也須進行超前規劃。數據資源交互能力是指支持不同來源數據資源與服務在可信數據空間的統一發布、高效查詢、跨空間與跨主體互認等能力。目前全國檔案機構在統一檔案數據目錄標識、數據資源目錄維護、歸檔與利用主體身份認證、業務系統與電子文件管理系統的接口要求等方面均存在不同程度的障礙,各類檔案機構的互聯互通也面臨著很多困難,這既有技術能力的問題,也有認識水平、標準應用等方面的障礙。數據價值共創與增值能力是指支持多主體在規則約束下共同參與包含檔案數據在內的數據開發利用,推動數據資源向數據產品或服務、數據資產的轉化。檔案數據資源開發利用作為檔案界的一個永恒主題,在規劃或理論研究中始終是一個熱門話題,近年來雖有面向應用場景、面向紅色檔案等的一系列理論研究與開發實踐,但其是否支持并為各方參與主體公平地創造了開發利用條件尚有待觀察,檔案機構與數據開發、數據經紀、數據托管、數據安全、合規審查等數商之間的合作關系有待拓展。
4 可信數據空間建設中的檔案行動方向與對策
對照可信數據空間的基本涵義及其主要內容,考慮到檔案機構的基礎及其特點,檔案機構的主要定位不是進行可信數字基礎設施建設和數字安全技術等開發應用。由于檔案機構歸集與處理數據的原理與流程有一定的獨特性、規范性和嚴密性,“歸檔”或“建檔”這個流程本身也賦予了檔案數據的法律憑證價值,這都在最大限度上保證了檔案數據的可信。受歷史原因、政策保障和功能定位等影響,檔案機構作為數據供給方的信任關系也歷來得到了社會很大程度的尊重。因此,圍繞檔案機構融入國家數據治理體系的行動規劃,主要應著力于如何進一步發揮檔案機構的可信主體身份、檔案數據的可信客體內容價值等進行,檔案機構應以更加開放的姿態主動實現與有關數據治理主體的對接,以應用場景創新推動數據融合利用,從而促進各類數據價值的最大釋放。
4.1 在認識上,檔案機構應確信其可以成為可信數據空間的重要節點
第一,將檔案機構作為可信數字基礎設施和可信數據供需關系的重要節點,在條件成熟時可將其作為可信數據的第三方認證機構。從可行性與必要性以及具體路徑上看,目前首先要提高檔案數據平臺與公共數據平臺的對接和融合能力。據調查,目前全國31個省、直轄市、自治區(不含港澳臺)中已有22個行政區域建立了公共數據共享與開放平臺,其中有13個檔案機構接入了平臺[29]。這表明檔案機構與公共數據開放平臺開始有了一定程度的合作,但這并未成為各地的主動選擇和主動作為,檔案機構在公共數據共享開放中的影響力十分有限。產生上述現狀既有檔案機構自身的因素,也有外部體制機制的因素。從檔案機構自身看,主要表現為檔案數據具有歷時性特點、檔案數據有25年的封閉期(雖可經過審核后提前開放,但為規避提前開放的風險,目前檔案機構多以到期開放和延期開放為主)、檔案機構的主動作為及其影響力有限(例如在地方數據立法中少有參與)等。從外部因素看,有學者認為在體制改革后因檔案機構隸屬于黨委系統、數據管理部門隸屬于政府系統,全國層面的法律法規和地方層面的大數據發展戰略很少提及檔案機構如何參與公共數據開放,這就在一定程度上形成了檔案機構參與數據共享開放的障礙[30]。此種觀點雖有一定道理,但其并沒有揭示出深層次的原因。從制度文件看,雖然其并未提出檔案機構在公共數據共享開放中的功能、角色和定位,但目前有關制度文件所指向的“公共數據”范疇一般也覆蓋到了檔案機構及其所形成與保管的檔案數據,檔案機構特別是綜合檔案館也是一種公共服務部門,其形成與保管的數據理應進入公共數據共享開放平臺。檔案機構不能因制度中未有專門指向性內容而將自身置于制度規定之外。從理想化狀態看,在政策制度設計上可以進一步強化作為專業性數據管理部門的檔案機構在公共數據共享與開放中的更大作為空間(如作為可信數據的第三方認證機構),但檔案機構當前的首要任務是將自身作為一個數據共享與開放的義務主體對待,充分履行檔案數據開放義務,克服因檔案數據開放分類標準(分為“提前開放”“到期開放”和“延期開放”)與公共數據開放分類標準(分為“無條件開放”“有條件依申請開放”和“不予開放”)的兼容性障礙,在檔案數據共享開放基礎上深化檔案數據與開發利用,將檔案數據開放利用平臺接入或鏈接(如美國政府數據開放平臺就采取“架橋”的鏈接方式)到公共數據開放平臺,推動實現包括檔案數據在內的多源異構公共數據治理融合。
第二,適度擴大檔案機構在國家數據治理體系中的功能。在實現上述基本性目標后,在有能力與技術保障的基礎上,檔案機構可以主動適度發揮其專業性數據管理機構的功能,在數據標準制訂、數據質量評價、數據可信性與安全性審查等方面發揮更大作用。正如有學者提出要加大檔案數據治理力度,實現數智時代檔案數據的“重做”與“重塑”[31]。事實上,這種“重做”與“重塑”就是要建立一種可信的檔案數據治理機制,以實現可信的檔案數據流通,并實現其向其他類型數據流通領域的輻射。這就要求“十五五”期間檔案機構在管理理念、工作力度、制度設計等方面更加主動開放,打破現有檔案工作和數據工作分屬黨委和政府管理的格局限制,實現檔案數據治理主動融入國家數據治理體系。在近年來國家數據治理空前強化和政策頻繁出臺的背景下,檔案機構應抓住編制全國檔案事業“十五五”發展規劃的契機,以思想解放、認識到位為基礎,以制度銜接與平臺對接為切口,以檔案機構作為可信數據第三方認證機構為目標定位之一,持續加強向上對接、向下延伸、橫向協同、多維融合,在國家數據治理體系的視野下,完善檔案數據治理體系和深化檔案數據流通利用布局。
4.2 在目標上,以可信檔案數據為基礎開展數據融合應用創新
第一,以檔案數據為基礎,創新以主體或客體為中心的數據融合應用場景。在智慧城市建設整體框架下,打破檔案數據在來源、立檔單位和保管單元等方面的局限,以人、事件、項目等為中心,匯聚城建檔案、科技檔案、人事檔案、社保檔案等多源多模態檔案數據,主動融合其他各類共享開放的公共數據,形成面向不同需求的數據融合應用場景,提高數據融合應用服務與社會需求的適配能力。檔案數字化不等于數據化,學界提出檔案數據資源是“模擬態”“數字態”“數據態”三態并存的觀點就有此意[32]。“數據化”意在通過著錄、元數據增強、自由標注等方式實現檔案對象的精確化描述、語義化表達與知識化重組,[33]以人、事、物和業務過程等為中心,通過深入提取相關數據,進一步揭示檔案本身的歷史聯系,形成關于人、事、物和業務過程中心的數據整合體,并在核驗基礎上將其歸集到檔案數據開放平臺或公共數據共享與開放平臺。從現有進展看,在“模擬態”“數字態”“數據態”三種類型的檔案資源中,數據態的檔案數量比較有限,且檔案機構對數據態檔案是否進行了可信與可用鑒定等也是一個疑問。因此,從可信、可用需求出發,檔案機構有必要進一步強化數據態檔案治理工作,通過分析檔案數據形成者的地位、數據價值、數據關系、數據安全狀態等,將真實可信、完整可用的檔案數據作為可信數據空間的重要數據來源。此外,檔案機構還可以主客體等為中心分別進行不同來源檔案數據的匯聚、校驗與整合。在不改變檔案實體的全宗歸屬和管理秩序前提下,通過提取描述檔案形式與內容、檔案管理環境、檔案存儲與安全等特征的一系列數據,并按特定主體(企業、個人等)或客體(業務流程、工程項目、科研課題等)為中心進行邏輯上的數據匯聚、校驗與整合,形成關于主客體的檔案數據完整畫像,通過檔案數據的邏輯控制檢驗檔案數據的可信度并實現檔案數據的增值,這也在一定程度上可以解決因主客體全宗劃分而可能帶來的從主體全宗中抽取文件材料和部分文件材料重復歸檔等難題[34]。2024年1月,國務院發布《關于進一步優化政務服務提升行政效能推動“高效辦成一件事”的指導意見》,明確提出要從源頭加強數據治理,圍繞企業和個人兩個全生命周期編制“一企一檔、一人一檔”數據規范,推動實現“一數一源一標準”。這種以企業、個人等主體為中心形成檔案數據整體的做法,也可進一步推廣到以項目、流程等客體為中心的檔案數據治理過程中,從而形成“一個業務流程、一套檔案數據”“一個科研項目,一套檔案數據”的數據治理格局。在以業務流程、科研項目等為中心匯聚來自不同主體的相關數據時,數據的相互校驗、格式統一等就成為一個必需的過程。這個過程不僅是檔案機構的任務,也可以吸納各級大數據管理部門、數據企業、數據形成者、公共數據平臺等共同完成。
第二,拓展數據共享開放與融合應用的深度與廣度。智慧城市建設、數字經濟發展等領域的建設都需要檔案數據作為重要支持,檔案機構作為數據資源單位需要用高水平的檔案數據服務、優化檔案數據產品供給來回應這些現實需求[35]。以檔案數據為基礎與依托,結合數據要素市場數據產品交易的多樣化形式(數據集、數據服務和數據應用),實現數據關聯、信息增值、知識挖掘和智慧服務。即從關注文本與內容服務轉向關注知識發現與決策服務,在保證檔案文獻、文本、內容等傳統服務特色的基礎上,檔案機構應更多向基于數據的知識服務和智能決策支持服務升級。在服務中注重公平,強化檔案數字與數據的包容服務。將公平性作為基本目標,兼顧不同人群的信息和數據素養差異,在大力運用信息技術開展線上服務、自助服務的同時,保持檔案數據服務手段和方法的多樣性,對弱勢群體、邊緣化社群提供有溫度的檔案數字與數據援助服務。
第三,創新開發數字人文建設項目。以檔案數據資源體系建設(含口述檔案、照片檔案、聲音檔案、城建檔案等)為基礎,構建資源本體和口述檔案知識資源圖譜,通過對空間資料、城建檔案、史料資源、調查資料、創作資料等進行整合,實現專題、專類、時間軸、信息流、互動平臺等可視化表達。從整體概況、事件主題、社會網絡關系、時空關系等維度出發,進行有關立檔單位和區域發展進程的再現和檔案數據的知識發現,以多維度、可視化的數字記憶資源庫或內部展示網站等方式進行數字人文項目的成果呈現。嘗試采用建筑圖像識別技術,實現對地標建筑、商業建筑的城建檔案數據服務與利用,讓城建檔案數據融入大眾生活。通過參與對非遺資源、傳統村落、歷史文化街區等的主動建檔與數字化呈現展示,拓展檔案機構的數字人文項目開發功能。
4.3 在行動上,強化檔案數據處理流程的可信控制與經驗推廣
在檔案數據歸集與處理過程中,檔案機構有一套相對規范的檔案數據選擇、價值與真偽鑒定、安全性與可用性審查等業務流程,它從源頭上保障了檔案數據具有更高的可信度與可用性,這些流程需要得到進一步強化,并總結形成可供復制推廣的數據治理經驗。具體而言:
第一,強化數據歸檔與建檔的程序把控,保證檔案數據的可信、可用。數據檔案化就是將具備檔案屬性的數據實現歸檔保存與整序,從數據的合規性、程序性和技術性等方面開展一系列審查。合規性即審查數據來源是否合法、有關數據是否屬于歸檔范圍;程序性即進行數據的檔案屬性判斷,分析其可信度、真實完整程度、保存價值并賦予其相應保存期限等的過程;技術性是對數據的歸檔方式、數據格式及其標準化程度、數據可用性與安全性等進行判斷。數據檔案化不僅是數據的歸檔或建檔過程,更是數據的真實可用與完整、價值與密級、標準化程度及其數據轉換等狀態的分析過程。從這個環節看,在數據檔案化過程中,檔案機構對數據來源與質量負責。檔案數據提供者所提供的檔案數據是合法的,是符合其特定數據標準和其描述的質量的可用數據[36],并且這些數據因經歷了“歸檔”這個認定檔案價值的法律行動[37],具有法律意義的可采信證據力。
第二,發揮檔案機構在檔案數據化與數據檔案化中的經驗優勢,主動參與公共數據平臺的數據交叉核驗。從國際實踐看,目前很多機構除開始對業務數據進行歸檔管理外,一些著名的預印本平臺arViv、全球互聯網檔案平臺Internet Archive等數據項目也在借鑒檔案管理的理念與方法,全球數據管理領域呈現出“檔案主義”的變革趨勢[38]。以此為啟示,在實踐中檔案機構可以將其所形成的相關管理經驗向數據管理領域輻射。目前可行的做法是檔案機構可以將其保存的檔案數據與其他業務部門形成的相關數據進行交叉核驗,并利用電子文件管理系統的“四性”檢測模塊來實現對數據的檢測與處理。在紙質檔案為主和紙質檔案與電子檔案雙軌制運行階段,檔案的原始性、歷時性和憑證性等特征決定了檔案數據的可信可用。這些檔案也為檔案機構參與相關數據交叉核驗提供了可能性。在電子文件單軌制管理階段,由于電子文件系統的部分功能與業務系統實現了融合,有關數據“四性”檢測的要求可以提前嵌入業務系統,在業務系統中形成的相關數據在達到“四性”檢測要求后可以通過一鍵歸檔完成檔案化過程。換言之,在有關業務部門將共享與開放數據向公共數據平臺進行歸集時,運用這種具有“四性”檢測的業務系統功能就是一個重要選擇。從發展目標上看,檔案機構可以圍繞著將其定位為可信數據第三方認證主體的目標開展相關實踐行動與能力建設。
4.4 在能力上,提升檔案機構主動參與可信數據空間生態建設水平
“能力建設”是“十五五”檔案事業發展規劃的關鍵問題[39],能力維度可以包括政策能力、執行能力、技術能力、服務能力和協同能力等。檔案機構參與可信數據空間建設,需要具備的主要能力是融合或融入能力。這種融合或融入能力包括:
第一,數據融合應用的能力。在檔案數據化和數據檔案化的推進過程中,檔案數據的真實性、可信性等始終是檔案數據區別于其他數據的核心特征。檔案機構的核心功能之一就是通過保護檔案數據來保證社會活動原始面貌可以得到再現。因此,檔案機構應充分發揮社會信任的基礎條件,通過檔案數據融合利用來創新可信數據空間建設方向。具體來看,檔案數據融合利用主要表現在:一是突破以往檔案實體管理中所存在的立檔單位或全宗界限,實現不同來源檔案數據的融合利用,對此前文已經做過具體分析;二是推動歸檔數據與建檔數據的融合、結構化與非結構化數據的融合,形成更加完備的檔案數據融合利用體系;三是加強檔案數據與各類非檔案數據的融合利用,特別是檔案數據與文化遺產數據、古籍資源數據、城市管理數據、產業發展數據、平臺運營數據等融合,推動檔案機構主動參與建立企業、行業、產業、個人、城市等可信數據空間。例如,可以借鑒浙江嵊州的實踐經驗,按照“個人—生命階段—事項—事務”的基本邏輯建立數據架構,將來源于不同機構或部門的個人數據經校核、合并去重等,生成可信可用的數據,形成基于個人全生命周期的檔案數據庫[40]。從總體上看,浙江嵊州的實踐已經不同程度上實現了上述三類數據的融合。雖然其尚未完全突破個人數據主要來源于檔案機構的局限,但它已經開始與域內大數據主管部門、產生個人數據的相關職能部門在數據獲取與真實性核驗上開展了合作。從上述實踐可以看到,檔案機構只要有意識和動力開展數據融合利用,它們就能發現參與可信數據空間建設的具體場景和行動方向。
第二,數據標準的融入能力。相關主體應主動規劃和調整檔案數據標準建設思路。據有關研究,目前我國電子檔案管理有36項國家標準、48項行業標準、47項地方標準、5項團體標準和27項企業標準,全面覆蓋基礎類、對象類、過程類、系統類、監測評估類與應用領域類6個類別,電子檔案管理標準體系基本形成。在電子檔案數據化管理、電子檔案長期保存與格式管理、可信數字倉儲構建等方面的標準化工作仍有較大努力空間[41]。為了發揮可信數據空間的生態規劃能力,有效推進電子檔案管理標準與各類數據管理標準的對接和協調,各級檔案主管部門、高等學校、社會力量應在消化吸收智慧城市建設、數據治理領域國際國內標準的同時,加大力度研究制訂面向可信數據空間構建的檔案數據管理新標準,主動將電子檔案管理標準的適用范圍向數據基礎設施、數據處理過程、數據質量評價等方向進行延伸,從而滿足可信數據空間構建中保障數據源可信、數據質量可信、數據流通可信等對標準的要求。
第三,數據制度的對接能力。檔案數據治理雖然有其獨特的個性,但同樣適用數據治理的基本理論與方法。目前我國檔案管理制度建設相對封閉,體系上也自成一統,一定程度上體現了檔案管理制度的針對性和有效性。但在數據要素市場中如何進一步發揮檔案數據要素價值、如何對屬于公共數據范疇的檔案數據開展授權運營、在數據分類分級中如何對待檔案開放審核的獨特性、在檔案數據進入流通后如何處理相關主體的權益關系等,也正是目前我國數據基礎制度所要解決的共性問題。因此,在制度建設上,檔案機構不能僅關注制度內容的特性,而忽略了數據基礎制度創新所帶來的普遍要求和深度變化。比較明智的態度是,從底層上掃清檔案管理與數據治理的障礙,承認檔案也是一種數據或數據來源,在管理上尊重檔案數據的特性,在流通利用上推動檔案管理制度與數據基礎制度的對接,在行動上主動參與數據基礎制度和可信數據空間共同規則的建設,從而實現檔案管理與數據治理的融合。
5 結 語
“十五五”時期的檔案事業發展正處于國家數據治理體系與治理能力建設的關鍵階段,以可信數據空間建設來促進數據要素市場發展和數據流通利用正成為數據治理的重要抓手。如果在檔案事業發展規劃中沒有看到這個時代之變,仍然是關起門來進行“內向型”的規劃設計,仍是就目前檔案機構的現行能力進行目標規劃,那么檔案事業發展規劃就會從“規劃”降格為“計劃”。只有從理念、目標、行動和能力等方面將檔案事業置于國家數據治理體系構建、數據要素市場發展和可信數據空間建設等視野中進行思考,檔案事業發展才會獲得更大機遇并產生更大作為。開放、協同、融合和融入應是“十五五”檔案事業發展規劃制定的關鍵原則。
注釋與參考文獻
[1][26][39]徐擁軍,加小雙,王興廣.“十五五”時期檔案事業發展的“能力建設”轉向[J].檔案與建設,2025(1):7-15.
[2]周毅.基于數據價值鏈的數據要素市場建設理路探索[J].圖書與情報,2023(2):1-11.
[3]FRANKLIN M, HALEVY A, MAIER D. From databasesto dataspaces: A new abstraction for informationmanagement[J]. Sigmod Record, 2005,34(4): 27-33.
[4]Data.europa. Eu and the European common dataspaces[EB/OL]. [2024-12-24]. https:// op.europa.eu/en/publication-detail//publication/ a368044f-e21b-11eca534-01aa75ed71a1.
[5]蘇宇,盧怡.數據要素可信交易流通:共同數據空間的制度塑成[J].電子政務,2024(12):53-64.
[6]可信數據空間領域相關標準及白皮書編制啟動會在廣域銘島召開[EB/OL].[2025-02-04]https://baijiahao.baidu.com/s id=1776974903789580435wfr=spiderfor=pc.
[7]楊云龍,張亮,楊旭蕾.可信數據空間助力數據要素高效流通[J].郵電設計技術,2024(2): 57-61.
[8][21]金春華,王逸群.數據流通基礎設施建設迎來新機遇:可信數據空間,浙江怎么建[N].浙江日報,2024-12-02(4).
[9]劉博文,夏義堃.基于數據空間的產業數據流通利用:邏輯框架與技術實現[J].圖書與情報,2024(2):33-44.
[10]錢錦琳,夏義堃,紀昌秀.數據空間視域下科研數據共享的思維鏈推理與行為策略研究[J].圖書與情報,2024(2):45-54.
[11][25]周毅,陳必坤,馬江華,等.基于文本量化分析的我國公共數據治理政策發展研究[J].情報學報,2023(4):436-452.
[12]周林興,林凱.城市數字化轉型視域下公共數據資源開放共享機制研究[J].現代情報,2022(9):16-28.
[13]周毅.檔案數據治理的認識維度及其價值[J].檔案與建設,2023(2):8-12.
[14][29][30][33]張博聞.公共數據開放的“檔案參與”:現狀調研、影響因素與進路選擇[J].檔案學通訊,2024(4):71-79.
[15]周文泓,文利君,賀譚濤.組建國家數據局背景下檔案機構的職能優化策略研究[J].北京檔案,2023(9):7-12.
[16][40]劉越男.從客體全宗到面向對象的可信數據體:數據檔案化治理方法論探析[J].檔案學通訊,2024(4):13-21.
[17]何思源,劉越男,祁天嬌.檔案與數據協同管理的歷史溯源與現實動因[J].北京檔案,2023(1):8-12.
[18][35]譚必勇.大數據時代檔案數據治理的范式轉型和時代挑戰[J/OL].檔案與建設,1-9[2025-02-10].http://kns.cnki.net/kcms/ detail/32.1085.G2.20250117.1540.002.html.
[19]國家數據局關于印發《可信數據空間發展行動計劃(2024—2028年)》的通知[EB/ OL].[2025-02-05] .https://www.gov.cn/zhengce/ zhengceku/202411/content_6996363.htm
[20][22]高富平.可信數據流通制度論——治理范式經濟秩序的形成[J].交大法學,2024(5):94-115.
[23][36]崔宏軼,冼駿.政務數據管理中的“數據可用性”——痛點及其消解[J].中國行政管理,2019(8):55-60.
[24]孫嘉睿,安小米,吳國嬌,等.可信數據概念構建及其實現路徑——基于文獻研究與ISO文件管理國際標準的協同應用[J].數字圖書館論壇,2018(7): 22-29.
[27]周文泓,賀譚濤,文利君,等.數據管理機構的建設進展比較分析及其啟示——以中歐美英澳為例[J].情報理論與實踐,2023(12):183-192.
[28]2023年度全國檔案主管部門和檔案館基本情況摘要(二)[EB/OL].[2025-02-05]. https:// www.saac.gov.cn/daj/zhdt/202409/a277f8b3bfe9 42ca88d3b7bcf6ddf120.shtml.
[31]馮惠玲.數智時代檔案數據的“重做”與“重塑”[J].檔案與建設,2024(10):3-4.
[32]錢毅,潘潔敏.基于模型視角的檔案對象連續空間演化路徑[J].檔案學通訊,2024(2):4-12.
[34][37]何嘉蓀.檔案管理理論與實踐[M].北京:高等教育出版社,1991:150-157,76.
[38]馮惠玲.面向數字中國戰略的檔案數據產教融合[J].檔案與建設,2023(10):4-6.
[41]徐擁軍,王興廣,郭若涵.我國電子檔案管理標準建設現狀與推進策略[J].圖書情報工作,2022(13):36-47.
(責任編輯:張 帆)