摘 要:新質生產力發展背景下,數據要素化為檔案數據的價值激活與釋放提供了新的視角與思路。文章在梳理檔案數據要素化歷史源流的基礎上,先從理論層面厘清相關重要概念,從定位、屬性、權屬、時效與導向等角度明確了檔案數據要素化的關鍵問題。進而對公共數據授權運營與數據交易平臺展開調查,結合實踐現狀探討了檔案數據要素化的價值空間:持續保障高質量歷史數據資源供給,著力探索基于場景的數據融合賦能,發揮專業優勢助力數據型應用開發,積極開展文化類數字資產合作發行。
關鍵詞:數據要素;檔案數據;數據要素化;檔案數據價值;數據資產化
分類號:G273.5
Historical Origins, Key Issues and Value Space of Archival Data Factorization
Xu Xiaotong1, Zhang Jiawei1, Li Zhaochuan2
( 1. School of History, Shandong University, Jinan, Shandong 250100; 2. Inspur Software Technology Co., Ltd., Jinan, Shandong 250101 )
Abstract: Under the background of new quality productive forces, data factorization provides new perspectives and ideas to activate and release the value of archival data. On the basis of sorting out the historical sources of archival data factorization, this paper first clarifies the relevant important concepts at the theoretical level, and clarifies the core issues of archival data factorization from the perspectives of positioning, attributes, ownership, timeliness and orientation. Then it investigates public data authorization operation and data trading platforms, and the value space of archival data factorization is discussed: continuing to ensure high quality historical data resources supply, focusing on empowerment via data fusion based on scenes, maximizing the strengths of data application development, carrying out cultural digital assets cooperative issuance actively.
Keywords: Data Elements; Archival Data; Data Factorization; Archival Data Value; Data Assetization
新質生產力的形成離不開勞動者、勞動工具、勞動對象的高效融合。在數字化快速發展的今天,數據作為一種新型的生產要素,已經融入生產、分配、流通、消費和社會服務管理等各個環節,成為重要的勞動對象,深刻改變著社會的生產方式、生活方式和社會治理方式。2019年,黨的十九屆四中全會首次將數據列為我國第五大生產要素,要求健全由市場評價貢獻、按貢獻決定報酬的機制,數據要素正式成為數字中國建設的動力引擎之一。2020年4月,《中共中央 國務院關于構建更加完善的要素市場化配置體制機制的意見》公布,強調要加快培育數據要素市場。2022年12月,《中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見》(下文簡稱“數據二十條”)發布,強調了數據產權、流通交易、收益分配、安全治理等重點工作,以促進數據合規高效流通。2023年,國家數據局組建,負責推進數據基礎制度建設,統籌數據資源整合共享和開發利用,并制定《“數據要素×”三年行動計劃(2024—2026年)》。國家在數據要素方面的重大理論創新和政策安排,彰顯出數據在國家發展中的重要戰略地位,集中力量建設數據要素市場,發揮乘數效應、實現數據要素價值倍增是大勢所趨。
數據要素化之于檔案學研究是一個新興視角,但淵源已久。數據要素的價值實現根植于數字經濟的發展,而“資產觀”早已受到學界的廣泛關注與討論,學者們從爭論檔案是否可以算作資產[1]到推演其作為資產的正當性并逐漸認可[2],繼而從理論層面闡釋檔案資產的內涵[3],探究檔案數據資產化治理、運營的方法與路徑[4-5],促進檔案(數據)資產保值增值。如今,我們已經不必重復檔案能否算作資產的討論,亦不必對檔案的經濟價值“三緘其口”,檔案學者開始正視檔案的數據要素價值內涵[6],關注其在數字經濟創新與升級中的重要作用[7],從內涵擴充、多維參與流通交易、融入數據治理體系、推進實踐試點等方面探索數據要素化背景下的檔案數字轉型行動空間[8],以充分釋放檔案生產力,賦能數字中國建設[9]。
在數據要素市場初步構建的歷史階段,面對加速推進數據要素市場化配置的時代機遇,檔案數據作為社會事務的原始記錄,是高質量的戰略信息資源與歷史文化遺產,具備豐厚的要素化資源稟賦,應在數據要素體系中發揮其應有的作用與價值。在這一背景下,本文首先結合生產要素論分析檔案數據要素化的歷史源流,以歷時性視角梳理其面臨的機遇與挑戰;其次,明確檔案數據要素化的相關概念,抓住核心問題,聚焦研究與實踐的關切點與矛盾點;最后,基于前述論證,結合公共數據授權運營與數據交易平臺調查結果,發散式探索檔案數據要素化的價值空間與發展方向,以期拋磚引玉,激發學界、業界對這一話題的共同探討。
1 檔案作為生產要素的歷史源流:基于生產要素論的視角
生產貫穿人類文明的發展史。從馬克思對生產力與生產關系的論述可知,生產勞動必須依靠勞動(亦作有目的性的活動)、勞動資料和勞動對象這三個部分。從西方經濟學發展的角度來看,自17世紀威廉·配第在《賦稅論》中首次提出土地和勞動均創造財富價值的二元關系始,人們對生產要素認識逐步從二要素論、三要素論向六要素論發展,勞動、土地、資本、數據等相繼上升為關鍵生產要素;同時,各類生產要素也以更合理的投入組合創造更大產能,推動生產力發展。為更細致地剖析檔案在生產發展中的作用,本文基于生產要素理論,梳理其作為生產要素的歷史源流。如圖1所示[10],隨著關鍵生產要素的演變,檔案也以不同形態在其中扮演著不同角色,重要性日益凸顯。
原始社會時期,生產以勞動要素為核心,檔案“前身”開始支持生產分工。原始社會中,生產活動以采集和漁獵等為主,部落通過簡單分配以維系基本生存,勞動是當時最主要的生產要素。在此過程中,檔案的起源表現為口訣、歌謠、結繩、刻契等形式,記載并傳遞著人類在自然斗爭中積累的經驗,發揮著備忘、信約和憑證作用,支持部落獲得穩定、豐厚的生存產品。[11]

農業社會時期,生產以土地要素為核心,檔案信息服務封建經濟發展。農業經濟中,土地與經濟收入直接關聯,是最關鍵的生產要素。[12]這一時期,檔案作為官方記錄,圍繞著主要的農產品生產與分配發揮輔助作用。以我國封建時期主要的檔案類型為例,政務文書檔案體現統治階級的意志,成為資源分配和日常管理的依據,可以看作管理要素與檔案信息聯合起來發揮對于生產的間接作用;賦役檔案內含賦稅錢糧、人丁戶口等大量信息,關系封建社會的經濟命脈和統計基礎,輔助勞動等要素實現資源配置;輿圖檔案記載土地資源情況,輔助土地要素實現資源配置,等等。總體而言,檔案承載了大量服務統治、支持經濟社會發展的重要內容,輔助勞動、管理等要素通過文書檔案及各類專門檔案的流轉使用實現配置,共同施加于最核心的土地要素,支持生產分工并實現生產力創造,推動經濟發展。
工業社會到信息社會時期,生產以資本要素為核心,知識與技術要素地位上升,在經濟轉型升級與產業結構調整中發揮愈發重ZiISOAoSX+slrAb/XRS9dg==要的作用,檔案資源積累蓄能。進入工業社會后,經濟活動變得復雜,生產、流通、分配、再生產的閉環漸漸形成。在資本要素的推動下,大量企業成為生產主體,檔案不再是政府機構的專屬品,企業在生產經營等業務活動中均形成、留存了大量檔案。從領域看,除傳統文書檔案以外,科技檔案、會計檔案等數量急劇增長;從門類看,圖紙、照片、音像等各類檔案不斷豐富,電子檔案管理的重要性日漸凸顯。誰擁有足夠的信息,誰就在市場競爭中處于更多優勢并獲得更多收入。[13]同時,知識、技術等生產要素的作用比重日漸上升,檔案作為其“載體”與社會生產發展的結合愈發緊密,對檔案的認識也從“資源觀”進一步向“資產觀”升級轉化,檔案不能只“默默無聞地為經濟建設服務”[14],將檔案作為企業無形資產并進行估值的呼聲亦日益高漲[15]。整體而言,在這一時期,以海量信息處理為使命的檔案管理工作進入“黃金發展期”[16],但生產要素投入的目標主要是通過解放人的體力來提高生產率,資本、技術等要素發揮主要作用,對檔案資源、檔案資產的關注更多在于如何保存以使其保值、增值,使無形資產避免隱性流失,主要表現為“自用”以支持決策與經營等[17],其直接推動生產力提升的潛力尚未被充分挖掘。
數字社會時期,數據要素核心地位逐步上升,檔案數據要素展現巨大潛力。信息技術的發展使得人們存儲信息、傳遞信息的能力提升,帶來了生產的大變革。早在1998年,黃泰巖就提出將信息作為生產要素納入分配。[18]此后,隨著以人工智能為核心的第四次科技革命取得突破性進展,從海量數據中精準提取價值成為可能,數據從各類生產要素中脫穎而出,成為關鍵驅動力。當前,發展新質生產力成為新目標。[19]數據要素通過與其他各生產要素協同配合,激發數據生產力,塑造發展新動能。在這一背景下,工業經濟時期累積的大量檔案資源、檔案資產成為培育新質生產力的潛在優質資源,其語義化、數據化形成的檔案數據具備機器可理解、可操作的特性,提升了檔案自動化關聯組織與提供利用的可能性。[20]檔案價值在數據要素時代煥發新的生機,推進檔案(數據)利用范式從以參考憑證為核心的“驗證式”被動輔助走向以驅動業務為導向的“預測式”主動賦能成為新的課題,檔案工作也迎來新的挑戰與機遇。
2 檔案數據要素化的關鍵問題:兼論相關概念
檔案工作數字轉型過程中,不乏對數字檔案、檔案數據等核心概念的討論。當前,數據要素化為檔案資源的價值激活與流通提供了新的視角,“檔案數據要素”成為新熱詞。按照權益歸屬,數據要素可分為公共數據要素、企業數據要素、個人數據要素[21];按照應用領域,數據要素可分為商業數據要素、民生數據要素、政務數據要素、工業數據要素[22]等。如今談檔案數據要素,其命名邏輯與上述概念并不相同。檔案數據要素的獨特定位是什么?其學理內涵與實踐范疇是什么?本節從概念辨析切入,進一步錨定檔案數據要素化過程中亟待解決的幾個關鍵問題。
2.1 檔案數據要素化的資源依托:檔案數據
檔案數據是檔案數據要素化的資源依托,亦即實施對象。當前,檔案界對檔案數據的概念尚無統一定論,不利于明確檔案數據要素化的工作范疇和權責,并提供針對性方案。學界觀點按照定義范圍,可粗略劃分為廣義、狹義兩類。一是側重“數據”的廣義觀,認為檔案數據的概念相比于電子檔案等在時間、空間與狀態方面均有所延拓[23],指具備檔案性質、有長期保存價值的數據記錄,即便其目前尚未被正式納入檔案部門保管[24];或采用更加廣泛、直接的表述,認為數據即檔案[25]。二是側重“檔案”的狹義觀,細分語境,強調將檔案數據限定在檔案理論研究與實踐范疇之內,如“關于檔案的數據”[26]、以檔案管理的方式加以提取和保管的數據[27],或僅指代經過數據化形成的檔案成果[28]。實踐領域對檔案數據的認知體現于工作規劃與部署。基于此,筆者考察了檔案事業發展“十五”計劃到“十四五”規劃中涉及“數據”的表述,發現實踐領域對檔案數據關注始于數據庫建設等具體工作,逐步融入國家大數據戰略,朝著細粒度、寬領域、強技術的方向不斷發展,部署了關鍵領域電子數據歸檔與已有檔案數據開放與管理兩個重點工作方向。由此可見,實踐領域對“檔案數據”的認知相對統一,其表述側重“后端”檔案部門掌握并管理的檔案數據資源,傾向狹義觀;對于“前端”政務、信用、交通、醫療等各領域產生的“電子數據”,則積極部署數據歸檔指導監督等工作,促進其轉化為檔案數據。
筆者認為,概念的交叉與演變是理論研究與實踐工作階段性發展的必然現象,不同的概念取向引導出多樣化的研究視角,在不同層面錨定了工作重點。對于尚未正式歸檔的“具有檔案屬性的數據”,即“潛在電子檔案”而言,各業務部門是各類業務性、實時性數據最直接的資源供給主體,檔案部門可在前期的數據戰略制定、數據形成與采集、數據分類分級、數據預處理、數據安全管控等治理性工作環節中,通過融入、參與、協同等多種機制貢獻“管理視角”[29]的智慧,切實提升數據資源質量,增強數據可信、可追溯能力,從長遠視角來看,其重要性不言而喻。對于“數據態檔案資源”而言,檔案部門可以充分發揮已有的資源優勢和主導作用,通過要素化過程喚醒、激活“沉睡”館藏檔案資源的價值,推動其進入數據要素市場,盡快在數據要素化工作中明晰檔案部門與檔案數據要素的獨特定位,進而逐步實現其角色、職能的拓展;同時,從數據要素市場建設、釋放數據生產力的整體視角來看,一定規模的檔案數據“進場”能夠極大擴展數據要素池,提升數據整體質量,與當前以“熱”“溫”數據為主的數據要素形成合力,共同發揮歷時性研判作用,實現價值倍增。
2.2 檔案數據要素化的目標取向:數據要素
數據要素是檔案數據要素化的最終成果與目標取向,具有報酬遞增、低成本復用等特點,具備“新質生產力”典型特征。物質資料生產是社會賴以存在和發展的基礎,其基本前提在于必須具備一定的有形或無形投入,這些必須投入的有形或無形因素與條件就是生產要素。[30]數據要素則是以電子形式存在的、通過計算方式參與生產經營活動并發揮重要價值的資源。[31]清華大學金融科技研究院院長廖理將數據要素的本質解讀為“可機讀+可流通”。其中“可機讀”指機器可讀,在檔案學語境中可泛指數字態、數據態的信息;從自動關聯激活價值、深度挖掘數據潛力的長遠視角來看,數據態信息必將成為要素化的主流資源,與之相關的算法、算力等可與數據一同形成各類數據服務產品。“可流通”則有許多種形式,具體包括數據開放、數據交換與共享、數據交易等。
數據并非天然成為生產要素,須經過加工方可具有使用價值,這一過程即“要素化”。要素化過程中數據的價值釋放依循數據價值鏈。2013年,吉爾伯特·米勒與彼得·莫克首次提出大數據價值鏈,定義了數據的發現、集成與探索三個階段,以及收集與標注、準備、組織、整合、分析、可視化、決策七個具體環節。[32]馬費成等從理論層面將數據要素價值的實現概括為數據采集、數據組織、數據流通、數據利用。[33]于施洋等則結合數據要素市場的具體實踐,將數據價值鏈定義為原始數據、數據資源、數據產品、交易流通、合約交付、數據利用等環節[34],涉及數據的資源化、資產化與資本化三個遞進的層次路徑[35]。其中,數據資源化強調將原始數據進行采集、標注、清洗、標準化、結構化等一系列組織加工,經過“抽絲剝繭”產出高質量、有潛力的數據,最終形成具有使用價值的數據資源;數據資產化則更加關注數據與具體業務場景融合,即通過數據驅動業務變革彰顯其經濟價值,強調“向內賦能”,重點在于數據確權、評估與資產入表等;數據資本化表現為使數據具備金融屬性,可用以交易流通,具體體現為股權化、證券化等,是數據價值的高階升級與全面體現。[36-37]
2.3 檔案數據要素化的實現前提:關鍵問題錨定與現實觀察
如前所述,檔案數據要素既需要滿足數據要素可機讀、可流通、可確權、可計量等要求,又應具有檔案的特有屬性,需要符合檔案管理工作邏輯。因而在要素化過程中,首先需要對數據要素特性與檔案數據屬性的共通點加以延伸、轉化,對其沖突點進行平衡、調適,立足檔案數據與檔案管理的優勢與特色,吸收數據要素化新視角、新觀點帶來的經驗啟示。
第一,調和數據要素的外向流動性與檔案數據的內向靜態性。數據要素關注以用戶為中心,從需求端出發對數據資源展開高效利用、復用[38],釋放數據價值,打破數據的內部“圈禁”,使其在更廣闊的時空范圍內實現高效配置并發揮乘數效應,具有顯著的外向性。檔案工作一直以來強調制度化、整體化的管理體系,具有較強的保密屬性與安全意識,多從供給端對檔案數據進行可信管理以服務組織機構或系統內部的日常工作運轉,體現出內向性的特征。這在一定程度上保障了檔案數據的集約化管理,使其成為可靠的憑證記錄,但也賦予了檔案數據及其管理工作相對封閉的特征。以“可信”視角為例,數據要素的可信重在打造以隱私計算、聯邦學習、區塊鏈等技術為依托的可信數據空間基礎設施,以支持數據實現“原始數據不出域,數據可用不可見,用途可控可計量”的動態開發利用;檔案可信則在于通過過程性管理與固化手段實現“四性”管控,目標在于提供靜態的、可參考的憑證。從這一角度來說,檔案數據要素化應建立在有組織開放審核的基礎上,綜合考慮如何在保留其內向性帶來的安全、真實優勢的同時,在理念、技術與方法等層面實現與數據要素可信流通體系的銜接與融合,推動檔案數據從“靜態憑證”向“善治證據”的轉變。
第二,協調數據要素的經濟屬性與檔案數據的公益屬性。數據要素需要在合規流通使用中激活價值,既包括通過消減生產經營風險、提升公共服務效率等實現降本增效,也包括通過資產化運營、合規交易等方式實現經濟屬性價值的充分釋放。據統計,2022年,深圳市的數據要素支出已達千億規模。[39]數據要素的價值釋放涉及資產化過程,會計學角度指數據資源價值計量并作為資產入表。[40]對于檔案工作而言,檔案利用服務的公益屬性深入人心,重點在于機構內部工作參考或其社會效益、文化效益,作為輔助的經濟效益則較少被提及。[41]在數據要素化背景下,“應破除‘檔案部門和檔案工作與數字經濟和數據要素沒關系’的落后理念,將檔案工作主動融入和服務數字經濟的創新與升級”[42],積極探索檔案數據的價值計量,推動其作為無形資產入表。相關標準的制定及其內容的調整也反映了對檔案數據資產價值的深入認識:2010年,財政部《固定資產分類與代碼》(GB/T 14885-2010)將“電子檔案”定義為固定資產,強調“光盤”等載體,而2022年《固定資產等資產基礎分類與代碼》(GB/T 14885-2022)修訂時則已刪除此項;《無形資產分類與代碼》(GB/T 35419-2017)新設置了“信息數據類”無形資產,關注其蘊含內容帶來經濟利益的潛力,檔案數據應入此類。同時,檔案數據如何估值尚存在較大的挑戰空間,傳統方法在數據估值中局限性明顯,如成本法難以描摹檔案數據的未來增值情況、收益法難以確定攤銷方案及使用年限、市場法則缺乏成熟穩定的可比物等;[43]檔案數據質量、數據規模、社會需求等一系列細化估值指標也有待進一步研究與實踐。
第三,認識數據要素確權的明晰性與檔案數據權屬的復雜性。數據要素權屬確認問題駁雜,數據資產化、要素化的過程必然伴隨著數據權屬邊界的逐步清晰確定,這也是流通的“第一道門檻”。“數據二十條”明確了數據資源持有權、數據加工使用權、數據產品經營權“三權分置”的規定,充分考量了數據資源的依法持有流轉、授權合規加工與合理處分收益,其邏輯也與數據價值鏈從獲取到利用的過程相契合,可通過數據登記存證實現權利的確認。檔案數據以集合形式管理,需在合理區分公共、企業與個人的數據的基礎上,梳理各自的權利重心。個人層面,檔案數據來源廣泛并以原始形態存在,隱私、倫理等人格權應率先規制。如英國國家檔案館規定,對出于公共利益存檔的數據應保留數據主體權利束中的訪問權、可攜帶權、更正權等,減少對個人權利的干預。[44]企業、機構層面,財產權、知識產權等應受到重點關注,但對于檔案數據而言,存在檔案形成主體單位的撤銷、合并等原因不復存在的情況,需要單獨界定此種情形下相關處分、收益等權屬的分配情況及權益落實的具體形式;另外,如遇檔案數據銷毀,其衍生數據產品的相關權利分配問題也應作出更加細致的規定。國家層面,應關注檔案數據的主權與安全等問題,嚴格實行分級管理并規制其跨境流動。
第四,兼顧數據要素的時效性與檔案數據的時滯性。即時性是數據要素在數字經濟時代的特征[45],強調對當下的生產經營活動具有價值[46],如交通運輸實時定位、工業生產實時決策等。對于這些實時性數據,一旦超過特定的時間節點并未能持續更新,其價值便可能“斷崖式”下降。相較于已形成一定流通規模的“熱”“溫”數據,檔案數據相對而言具有滯后性,多屬于“冷”數據。對于數據要素市場整體建設而言,需要釋放的不僅是實時數據的動能,更需要充分激活歷史數據的價值,使“歷史”和“當下”形成對照與映射;同時,檔案數據所蘊含的背景與結構數據有助于更好地開展模型訓練、算法驗證與規律探尋,是高質量數據,具有長遠的、不應忽視的價值。
第五,平衡數據要素的加工處理導向與檔案數據的原始記錄傳統。數據要素與數據最根本的區別在于是否經過加工,前述數據價值鏈描述了數據通過加工、融合利用逐步實現價值釋放的過程。于施洋等按照數據要素的加工程度將數據劃分為原始數據、脫敏數據、模型化數據、人工智能化數據四階段[47],階段層級越高,數據越脫離原始形態,加注的算法與算力成分越多,所提供的數據服務就越多樣。在此基礎上,數據的集成、聚合能夠實現高質量數據的價值疊加、倍增。如浪潮集團研發的“泉城商業選址”[48]即通過濟南公共數據開放網中企業登記注冊數據、濟南市電影院名錄數據、濟南市零售藥店數據等21類開放數據的匯聚,實現對政策、人口密度、客源分布、同行位置、交通信息等情況的綜合研判,以支持實體店鋪的精準選址。對于檔案數據而言,作為“一手資料”,檔案資源最突出的特性即不加修飾的原始記錄性,這也使得檔案在社會民生領域多以用戶提出需求、檔案館出具證明的形式提供利用服務。而數據要素化則為檔案數據價值的釋放提供了思路與機遇,即積極響應現實需求,主動發掘應用場景,發揮檔案數據對生產經營與民生服務等活動的支撐與驅動作用。
3 檔案數據要素化的價值空間分析——基于公共數據授權運營與數據交易平臺的調查
馮惠玲指出,檔案數據具有原生性、完整性、普遍性與關聯性的突出特點,在數據資源家族中具有不可或缺的地位[49],具備要素化天然資源稟賦。如果說,資產觀視角將檔案視為戰略資產,重在強調檔案資源的價值保值與增值,輔助成本節約與效率提升[50];那么要素觀則關注檔案數據價值的轉化創新為用戶帶來的收益,更凸顯其價值釋放、倍增的導向。根據數據性質的不同,國家“十四五”規劃與“數據二十條”將公共數據授權運營與數據交易作為激活數據要素價值、營造良好數字生態的重要路徑。據此,本文對公共數據授權運營與數據交易平臺展開調查,梳理數據公開、交易等基本流通情況,從“產出端”現狀向前回溯,為檔案數據要素化價值空間的探索提供線索。
3.1 調查設計與初步結果分析
檔案數據來源廣泛,既蘊含屬于公共數據的部分,也包括大量企業、個人數據。一方面,本文結合大數據技術標準推進委員會《公共數據授權運營案例集(2023)》[51]、中國軟件評測中心等《公共數據運營模式研究報告》及相關研究提及的公共數據授權運營典型案例[52-53],選取北京、上海、浙江、貴陽、福建、濟南、成都、湖州、青島、溫州10個代表性省市的公共數據公開(運營服務)平臺,調研檔案部門數據供給、檔案數據產品與服務開發的現狀。另一方面,數據交易場所作為數據經紀業務以及數據流通交易可信互通、集約高效的核心樞紐[54],集中反映了我國當前數據交易市場的現狀與需求,據此,本文對“2023全國十佳數據交易平臺”名單列舉的北京、廣州、貴陽、浙江、深圳、上海、鄭州、山東、海南、重慶(西部數據交易中心)的數據交易平臺展開調查[55],重點對與檔案數據相關的交易標的進行深入分析。需要特別說明的是,在部分省市,以上兩類平臺的調研結果有重合之處,本文將結合論述語境具體處理。
對公共數據授權運營典型地區的調研發現,當前,被調查各地的檔案部門均已成為政府數據公開的成員單位,其公開的數據類型主要有目錄類、業務類與參考類。目錄類主要指開放檔案目錄、民生檔案目錄、歷史檔案專題目錄等;業務類包括檔案查閱數據、檔案執法檢查數據、檔案館科研數據、檔案館留言數據等;參考類主要有檔案館指南、檔案政策法規、檔案館行政權力清單等。上述公開數據的利用方式均為提供數據集下載與數據接口;在已公布所用數據的數據服務與應用中,明確聲稱使用了檔案數據的尚不多見。此外,其他部門如住建、民政、人社、交通、教育、衛生、自然資源、生態環境等部門的檔案館(室)也公開了其所保管的檔案數據,如招工檔案數據、流動人員人事檔案借閱情況數據、婚姻檔案數據、城建檔案審批數據,社會團體檔案信息、空氣站點檔案信息表等。總體而言,相比于其他已公布的數據集和發布的數據產品,公開的檔案數據整體規模有限且以目錄數據、過程性數據為主,尚存較大的開發空間。
對十佳數據交易平臺的調研發現,檔案數據產品主要可分為數據資源、數據服務與數據能力三類(詳見表1)。其中,數據資源類集中在測繪與醫療領域,多為數據集與數據接口;數據服務類融合了多類檔案數據,綜合提供報告、查詢、知識庫等服務;數據能力類主要提供支持數據管理的產品與服務,如各類檔案管理系統、檔案數據治理方案等,涉及檔案管理的相關知識與技術,更多表現為數據要素與技術要素的協同作用。
3.2 檔案數據要素化的價值空間思考
由調查結果可知,檔案數據在公開與交易方面均有了一定探索,但整體要素化尚不充分,有待進一步挖掘潛力,進而發揮檔案數據要素的乘數效應及其對社會經濟發展的內在驅動力。
(1)持續保障高質量歷史數據資源供給
盡管學界、業界對檔案數據的具體定義尚存爭論,但對于其高質量、具有長久保存價值等特征早已達成共識。《信息技術 數據質量評價指標》(GB/ T 36344-2018)列舉了數據質量評價的規范性、完整性、準確性、一致性、時效性與可訪問性標準,來源可靠、程序規范、要素合規且經過“四性”管控的檔案數據無疑成為高質量的數據要素基礎“原料”。一方面,檔案部門應加速數據歸檔與開放審核工作步伐,實施業務數據的檔案化規范管理,逐步推進檔案資源的數據化與有序開放,把控好檔案數據要素的“源”與“流”。另一方面,各類檔案機構應充分挖掘并發揮歷史檔案資源優勢,充分結合當下需求,按照專題整理、加工形成數據集,與實時數據集形成映射關聯,或支持研究學習與模型訓練。如北京公共數據開放平臺專設“靜態數據專欄”,提供了3989條數據目錄及接口,為檔案數據要素的價值激活提供了可行參考路徑。[56]此外,檔案部門還可基于可信管理、全程管理的工作傳統與能力優勢,探索擔任數據要素質量的評估者、數據要素可信的驗證者、數據交易過程的記錄者與監督者等路徑,保障數據要素的可信、可溯。
(2)著力探索基于場景的數據融合賦能

數據要素的非均質性導致數據的價值因使用對象、適用場景而異。《“數據要素×”三年行動計劃(2024—2026年)》指出,要聚焦重點行業和領域,挖掘高價值數據要素應用場景。因此,檔案數據要素價值的充分激活,需要結合現實需求,選定并匹配場景,進而基于場景匯聚多源檔案數據,發揮價值聚合的倍增效應,實現1+1>2的效果,促進數字場景與實體場景融合發展,使數據要素賦能千行百業。由前述調查可知,當前各部門已實現了多類民生檔案數據的開放,如在企業征信場景中,對社保、經營、工商等各類數據的聚合可以實現對信用的綜合研判,從而支持決策。檔案部門在這一方面也開展了探索性實踐,嵊州市檔案館統籌了來自浙江公共數據平臺與個人相關的數據和來自檔案館的婚姻檔案、學籍檔案等9大類檔案數據,建設高質量的個人全生命周期數據檔案資源庫,開發“惠民辦事”“出生智治”“基層治理”“居民健康”“共同富裕”等場景,提供了檔案數據賦能智慧治理的典型案例。[57]
(3)發揮專業優勢助力數據型應用開發
加工是數據要素化的必經環節,相較于原始數據,數據服務與應用更加凸顯出深層開發、需求導向的特征。對數據交易平臺的調查結果也顯示,圍繞檔案數據形成的多項服務與數據產品具有市場價值。檔案機構作為檔案數據的供給方與管理方,應充分發揮其資源優勢與專業管理經驗,在數據資源、算法模型、數據能力層面助力數據服務與應用開發。其一,數據資源層面,摸清檔案數據資源底數,有選擇地推進數據安全管控與資源供給工作;對于敏感性較強的數據,可在分類分級的基礎上,有條件開放部分元數據。如貴州省測繪資料檔案館已注冊成為數據商,并在貴陽大數據交易所掛牌了12組關于水準點、三角點、影像、數據模型等的元數據,能夠支持地理空間、交通運輸、城建住房等場景的學術研究與實踐利用。[58]其二,算法模型層面,結合現實需求實現檔案數據的模型化開發,在支持基礎查詢、提供接口等功能的基礎上,探索數據校核、數據畫像、數據報告、數據分析與可視化等多樣化功能的實現路徑;同時可依托公共數據授權運營模式或作為數據交易的“需求發布方”,借助第三方平臺的技術力量實現檔案數據產品的規模化生產。其三,能力層面,可充分發揮檔案管理專業知識,支持各業務領域檔案數據治理方案、系統的開發,并為數據要素流轉、交易全過程文檔、數據的歸檔管理提供檔案化管理策略。
(4)積極開展文化類數字資產合作發行
2022年,中共中央辦公廳、國務院辦公廳印發《關于推進實施國家文化數字化戰略的意見》,將文化數字化提升為國家戰略,指出要發展數字化文化消費新場景、加快文化產業數字化布局,文化數據資產化受到高度關注。文化數字資產是具有資產權屬、經濟價值和文化屬性的可計量文化數據[59],包括數字藝術(非遺、文藝著作、音樂、戲劇、舞蹈等)、數字知識產權,以及數字文創(數字IP、數字人、數字藏品)等多個類型[60]。此次調研發現,北京國際大數據交易所設置了“數字資產”專區,發行了數字文創、數字出版、數字紀念品等多種數字資產。在檔案領域,王小云將檔案文化產品喻作檔案資產價值運動的“先驅”[61],學者們也普遍關注檔案文創產品的開發。各檔案數據持有方可在充分挖掘館藏文化內容、創作文化產品的基礎上,依托專業平臺或與具有資質的發行方合作,推動具有檔案文化元素的數字資產上鏈發行。如中國人民大學信息資源管理學院、數字人文研究中心等基于對清代冰嬉項目的研究成果,與中國數字文化集團聯合發行了數字出版物“冰嘻嘻”[62],共計發行8000件并已售罄,可看作是檔案文化數字藏品發行的有益探索。
4 結 語
從時代背景變遷的視角看,檔案的價值定位經歷了資源觀、資產觀等視域下的內涵擴充,正在經歷生產要素觀的新浪潮。檔案數據具有要素化的存量優勢與資源稟賦,應發揮高質量可信數據供給的優勢,密切結合現實需求場景,實現數據資源的聚合與服務化、應用化、資產化開發,推動檔案數據要素“進場”,充分實現價值釋放與倍增。同時,檔案部門與檔案工作也應在新的機遇與視野下,積極探索與數據治理的協同,融入、參與數據管理的形成、鑒定、預處理等關鍵環節,成為數據要素質量提升、可信可溯的評估者、監督者,貢獻專業力量。
*感謝山東大學歷史學院盧亞龍同學在本文寫作過程中給予作者的建議。
作者貢獻說明
許曉彤:選題,數據調查,論文撰寫與修改;張嘉瑋:數據調查,參與本文第一部分的撰寫;李照川:校對、修改論文。
注釋與參考文獻
[1]王小云.檔案資產論的歷史脈絡、認知轉型及發展態勢[J].檔案與建設,2016(7):9-16.
[2]陳建,謝鵬鑫.檔案資產理論核心概念轉變的原因闡釋及現實啟示[J].檔案學研究,2022(1):36-42.
[3]王運彬,王小云.資產客體的擴張脈絡與檔案資產的理論審視[J].檔案學研究,2018(2):44-49.
[4]張寧.主數據驅動視角下的企業檔案數據資產管理[J].檔案學研究,2019(6):47-52.
[5]鄧文霞.從“資源”到“資產”:檔案數據資產治理模型初探[J].浙江檔案,2022(7): 33-36.
[6][49]馮惠玲.檔案學概論 第三版 [M].北京:中國人民大學出版社,2023:45-47.
[7][42]章燕華.以數智化驅動引領檔案事業現代化的發展進程與實施路徑[J].檔案學通訊,2023(6):4-13.
[8]周文泓,王欣雨,劉鵬超.數據要素化背景下的檔案數字轉型行動空間展望[J].檔案與建設,2024(2):38-45.
[9]金波,楊鵬,周楓.檔案數據高質量發展:歷史進程、演進邏輯與戰略布局[J/OL].情報科學,2024:1-15[2024-03-25].http://kns.cnki.net/ kcms/detail/22.1264.G2.20240126.1857.020.html.
[10]本圖的繪制受到下文的思路啟發:白永秀,李嘉雯,王澤潤.數據要素:特征、作用機理與高質量發展[J].電子政務,2022(6):23-36.
[11]周雪恒.中國檔案事業史[M].北京:中國人民大學出版社,1994:1-4.
[12]戴雙興.數據要素:主要特征、推動效應及發展路徑[J].馬克思主義與現實,2020(6):171-177.
[13][18]黃泰巖.論按生產要素分配[J].中國經濟問題,1998(6):1-9.
[14]韓茹,王立君,于志海.科技檔案與無形資產芻議[J].中國檔案,1996(3):23-24.
[15]王世金,袁從仕.要樹立企業檔案資產觀念[J].中國檔案,1994(2):12-13.
[16][34][47]于施洋,王健冬,黃倩倩.論數據要素市場[M].北京:人民出版社,2023:33,42-44.
[17][40]朱揚勇.數據自治[M].北京:人民郵電出版社,2020:12,20.
[19]看《政府工作報告》里的向“新”力![EB/ OL].[2024-03-20].https://www.gov.cn/zhengce/ jiedu/tujie/202403/content_6937716.htm.
[20]祁天嬌,馮惠玲.檔案數據化過程中語義組織的內涵、特點與原理解析[J].圖書情報工作,2021(9):3-15.
[21]中國信息通信研究院.數據要素白皮書(2 0 2 3年)[EB/OL].[2 0 2 4-0 3-2 0]. http://www.caict.ac.cn/kxyj/qwfb/bps/202309/ P020230926495254355530.pdf.
[22]賽迪顧問.2023民生數據要素應用研究報告[EB/OL].[2024-03-20].https://www.digitalelite. cn/h-nd-7538.html.
[23]于英香.從數據與信息關系演化看檔案數據概念的發展[J].情報雜志,2018(11):150-155.
[24]金波,添志鵬.檔案數據內涵與特征探析[J].檔案學通訊,2020(3):4-11.
[25]吳哲,丁海斌.“數據”概念史考略及“檔案數據”概念解析[J].檔案與建設,2023(1):11-16.
[26]趙躍,石酈冰,孫寒晗.“檔案數據”一詞的使用語境與學科內涵探析[J].檔案學研究,2021(3):24-32.
[27]譚必勇,邵亞偉,李躍.譚必勇老師談檔案數據治理與電子證據——2020年“國際檔案周學者談”第五期[J].中國檔案研究,2020(2):269-279.
[28]何思源,劉珂.檔案與數據關系的多維解析——兼論檔案數據的概念定位[J].檔案學通訊,2024(1):37-44.
[29]楊茜茜.概念、內容與定位:我國檔案數據治理研究的理論坐標[J].檔案學研究,2021(6):28-34.
[30]于刃剛,戴宏偉.生產要素論[M].北京:中國物價出版社,1999:1-2.
[31]清華大學金融科技研究院.數據要素化100問:可控可計量與流通交易[M].北京:人民日報出版社,2023:3.
[32]Miller H G, Mork P. From data to decisions:a value chain for big data[J].It Professional, 2013,15(1):57-59.
[33]馬費成,吳逸姝,盧慧質.數據要素價值實現路徑研究[J].信息資源管理學報,2023(2):4-11.
[35]梅宏.數據如何要素化:資源化、資產化、資本化[J].施工企業管理,2022(12):42.
[36]孫靜,王建冬.多級市場體系下形成數據要素資源化、資產化、資本化政策閉環的總體設想[J].電子政務,2024(2):12-20.
[37]奉國和,肖雅婧.數據要素價值釋放研究進展[J/OL].圖書館論壇:2024:1-11[2024-03-15].http://kns.cnki.net/kcms/detail/44.1306. G2.20230817.1641.006.html.
[38]夏義堃.數據要素市場化配置與深化政府數據治理方式變革[J].圖書與情報,2020(3):14-16.
[39]劉瓊.深圳數據要素支出規模已達千億級[N].深圳商報,2023-02-03(A01).
[41][61]王小云.基于價值實現和權利保障的檔案資產論建構研究[M].北京:社會科學文獻出版社,2018:5,158-166.
[43]歐陽日輝,杜青青.數據估值定價的方法與評估指標[J].數字圖書館論壇,2022(10):21-27.
[44]王玉,許曉彤.英國檔案數據治理現狀與啟示[J].檔案與建設,2023(8):70-75.
[45]蔡躍洲,馬文君.數據要素對高質量發展影響與數據流動制約[J].數量經濟技術經濟研究,2021(3):64-83.
[46]王偉玲,王蕤,賈子君,等.數據要素市場——全球數字經濟競爭新藍海[M].北京:電子工業出版社,2023:26.
[48]泉城商業選址[EB/OL].[2024-03-20]. http://data.jinan.gov.cn/jinan/application/1f9b597a1e5f4 0c08477e04aeaced863.
[50]王小云.檔案資產論[J].檔案學通訊,2016(4):80-83.
[51]公共數據運營模式研究報告[EB/OL].[2024-03-20].https://dsj.guizhou.gov.cn/xwzx/ gnyw/202205/t20220530_74436679.html.
[52]張會平,薛玉玉.公共數據授權運營產權運行機制的理論建構與實施路徑[J].電子政務,2023(11):2-13.
[53] 龔芳穎,郭森宇,馬亮,等.公共數據授權運營的功能定位與實現機制——基于福建省案例的研究[J].電子政務,2023(11):28-41.
[54]竇悅,郭明軍,張琳穎,等.全國一體化數據交易場所體系的總體布局及推進路徑研究[J].電子政務,2024(2):2-11.
[55]海南省數據產品超市入選“2023全國十佳數據交易平臺”[EB/OL].[2024-03-20]. https://db.hainan.gov.cn/zdlyxxgk/cgal/202402/ t20240204_3589179.html.
[56]靜態數據專欄[EB/OL].[2024-03-20]. https://data.beijing.gov.cn/zyml/lssj/index.htm.
[57]汪偉民,丁云.縣域公共數據檔案化治理的理論與實踐探索——以嵊州市“個人全生命周期檔案”綜合智治應用建設為例[J].浙江檔案,2023(4):11-13.
[58]貴州省測繪資料檔案館(貴州省基礎地理信息中心)[EB/OL].[2024-03-20].https://www. gzdex.com.cn/facilitator/merchant/1502.
[59]金巍:文化數據資產將成為未來最重要的文化資產之一[EB/OL].[2024-03-20].http://www. ce.cn/culture/gd/202008/27/t20200827_35614022.shtml.
[60]葉美靈,陳靜麗,巨涵.打造數字資產,讓文化“活”起來[J].通信企業管理,2023(9):41-43.
[62]數字藏品推介|北京記憶系列之“冰嘻嘻”[EB/OL].[2024-03-20].https://cdcub.com/news/ detail/21.html.
(責任編輯:張 帆 李倩楠)