Abstract: This paper conducts an investigation into the practices of archival data participat ingin data tradingand circulation,aimingto focus on thekey pointsofarchivalparticipationandfurtherenvision optimization strategies for archival involvement in data trading and circulation. By analyzing the data products and services launched on data trading platforms across provinces and cities,the current state of practice is systematicallyanalyzed and categorized from five dimensions:basic attributesofproducts,technical attributes,participantattributes,contentattributes, and product tradingattributes.Based on the practicalanalysisofvariousaspectsofarchival data's participation in data trading and circulation,the pa per proposes the following optimization prospects:leveragingthe integrated leadership of archival and data undertakings,buildinga cluster of scenarios suitable for realizing the value of data elements,strengtheningthe capacitybuilding of various archival institutions to integrateinto the data elements market,and enhancing the upgradingand transformation ofarchival development and utilization system.
Keywords:Archival data elements;Archival development;Circulationtofdataelements;Data trading
伴隨數據要素化上升為國家戰略,各地、各行各業正全面探索數據要素市場的培育和建設,數據流通交易便是其重要內容,尤其是數據交易空間的建設。于檔案領域而言,參與數據流通交易是檔案數字資源開發利用創新擴展的重要方向,其合規性和可行性尚在討論中,如何實現參與數據要素市場建設也尚需深入研究。例如,哪些檔案可參與數據流通交易,以怎樣的形式,流通交易權益如何配置等。由此,檔案參與數據流通交易有待更多調查與分析,是檔案開展數據要素化的重要議題。
研究層面,檔案參與數據流通交易的成果有限,相關研究主要為:一是從檔案具有數據要素價值的角度論證檔案可參與數據流通交易的可能性與必要性-5;二是立足檔案特性討論檔案參與數據流通交易的優勢、合規性、挑戰9-11等,例如部分檔案的公共性與市場化的沖突;三是從數據流通交易的不同方式探討檔案的參與路徑,例如檔案與公共數據授權運營12、社會數據交易的相互關系[1等。總的來看,檔案參與數據流通交易的基本議題得到明確,其必要性與復雜性多有討論,但關鍵問題與對策還有待識別和研究。
因此,為了認識與理解檔案融入數據流通交易體系的方法與路徑,本文以利用檔案所開發的數據與服務為調查對象,對數據交易平臺上線的數據產品進行調查,收集利用檔案所開發的數據產品與服務,從中梳理檔案的參與情況和表現,從經驗和問題的角度分析參與要點,由此進一步提出檔案參與數據流通交易的優化策略。
(欄目編輯:魏文靜)
一、數據收集與分析方案
本研究選取具有代表性的10個省級行政區域,對其數據交易平臺上線的數據產品和服務展開調查,構建包含8個核心維度的兩級數據采集框架,在經過二次交叉標注后,最終確定827項數據產品和服務。
(一)數據來源與樣本選擇
本研究選取廣東省、浙江省、北京市、上海市、江蘇省、山東省、福建省、貴州省、安徽省及四川省共10個省級行政區域,對其數據交易平臺上線的數據產品和服務進行調查。其遴選依據為《數據要素市場化推進力指數(2024)研究報告》中數據要素市場化推進力綜合排名前十。上述地區具備以下典型特征:(1)政策先行性:均出臺省級數據交易管理辦法,建立區域性數據交易平臺;(2)基礎環境良好:擁有良好的發展基礎,數字經濟成熟度和數字產業集聚度高;(3)平臺成熟度:擁有國家級數據交易所或省級示范平臺。這些地區在保障支撐、重點舉措、階段性成效等方面表現突出,在全國數據要素市場化推進中發揮了引領示范作用。

(二)數據采集框架與過程
為全面梳理檔案參與數據流通交易的實踐現狀,本文構建系統的數據采集框架,包含數據產品與服務、產品與服務類型、應用領域、產品與服務相關主體、產品與服務內容、產品與服務數據基礎、產品與服務交易情況和信息來源鏈接共8個核心維度,如表1所示。
本研究的數據收集過程遵循嚴格的科學方法,分為自動化采集、人工標注和數據清洗三個主要階段,以確保數據的準確性和研究結果的有效性。在自動化采集階段,本研究采用了八爪魚數據采集器和Python爬蟲技術,結合反爬蟲策略,對覆蓋10個省市的可提供信息的數據交易平臺的產品列表頁與詳情頁進行了全面的數據抓取,形成了包含廣泛數據產品和服務信息的數據集;初步采集完成后,研究團隊對數據進行了細致的人工標注,通過閱讀產品概述和詳細內容,篩選出涉及檔案參與的數據產品和服務。在標注過程中,團隊依據產品的數據基礎進行標注,并對產品的應用領域進行了精確分類。此外,利用企查查平臺補充了產品主體的類型和性質信息,為后續分析提供更為全面的視角。
經過第一次篩選,從合計18454項數據中初步篩選出1293項檔案相關的數據產品和服務。為了進一步提升數據精度,團隊成員進行了二次交叉標注,進一步篩選出檔案參與程度高的827項數據產品和服務。最后,對篩選后的數據進行數據清洗工作,包括去除重復項、修正錯誤信息、填補缺失值等步驟,確保分析結果的可靠性和有效性。
(三)數據統計與分析
完成數據標注和清洗之后,筆者對所得數據展開系統的統計分析,包括產品類型、產品應用領域、產品發布主體所屬性質、產品發布主體類型以及產品交易情況等,以全面揭示檔案參與數據交易與流通的特征和模式。然后,對數據進行可視化呈現,借助Python的matplotlib庫工具進行數據圖表繪制,以便于后續的數據分析。
需特別說明的是,第一,各地區的平臺選擇上,筆者優先考慮各省級行政區內的省級數據交易平臺。如果該級行政區沒有省級平臺,則根據預調研情況,從建設完善程度、信息完整性、數據的豐富度等方面選擇該省內的市級交易平臺。最終,從十個地區中選擇調查表現較好的平臺作為研究對象,從而為本研究提供更具代表性和參考價值的數據和信息。第二,由于華東江蘇大數據交易中心和浙江大數據交易服務平臺沒有提供產品供應主體的信息,因此產品所屬領域和產品發布主體板塊的數據匯總未包含江蘇省和浙江大數據交易服務平臺的數據產品與服務情況,以確保統計數據的準確性和完整性。第三,為確保統計結果的可比性和科學性,在制表過程中依據數據要素市場化推進力排名對地區順序進行調整。
二、檔案參與數據交易現狀:面向數據交易平臺的調查結果
基于調查數據,本研究展開系統的統計分析,包括產品與服務類型、產品與服務應用領域、產品與服務發布主體所屬性質、產品與服務發布主體類型以及產品與服務交易情況等,以全面揭示檔案參與數據交易與流通的特征和模式。
(一)典型實踐概覽
在上述827項進行分析的數據產品與服務中,檔案如何參與數據產品與服務的開發可從如下實例進一步得到概覽性認識。
1.病歷檔案促進醫療數據管理提質。“病歷質控\"是利用病歷檔案開發的一項數據產品,旨在通過高效的數據收集與先進的數據模型,為醫療機構優化病歷管理、提高醫療質量提供有力支持,在醫療信息化管理進程中扮演著重要角色。“病歷質控\"的開發是以真實病歷和醫療文書等核心資源為基礎,精準提煉出臨床醫生針對特定患者某種疾病的治療方法與規律。例如,在數據模型開發層面,“病歷質控\"借助AI模型訓練實現病歷文書的機器自動閱讀,能夠達成這一目標就是利用前期收集的數據對模型進行深度訓練,使模型具備對病歷文書書寫規范性監控、邏輯性判斷以及前后描述一致性分析的能力,從而提供對病歷的內涵質控服務。
2.公共政策檔案賦能智慧政務。公共政策語料包migu2023是由重慶迷穀科技有限公司構建的垂直領域專業數據庫,其核心價值在于將海量政策檔案轉化為高價值結構化數據資產。該語料包深度整合全國及省市、區縣、街鎮四級政府發布的18964份政策原始檔案,通過\"檔案資源化一資源數據化一數據智能化\"三級處理流程,構建覆蓋政策全生命周期的語料體系:原始檔案作為基礎數據源,完整保留政策文本的時空屬性與語義邏輯:常規語料包通過分詞、詞性標注實現檔案機器可讀化,支撐政策回與語義分析;精選語料包進一步通過去重聚類生成政策知識元數據,驅動AI模型精準識別政策主體、工具與實施路徑。該語料為上海某政務平臺提供政策條款溯源底層支持,服務于政務決策。通過整合政策條款詳情及歷史背景信息,公共政策語料包能夠為政策制定與執行主體提供數據支撐和決策參考,助力實現政策的精準解讀與高效應用,提升政務決策的科學性和精準性。
3.金融行政許可檔案助力風險評估。“行政許可”是深圳數據交易所上海生騰數據科技有限公司開發的一款數據產品,全面整合企業的工商行政許可信息,包括許可文件編號、名稱、審批機關、有效期等核心字段。作為金融科技領域的重要數據基礎設施,該產品不僅是基礎數據資源,還通過深度開發和利用,為金融機構的風險評估、客戶資質審查等關鍵業務提供有力支持。產品通過標準化數據采集、多源核驗清洗及結構化處理,將分散的行政許可信息轉化為可機讀、可關聯、可分析的高質量數據資產。具體而言,該產品通過對海量企業行政許可信息的收集、整理與分析,幫助金融機構更全面地了解企業情況,從而降低業務風險。例如,在信貸風控場景中,金融機構可利用這些數據構建精準的風險管理模型,實現對企業信用狀況的快速評估。此外,該產品還支持金融機構在營銷拓客、產業投資等場景中進行決策支持,進一步拓展了數據資源的應用價值,推動金融服務的數字化轉型。
(二)實踐規模
各地區利用檔案所開發的數據產品與服務數量分布存在顯著的地區差異(見圖1),其中上海和廣東深圳在利用檔案所開發的數據產品與服務數量上占據領先地位,分別為265和240個。總體來看,一些經濟發達的地區如廣東、上海、浙江利用檔案所開發的數據產品與服務數量普遍較多,這些地區在數據交易平臺的建設和利用檔案所開發的數據產品與服務的挖掘上具有更強的能力和市場需求;而一些中西部地區,如貴州、四川等地利用檔案所開發的數據產品與服務數量較低。

整體而言,檔案資源在數據交易中的挖掘與利用程度呈現出不均衡的態勢(見圖2)。山東利用檔案所開發的數據產品與服務數量在總數量中占比最高,達 17.7% ,表明山東在數據交易過程中,對檔案資源的挖掘較為充分,檔案積極參與到數據流通交易市場;上海利用檔案所開發的數據產品與服務數量占總數量的 10.8% ,表明在上海的數據交易整體格局中,檔案資源的開發利用占據一定比重。然而,多數地區的檔案資源開發程度相對較低,江蘇、福建、貴州、安徽和四川的利用檔案所開發的數據產品與服務數量占總數量的比例均低于 1.7% 。由此可見,在全國范圍內,多數地區對檔案資源的挖掘與利用尚處于逐步深化階段,檔案參與數據流通交易的潛力有待進一步釋放。這從側面反映出,在當前的數據交易環境下,檔案要素蘊含著巨大的發展潛力。
此外,在數據產品與服務的交易方面,僅有貴州、山東和浙江三個省的數據交易平臺提供了相關信息。當前,多數地區的數據交易平臺尚未提供關于交易成交的具體準確信息,筆者對利用檔案所開發的數據產品與服務的交易現狀進行調查,情況如下:貴陽大數據交易所的利用檔案所開發的24項數據產品與服務中,有21個產品的交易量為0;有1個產品完成了1筆交易,即“華中地區某省會城市倉儲租賃市場交易數據”,該產品類型為數據資源,應用領域屬于商貿流通和交通運輸范疇;另有2個產品各完成了2筆交易,分別為“貴州現代物流樞紐車輛統計數據資源\"和“賬單、電費、發票數據”,產品類型均為數據資源,應用領域均屬于城市治理范疇。值得注意的是,山東數據交易平臺和浙江大數據交易服務平臺中的利用檔案所開發的數據產品與服務交易量均為0。這一現象進一步表明,盡管部分地區在檔案資源的挖掘與利用上取得了一定進展,但利用檔案所開發的數據產品與服務的市場化流通仍面臨較大挑戰,亟須通過政策引導和技術創新推動檔案資源的價值釋放。
(三)應用領域
根據對十省市數據交易平臺的調查統計(見圖3),檔案在廣泛領域發揮應用價值,并呈現出顯著的領域集中性,金融服務領域在檔案參與的數據交易和流通中占據領先地位。金融服務領域覆蓋的數據產品和服務數量最多,以559項高居榜首,形成\"一超多強\"的分布格局。相較之下,商貿流通、醫療健康、城市治理等民生領域構成第二梯隊,而現代農業、應急管理、綠色低碳等新興領域尚處于培育階段。“一超多強\"格局的形成,與金融服務領域對數據質量的高要求密切相關。金融服務領域對數據的準確性、完整性和安全性有著極為嚴苛的要求,遠超其他領域。檔案因其獨特的屬性,與這些要求高度契合,從而在金融數據產品開發中獲得了獨特競爭優勢。檔案作為一種可信憑證,能夠為企業的授信評估和數據確權提供有力的數據支撐。例如,企業信用檔案的跨期連續性,為授信評估提供了重要的歷史維度驗證,顯著增強了金融決策的可靠性;在政務檔案中包含的工商登記和司法記錄等結構化數據,因其準確性和權威性,成為構建反欺詐系統不可或缺的關鍵要素;電子憑證類檔案因其法定效力,在供應鏈金融的數據確權過程中發揮著支撐作用。此外,金融數據追求全生命周期可追、可審計和可管理,這與電子文件全程管理原則高度契合,有助于確保數據的完整性和一致性。

檔案相關產品的應用領域分布
圖3利用檔案所開發的數據產品與服務的應用領域分布

(四)發布主體
根據產品發布主體所屬性質的一級行業門類分布,行業分布呈現顯著的分化特征。一方面,頭部行業集中效應顯著。科學研究和技術服務業、信息傳輸、軟件和信息技術服務業、租賃和商務服務業合計占比超70% ,表明利用檔案所開發的數據產品與服務的交易主要服務于技術研發、商務服務和信息技術領域。這與技術適配性以及企業市場需求的驅動有關。在技術上,科技研發檔案天然具備結構化、標準化特征,其數字化轉化成本低于傳統行業。商務服務檔案的文書范式統一性,使其更易實現批量數字化處理,形成高附加值數據產品。在市場需求上,數字化轉型背景下企業對研發數據、商務決策支持數據和信息技術服務有著強需求。技術研發領域由于對歷史數據的強依賴性,會形成剛性采購需求,而商務服務領域的數據產品開發周期短、回報率高,因此自然吸引大量技術企業投入資源對檔案開展數據清洗與建模。
另一方面,傳統行業參與度不足。在農、林、牧、漁業領域,僅有兩項產品參與交易,在文化、體育和娛樂業,衛生和社會工作,以及交通運輸、倉儲和郵政業領域,各僅有一項產品參與,這些實體產業的占比不足 1% 。這一現象凸顯了檔案資源數字化轉化率低的問題,表明傳統行業檔案實現數據流通交易的價值仍未被充分挖掘。以文化、體育和娛樂業為例,該領域的檔案載體多為戲曲動作影像、傳統工藝實物檔案和口述檔案等原始形態。這些檔案在采集過程中缺乏系統性,導致數據的完整性和連續性不足。同時,非結構化數據占比大,與信息技術類檔案相比,其數字化成本更高、處理難度更大。這限制了檔案在該領域數據交易和流通中的廣泛應用,不利于傳統行業數據交易價值的實現。
對二級行業大類分布進一步分析,軟件和信息技術服務業、商務服務業、科技推廣和應用服務業分別占所屬一級行業門類的 83.80%.100% 和 58.70% ,展現出專業領域也存在深度集聚效應。科學研究和技術服務業內部呈現金字塔結構,科技推廣與應用服務占58.70% ,專業技術服務和研究開發行業構成技術轉化鏈條,表明數據交易更偏向于應用層技術成果的商業化,基礎性研究數據的市場化程度有待提升;信息傳輸、軟件和信息技術服務業呈現梯度分布,軟件和信息技術服務占據絕對優勢,互聯網及其相關服務和電信傳輸服務行業形成輔助支撐,顯示出軟件技術在數據產品開發中的基礎性作用;租賃和商務服務業呈現單一化集中特征,商務服務業以208項數據產品獨占該門類,反映出商業服務領域對數據要素的強依賴性。同時產品主要集中于企業征信、市場調查、商務咨詢等增值服務模塊,形成完整的商業數據服務鏈。
根據產品發布主體所屬類型的分布,當前市場呈現出顯著的“私有企業主導、國有企業補充,事業單位邊緣”的格局。在平臺提供了發布主體信息的總計716個產品中,私有企業以473個的絕對優勢成為核心供給方,占比 65.83% ,國有企業以238個形成重要補充,占比 33.80% ,而事業單位僅占0.70% ,市場參與度低。具體而言,私有企業憑借敏捷的市場響應能力、技術創新優勢及靈活的數據開發機制,在數據產品研發與商業化轉化中展現顯著優勢;國有企業依托公共數據資源稟賦和政策支持,在政務服務、民生保障等特定領域形成差異化競爭優勢,但市場化運營效率仍有提升空間;事業單位受限于體制機制約束及市場化經驗不足,在數據要素市場中的參與能力較弱,尚未形成有效競爭力量。
(五)產品與服務類型
基于827項數據產品的類型統計(見圖4),檔案在數據集、API、數據服務、數據工具、數據報告、算法模型、數據資源、數據應用以及其他類型中均有不同程度的參與,其參與形態呈現多元化特征,呈現“資源主導、服務賦能、知識支撐”的三層作用架構。具體而言,檔案在數據交易中主要作為基礎數據資源發揮核心作用,同時以服務賦能載體實現價值延伸,并輔助數據算法模型的開發。
檔案承擔數據資源的核心部分,集中體現在數據集(176項)、數據資源/產品(213項)等基礎型產品中。通過提供豐富的歷史數據,檔案直接作為原始數據要素發揮作用。以廣州數據交易所的“廣物控股集團車輛銷售畫像數據產品\"為例,該數據產品由廣物控股集團利用合法收集并匿名化處理的車輛銷售數據開發而成,數據經過大數據平臺的集成、分析和挖掘,形成了從車輛品牌、車型、購車價格等多維度的綜合性統計分析結果。檔案不僅記錄了車輛銷售的原始信息,還通過數據分析和挖掘,轉化為具有高附加值的信息資源。
檔案的作用不僅局限于提供基礎數據資源,更通過服務賦能實現了價值的延伸,參與數據服務達到209項。以上海數據交易所的“智數E行一車輛ETC黑名單狀態查詢\"數據服務為例,該服務基于大數據與云計算技術,為企業提供車輛ETC黑名單狀態的實時查詢功能。檔案通過技術手段轉化為高效、便捷的查詢服務,為企業在交通運輸和城市治理領域提供了重要的決策支持,實現了向增值服務的轉變。
檔案的模型開發支撐功能則突出表現在API(88項)與數據工具(4項)等技術型產品中。以杭州數據交易所的“停車場空車位預測模型”為例,該模型基于停車場歷年停車數據使用情況,結合日歷、天氣、節假日等影響要素,構建了一個通用的空車位預測模型。歷史停車檔案不僅供給訓練數據,為模型提供高質量訓練樣本,而且構成特征工程的基礎,通過挖掘停車檔案中的隱性規律,構建特征向量空間,從而顯著提升預測精度。這個過程中檔案實現了從原始數據到知識服務的價值躍遷。但相較于基礎資源和服務賦能的功能,檔案目前在模型開發中參與相對薄弱,知識價值轉化率有待提升。

三、檔案參與數據流通交易優化策略:基于現狀分析的展望
通過梳理分析檔案參與數據流通交易的現有進展,可發現檔案在數據要素化戰略行動中發揮重要作用,是數據要素市場不可或缺的組成。在實踐進展中,需要關注檔案主體、對象、方法的具體應用與特點,為檔案領域更加廣泛、優質地參與數據流通交易提供啟示。
(一)以檔案事業與數據事業的融合引領提升參與程度
就現有實踐情況來看,從利用檔案所開發的數據產品與服務數量來看,存在檔案參與規模和成效不足的問題,盡管部分數據流通交易實踐中檔案資源、檔案服務、檔案主體等涉及其中,但檔案的話語和顯示度有限。例如,更多數據產品表述中是以歷史記錄、歷史數據來體現檔案,且檔案事業當前的主要建設者如綜合檔案館、國有企業檔案部門等參與也有限。同時,合規與體系化的數據流通交易是我國數據事業建設的重要組成內容之一,是我國作為世界上首個將數據界定為生產要素的國家的數智轉型創新探索舉措,數據流通交易在數據要素化戰略背景下體現為跨學科、跨領域面臨復雜理論與實踐挑戰的事物。因而,從整體層面來看,檔案參與數據流通交易的優化擴展需要檔案領域從宏觀事業層推進與數據事業的共生共振,由此將檔案參與數據流通交易納入檔案事業的多維度發展任務中。
一方面,從自上而下的視野來看,需要檔案事業層通過聯動數據事業、數據流通交易的重點內容,為檔案參與數據流通交易創造優質環境和行動指引。例如,戰略引導方面,在檔案事業的“十五五\"規劃中,凸顯數據要素化的戰略、理念、方法,倡導對參與數據流通交易的創新探索并設計具體任務;職能與組織架構擴展,如檔案主管部門與數據部門加強對話合作、檔案管理與館藏機構強化與公共數據運營方、數據集團、數據交易中心、數據需求方的溝通協作;政策法規與標準規范的雙向融合擴充,檔案機構主動參與正在形成體系的數據類制度建設以強化檔案話語,同時面向數據流通交易形成立足檔案資源的指導意見。另一方面,自下而上的向度上,強化更主動的、有布局的典型場景及其實踐的試點探索,將探索成果及時上升為示范案例,帶動檔案領域意識創新與行動的規模化。立足檔案場景的多元性,結合數據流通交易的多維度、多階段,形成多樣化試點。加強理論與方法總結,在系統的成效追蹤和宣貫框架下提升試點效果,形成檔案參與數據流通交易的評估和示范實踐體系。
(二)全面構建適合于檔案發揮數據要素價值的場景群
從統計情況來看,檔案在各領域都有發揮數據要素價值的可能。根據數據交易平臺調研結果,利用檔案所開發的數據產品與服務覆蓋金融服務、交通運輸、城市治理、醫療健康、商貿流通等廣泛領域。檔案若要發揮數據要素價值,尤其是參與流通交易,仍需要有多方考量。一是場景導向,這是數據流通交易在我國實踐中得出的共識性結論。換言之,數據流通交易不是簡單地以數據為原材料進入市場,而是要以業務需求為引領,探索面向怎樣的需求開發為哪種類型的適用于哪些領域的數據產品或服務。這不是簡單的檔案資源開發利用通用模式構建,而是具有“一檔案多場景”的具體實踐方案的設計,即以場景群的構建來擴展原有的通用化方法論。二是檔案得以發揮數據要素價值的領域不一定是其形成來源所屬的領域,其應用于多種其他領域的可能性較大,這進一步加大了檔案參與數據流通交易發現需求的難度。三是不同領域、不同階段、不同機構的檔案合規要求和市場化難度不同,也需要深入到檔案對象本身來一一確定參與數據流通交易的方式和方法,面向不同應用領域則進一步加大這方面的復雜性。
因此,場景群的科學設計和構建將是推進檔案參與數據流通交易的重要策略。一是加強場景多維度的研究和設計,綜合地區、行業、檔案類型、檔案機構類型、檔案供需方能力、合規要求、開發需求、流通交易成本等多方面形成評估框架,在此基礎上深入實際確定可行、優先的創新場景。另一方面,數據流通交易實現規模化、高質量、可持續的前提在于市場基礎的全面建設,對檔案領域而言則是要求提升開放程度。通過開放,可以讓社會各方面更加了解與熟悉可獲取的檔案,將其與不同領域的數據需求相匹配,由此以發揮群體智慧的方式發現具體的檔案參與數據流通交易的價值和方式,實現與需求側的全面匹配。
(三)強化各類檔案機構融入數據要素市場的能力建設
當前的實踐反映出,盡管持有檔案的組織機構多元,但參與數據流通交易的主要為企業,尤其是民營企業。數據交易平臺調研結果呈現,私有企業以65.83% 的比例占據絕對優勢,是利用檔案所開發的數據產品與服務的發布主體類型中的核心供給方。這也體現出,對目前各類檔案持有者、管理者、指導者等檔案機構而言,參與數據要素市場建設亦有豐富的空間,是否能夠實現有效廣泛參與的關鍵在于檔案機構具備一定的數據市場主體的能力。即檔案機構應當加強能力建設,對數據、數據流通交易等有更系統的認知和素養。
一是加強數據能力建設。數據能力需要面向數據流通交易和檔案特質的融合展開構建,主要但不限于如下方面:技術能力建設,優質的數據流通交易參與在數據治理、數據挖掘、數據可視化、數據故事、人工智能應用等方面都應有一定的技術支撐;基礎設施能力建設,檔案機構不僅要強化自身建設,更是要在國家東數西算、數據空間的戰略下展開布局;治理能力建設,面向數據流通交易的復雜性從頂層設計、管理規則、實施工具等方面建立能力體系。二是加強市場化能力。一方面,數據要素認知與實踐能力,需要充分跟進數據要素的創新理論和實踐前沿,充分建立面向社會各領域需求進行開發利用的意識,有效借鑒相近機構的實踐方法與模式。另一方面,培育市場化素養,即以產品和服務開發、運營、供給為導向擴展現有職能與業務,并倒逼工作能力的升級。三是加強對不同檔案機構在參與數據流通交易中的定位設計并優化相應組織架構。一方面,加強檔案領域對民營企業的納入,從檔案專業角度對提升民營企業檔案認知和開發利用進行政策倡導。另一方面,有目標、有場景、有針對性地推進公共檔案館、國有企業、檔案主管部門等不同檔案機構對數據流通交易的擴展參與。
(四)加強數據化導向下檔案開發利用體系的升級轉型
檔案參與數據流通交易本質上是數據要素化導向下對檔案利用體系的優化升級,這要求在實踐中既要加強對檔案的開發,也要推進數據產品與服務的開發,充分提升從檔案到開發利用方式與流程的數據化程度。在檔案領域開展以數據化導向為重點的檔案開發利用體系的升級轉型,強化數據認知、方法、創新路徑的融入。
一是推進面向檔案的數據治理,提升檔案的數據資源化程度,夯實開發利用的資源基礎。檔案要加快數據化力度,依托數據治理方法與實踐,將檔案質量要求、數據質量要求、市場化需求相融合,從內容多樣化、標準化、互聯互通、精細化等方面加強檔案側的數據資源建設。二是要前瞻性地將各類業務數據納入檔案化管理范疇,拓展開發利用的資源基礎和多元需求的匹配。三是加強檔案與其他背景、內容、形式的數據融合,加強檔案領域與其他數據持有或開發利用機構的合作,這也符合數據產品與服務的開發需要不同來源數據的集成融合的規律。四是加強產品與服務的精細化開發,這既是市場要求,也符合原始檔案的安全要求。
注釋及參考文獻:
[1]金波,楊鵬,劉娟娟.檔案數據要素價值內涵要義與生成機理[J].檔案學通訊,2024(6):4-12.
[2]金波,劉娟娟,楊鵬.論檔案數據要素價值[/OL].圖書情報知識, 1-12[2025-03-20 ].http://kns.cnki.net/kcms/detail/42.1085.g2.20241016.1636.002.html.
[3]楊智勇,岳幸暉.檔案數據價值鏈模型構建及實現路徑探析[J].檔案與建設,2024,(04):18-25.
[4]趙躍,李琪,王月.關于檔案數據要素若干基本問題的思考[J].檔案與建設,2024(5):3-11.
[5]楊鵬,金波.檔案數據要素論:資源要素化與要素價值化 [J/OL].情報科學,1-20[2025-03-20].http://kns.cnki.net/kcms/detail/22.1264.G2.20241010.1937.024.html.
[6]楊彩云.新質生產力培育發展中的檔案數據要素價值取向和實現路徑研究[J].檔案管理,2024(6):33-35.
[7]譚必勇.大數據時代檔案數據治理的范式轉型和時代挑戰[J].檔案與建設,2025(2):36-44.
[8]王瑋,苗運衛.科研檔案數據共享的契機、難點與策略[J].北京檔案,2025(2):51-54..
[9]王玉瑩.數據要素價值化視角下檔案數據隱私風險管理:風險識別、成因分析與保護策略[].檔案,2025(1):68-74.
[10]葉然·吐爾遜江,王興廣.我國檔案數據確權的內容、挑戰與路徑[J].浙江檔案,2024(7):30-33;36.
[11]蘇會靈.檔案數據要素流通的關鍵問題與對策研究[J].山西檔案,2024(2):62-64.
[12]許曉彤,張嘉瑋,李照川.檔案數據要素化的歷史源流、關鍵問題與價值空間.檔案與建設,2024(5):12-21.
[13]王協舟,李典誥.“互聯網+檔案”新業態發展動力的新引擎[J].北京檔案,2019(11):14-19.
作者單位:中國人民大學信息資源管理學院