周林興 黃星

摘 要:推動檔案數據開放共享是發揮檔案數據價值、賦能社會治理的關鍵。文章梳理相關文獻,闡釋大數據時代檔案數據開放共享的現實價值,探究大數據環境下檔案數據開放共享現狀,發現存在政策法規缺失、部門聯動不足、數據風險加劇等問題。對此,基于大數據視角,應從政策保障、協同共治、技術賦能等層面構建檔案數據開放共享機制,以期優化檔案數據開放共享,提升檔案數據服務效果。
關鍵詞:檔案數據;大數據;開放共享;檔案服務
分類號:G273.5
Analysis of Archival Data Open Sharing Mechanism in the Era of Big Data
Zhou Linxing, Huang Xing
( School of Cultural Heritage and Information Management, Shanghai University, Shanghai 200444 )
Abstract: Promoting the open sharing of archival data is the key of bringing the value of archival data into play and empowering social governance. This paper systematically sorts out relevant literature to explain the realistic value of archival data opening and sharing in the era of big data, and explores the current situation of archival data opening and sharing in the big data environment, finding that there are problems such as a lack of policies and regulations, insufficient departmental linkage, and increased data risks. In this regard, based on the perspective of big data, the open sharing mechanism of archival data should be developed from the levels of policy guarantee, collaborative governance, and technical empowerment, in order to optimize the open sharing of archival data and improve the effect of archival data services.
Keywords: Archival Data; Big Data; Open Sharing; Archival Services
檔案數據作為大數據環境中的重要數據資源,是“數據化的檔案信息及具備檔案性質的數據記錄”[1],既包括檔案部門已掌握的各類數字化檔案資源、電子檔案等,也包括檔案部門在檔案管理業務活動中產生的各類數據。[2]檔案數據開放共享,即檔案部門根據相關法律法規及標準規范,采用一定的手段和方式將其所收集保存的各類檔案數據[3]向公眾開放共享,使檔案數據價值全面釋放,最終實現檔案數據善治的全過程。2015年,“檔案數據資源開放共享”被作為檔案信息化“十三五”發展方向研討會的主要論題進行專門研討。2016年發布的《全國檔案事業發展“十三五”規劃綱要》(下文簡稱《“十三五”規劃》)提出,要“制定檔案數據開放計劃,落實數據開放與維護的責任”[4]。2021年出臺的《“十四五”全國檔案事業發展規劃》(下文簡稱《“十四五”規劃》)進一步提出,要“推動檔案全面納入國家大數據戰略……穩步推進開放檔案全文在線查閱”[5]。檔案數據開放共享已日趨成為大數據時代國家政策的重要關切和檔案學領域研究的前沿課題。
當前,學界關于檔案數據開放共享的研究主要集中于三個方面:一是檔案數據開放共享的認知理解。檔案數據開放共享是政府數據開放共享的重要組成部分[6],是大數據時代檔案治理的關鍵聚焦[7],能夠不斷拓展檔案數據價值實現的深度與廣度[8]。二是檔案數據開放共享的政策研究。我國既要構建統籌檔案數據開放共享的宏觀政策體系[9],也要注重個性化需求的檔案數據開放共享標準的研制[10],還要積極借鑒國外先進經驗,科學制定并完善我國檔案數據開放共享政策法規。[11]三是檔案數據開放共享的策略探究。我國可通過設置檔案數據開放專責機構和部門[12]、運用數字技術搭建檔案數據統一交換平臺[13]、制定檔案數據開放共享管理規范[14]等舉措,優化檔案數據開放共享方式[15]。總體來看,現有研究對檔案數據開放共享的研究主要從認知、政策、策略等微觀層面展開,缺乏系統探討,對于檔案數據開放共享機制的研究還較為鮮見。鑒于此,本文基于大數據時代背景,系統闡述檔案數據開放共享的現實價值,深入縷析當前的待解困境,并針對性構建檔案數據開放共享機制,以期助力檔案數據服務轉型升級。
1 大數據時代檔案數據開放共享的現實價值
1.1 開放檔案數據,深化檔案資源開發
進入大數據時代,檔案數據迅猛增長,顯示出極高的開發利用價值。作為“大數據+檔案”新業態的顯著標簽,推進檔案數據開放共享有助于貫徹落實檔案大數據戰略,倒逼檔案數據標準的規范,統一數據口徑,推動數據在不同部門、層級之間的整合與共享,從而建立跨地域、跨部門、跨系統的檔案數據庫(全文數據庫、目錄數據庫等),助力檔案數據資源利用體系的建設[16],為推動檔案資源語義開發、關聯應用提供充足的數據體量,促進檔案資源系統開發、精準開發和場景開發,提升檔案資源社會共享利用水平。
1.2 釋放價值潛能,創新檔案公共服務
檔案數據是大數據時代檔案信息資源的主體,是數字檔案館、智慧檔案館、檔案知識庫的核心基因。其經由加工組織、挖掘利用能夠演示社會、經濟、文化等發展過程并預測發展規律,提供知識服務、決策支持[17],具有巨大的價值和潛能。積極推動檔案數據開放共享,不僅能激活檔案數據價值,釋放檔案數據內在潛能,發揮實際功效,實現海量數據向智慧化轉化、靜態數據向動態化轉化、隱性數據向顯性數據轉化,更能夠提供高質量檔案數據利用服務,促進檔案公共服務精準化、知識化和社會化,將“資源庫”變成“知識庫”“思想庫”“智庫”,實現檔案公共服務效能的全面提升。[18]
1.3 滿足多元需求,打造檔案共享環境
大數據時代,用戶檔案利用需求不斷增長,日趨多樣化、專業化、個性化。推進檔案數據開放共享,一方面,可以直接滿足智慧社會環境下用戶日益增長的多元檔案利用需求,形成以公眾需求為核心、體驗為導向的檔案開放共享場域,實現社會檔案資源共享利用的數據化轉型。另一方面,能夠使檔案數據利用突破時空局限,保障任何用戶在任何時間、任何地點皆能通過泛在網絡在檔案數據開放平臺上共享檔案數據知識、利用檔案數據資源,進而改變館藏檔案數據“養在深閨人未識”的尷尬局面,推動形成檔案數據共享共建的社會環境。
2 大數據時代檔案數據開放共享的待解之困
2.1 政策法規制度缺失,缺乏有效指導
一是國家層面專門立法缺位。我國還未出臺專門關于檔案數據開放共享的法律規范,針對檔案數據開放共享的管理制度也尚未成型。現有政策法規制度中雖有《“十三五”規劃》《中華人民共和國檔案法》《“十四五”規劃》《國家檔案館檔案開放辦法》等涉及檔案數據開放共享的內容,也表明了國家對檔案數據開放共享的重視,但并未明確提出大數據背景下檔案數據開放共享的行動指南。[19]
二是地方層面政策文件缺失。當前,僅有浙江、上海等少數省市在已公布的相關政策文件中涉及“檔案數據開放共享”。如2016年頒布的《浙江省促進大數據發展實施計劃》提出“完善檔案數據共享開放標準,促進檔案數據通過浙江政務服務網向社會開放共享。”[20]但此類政策文件較為缺乏對檔案數據開放共享的全面整體闡述,微觀層面的指導作用有限,且法律效力相對一般。其他省份,既沒有將檔案數據開放共享融入大數據發展戰略謀劃和政府數據開放政策規范,也沒有提出檔案數據開放共享的具體標準規劃。[21]
2.2 檔案部門聯動不足,數據意識淡薄
一是檔案部門業務協作不足。2018年機構改革后,檔案局館兩大檔案機構之間的業務聯系逐漸淡化的可能性持續加大,并在某種程度上“加劇檔案業務數據共享聯通、檔案數據應用情況反饋的難度”[22],致使檔案數據難以發揮開放和應用價值。如浙江省瑞安市檔案館在實施“最多跑一次”改革中,由于檔案部門與業務部門在業務檔案管理問題上各自為政,以致出現檔案收集不全面、檔案歸檔不規范等問題,導致在實際中難以將檔案數據向社會充分開放與共享。[23]
二是檔案數據意識有待提升。一方面,檔案工作人員數據開放意識不強。截至2021年底,在全國各級檔案主管部門和綜合檔案館共有專職人員中,具有研究生學歷(包括博士、碩士、研究生班)的有3896人(僅占比9.5%),本科學歷(含雙學士)的有27890人(占比高達67.4%),大專及以下學歷的有9607人(占比23.2%),而在各學歷層次中,具有檔案學專業程度的僅有6684人(僅占比16.15%)。[24]可見,人員文化程度和專業程度總體較為低下,這使得其自身檔案數據管理能力和工作積極性難以保障,影響檔案數據開放共享的落實效果。另一方面,公眾整體檔案數據意識尚且不足。雖然檔案大數據戰略已然在社會層面廣泛實施,但公眾對檔案數據的認知還較為模糊,缺乏基本的數據素養能力,檔案數據獲取和利用意識仍然不強,[25]這也間接降低了檔案部門開放檔案數據的意愿和動力,從而制約檔案數據開放共享程度。
2.3 檔案數據繁多龐雜,數據風險凸顯
一是檔案數據日益繁雜量多。據統計,截至2021年底,全國全國各級國家綜合檔案館館藏電子檔案1629.9 TB,其中數碼照片423.9 TB,數字錄音、數字錄像690.6 TB,館藏檔案數字化成果已達24179.4 TB。[26]如上海市檔案館館藏檔案信息資源庫擁有各種門類目錄信息近3000萬條,各類電子檔案數據總量近40 TB。[27]當前檔案數據數量激增,而檔案數據管理工作主要依靠人工完成,效率相對低下且大大增加了檔案數據整合、共享難度,進而影響大數據時代檔案數據開放共享的實效性。
二是檔案數據風險問題日趨顯現。一方面,檔案數據質量參差不齊。檔案部門提供開放共享的檔案數據包含大量的非結構化、半結構化、甚至異構數據,且存在數據標準不一、數據格式單一等數據質量問題,檔案數據無法得以有效共享利用。調研發現,在31個省級檔案館中有24個檔案館提供開放共享的檔案數據未能實現標準統一,檔案數據格式較為單一,僅為文本或圖片形式,且更新不及時,不便于利用者對檔案數據進行多樣化開發利用。另一方面,檔案數據安全隱患突出。在開放共享過程中,檔案數據極易面臨隱私侵犯、黑客病毒侵襲、系統平臺泄露、知識產權糾紛等各種安全隱患,造成檔案數據“不可控、不可聯、不可用”,從而破壞檔案數據開放共享格局。[28]
3 大數據時代檔案數據開放共享機制構建
檔案大數據戰略進程中必須保證檔案數據高效開放、實時共享,最大程度釋放檔案數據價值要素,真正實現檔案數據價值提升。為此,需從政策保障、協同共治、技術賦能等三方面來構建互相配合運行的檔案數據開放共享機制(見圖1)。
3.1 政策保障機制:完善政策法規制度,保障檔案數據開放共享
一是出臺國家層面專門立法。法律法規對檔案數據開放共享具有綱領性約束和引導作用。因此,必須立足我國基本國情和環境背景,積極借鑒國外政策法規和經典案例,制定專門規范大數據環境下檔案數據開放共享的法律法規,使檔案數據開放共享有法可依,從而確保檔案數據能夠依法開放共享。如,美國關于檔案數據開放共享的政策法規《開放數據政策:管理作為一種資產的信息》《開放政府計劃4.0 2016—2018》《美國國家檔案管理局2014—2018財政年度戰略計劃》,俄羅斯的《2018年前俄羅斯聯邦檔案署貫徹和實施開放機制計劃》《2017—2022年俄羅斯聯邦檔案署工作計劃》及英國的《2015—2019年度業務發展規劃》等都具有一定的參考借鑒價值。
二是完善地方配套政策法規。以國家層面關于檔案數據開放共享的法律規范為綱領,積極融入大數據戰略和政府數據開放規劃,因地制宜制定地方層面配套的戰略規劃、計劃方案與實施辦法等微觀性政策文件,形成自上而下的檔案數據開放共享法制體系,確保將檔案數據開放共享落到實處。如,福建省根據國家有關法律法規、結合本省實際,制定并發布了《福建省數字檔案共享管理辦法》,明確了檔案數據開放共享目標、原則、范圍及方法等事項,對貫徹檔案數據開放共享具有較好的針對性指導作用。
3.2 協同共治機制:倡導多元主體協作,構建檔案數據開放生態
首先,推進檔案部門聯動協作。通過建立戰略合作機制、部署項目、布局聯合實驗室、打造專家人才庫等方式,加強檔案局館、館際和館室之間的聯動、協作及配合,互鑒先進經驗,形成相互支持、共同發展的區域聯合體,實現檔案數據資源的有機整合和共享利用。再如浙江省紹興市檔案局與檔案館緊密合作,合力開展民生檔案數據共建共享試點項目,通過選派骨干力量組建工作專班、建立業務交流機制等方式,促進了全市民生檔案數據更大規模、更廣范圍的開放共享。[29]
其次,提升檔案工作人員數據素養。一方面,深化人才引進工程。可通過吸納計算機科學、數據科學、大數據及人工智能等專業人才,優化檔案部門專業性人才結構,提高檔案工作人員數據開放意識與能力。如,廣西壯族自治區來賓市檔案館為落實檔案數字化轉型,將計算機科學與技術類專業人才納入招聘范圍內。另一方面,強化繼續教育培訓。可邀請學界專家和業界權威對檔案工作人員進行專題培訓,并采取“導師制”“項目制”“合作制”等方式,開展檔案數據開放管理主題研修,培育檔案工作人員數據思維、計算能力及實操技能。如,陜西省寶雞市檔案局(館)為提高政務檔案數據共享利用工作成效,定期邀請信息化工程師開展電子檔案數據管理培訓。此外,實施人才儲備計劃。檔案部門可與高校檔案院系合作辦學,通過人員互聘互派、共建大數據和數據科學等課程、建設檔案數據應用研究中心等方式聯合培養集檔案知識和數據技能于一體的檔案專業人才,增強后備人才儲蓄。如上海市檔案局(館)和上海大學文化遺產與信息管理學院合作辦學,共建檔案學產學研人才培養基地。
最后,鼓勵公眾驅動數據開放共享。一方面,拓寬互動交流渠道。可搭建線上互動社區、線下調研團隊,通過定期發放問卷、開展訪談的形式,收集公眾對檔案數據的需求及其對檔案數據開放共享的建議,并在該過程中加強檔案知識普及宣傳,以此提升社會檔案數據意識。如,湖北省荊州市檔案館按期對用戶開展電話回訪和普法教育,以及時了解用戶檔案數據需求和檔案數據開放利用實際效果,幫助用戶提高檔案數據意識。另一方面,建設參與激勵機制。可通過開展檔案數據應用創新賽、公益挑戰賽等激發公眾和社會機構參與大數據環境下檔案數據開放共享的熱情和積極性。如,廣東省深圳市光明區檔案局(館)面向社會開展科研檔案數據管理知識競賽,通過以賽促學、發放獎勵的形式,鼓勵公眾為科研檔案數據管理建言獻策,進而優化全區科研檔案數據開放共享的形式和策略。
3.3 技術賦能機制:強化數據技術應用,維護檔案數據開放穩定
首先,打造檔案數據服務平臺。采用云計算、5G、3D、VR、AR等大數據治理技術,構建檔案數據開放共享系統,對多領域離散檔案數據進行計算、集成、整合、存儲與可視化處理,并借助語義關聯、聚類分析等手段進行有序化、可視化處理,最大化釋放檔案數據資源價值。如浙江省利用各地數字檔案館建設成果,搭建涵蓋檔案目錄、開放檔案全文、檔案業務工作的全省檔案數據總庫和應用平臺,實現檔案數據共享利用智能化、可視化和實時化,促進檔案數據互聯互通共享,從而提升檔案數據對外開放共享能力和便民服務水平。[30]
其次,構筑檔案數據質量堡壘。應用人工智能、元數據管理等技術方法,通過對檔案數據開放共享全過程進行循環監控和評估,實時清洗和審查檔案數據內容,解決重復創建、數據冗余、數據異常等問題,并提供多樣化、兼容性強的數據開放格式,維護檔案數據開放共享階段的質量效果。如江蘇省昆山市檔案館研發出基于機器學習算法的AI智能校對系統,該系統能夠將符合開放共享要求的檔案數據與機器學習與人工智能服務平臺的文字服務、自然語言分析服務進行對接,通過語義分析預處理、對比分析等模塊對檔案數據的格式、內容進行質檢,實現對開放共享檔案數據質量的全流程管控。[31]
最后,筑牢檔案數據安全屏障。可利用防入侵檢測、防火墻等技術手段,在準確監測開放共享檔案數據屬性的基礎上,精細劃分檔案數據的操作訪問權限,打造“可用不可見”的開放共享檔案數據安全交互空間,提升檔案數據開放共享的安全防護能力。如溫州市龍灣區檔案館借助堡壘機、入侵檢測、防火墻、日志審計等技術設備,搭建起一套檔案數據安全防護的軟硬件體系,實現政務數據公開網與局域網的物理隔離,確保了檔案數據開放共享全流程的安全。
4 結 語
大數據時代,推進檔案數據開放共享有助于充分釋放檔案數據價值,滿足社會發展需要,從政策保障、協同共治、技術賦能等方面構建大數據時代檔案數據開放共享機制,才能推動檔案數據開放共享規范發展,不斷提升檔案公共服務質量和水平,最終實現檔案工作走向依法管理、走向開放、走向現代化。
*本文系國家社科基金一般項目“國家大數據戰略背景下檔案數據質量優化控制研究”(項目編號:21BTQ016)階段性研究成果。
注釋與參考文獻
[1][2]金波,添志鵬.檔案數據內涵與特征探析[J].檔案學通訊,2020(3):4-11.
[3]本文所討論的檔案數據不涉及國家安全、商業機密及個人隱私等相關檔案數據。
[4]國家檔案局印發《全國檔案事業發展“十三五”規劃綱要》[eB/Ol].[2022-09-26].https://www.saac.gov.cn/daj/xx gk/201604/4596bddd364641129d7c878a80d0f800.shtml.
[5]中辦國辦印發《“十四五”全國檔案事業發展規劃》[eB/Ol].[2022-09-26].https://www.saac.gov.cn/daj/ toutiao/202106/ecca2de5bce44a0eb55c890762868683.shtml.
[6]張東華,尹瀧杰.數據倫理視域下檔案數據開放規范發展探析[J].檔案與建設,2022(3):21-24.
[7]高晨翔,牛力.國內“檔案數據”研究述評[J].檔案學研究,2020(5):11-18.
[8]楊智勇,謝雨欣.面向善治的檔案數據治理能力體系構建[J].檔案與建設,2022(2):9-13.
[9]馬海群.檔案數據開放的發展路徑及政策框架構建研究[J].檔案學通訊,2017(3):50-56.
[10]王協舟,尹鑫.英美法系國家檔案數據開放法律與政策調研及經驗借鑒——基于文獻、文本和案例的省思[J].檔案學通訊,2019(4):48-57.
[11]zhu?X.The?failure?of?an?early?episode?in?the?open? government?data?movement:A?historical?case?study[J]. Government?information?Quarterly,2017(2):256-269.
[12][21]唐長樂,王明明.我國檔案數據開放研究——基于政府數據開放平臺的調查[J].浙江檔案,2022(1):44-47.
[13]易濤.“最多跑一次”改革背景下檔案數據壁壘的生成與消解[J].浙江檔案,2018(12):14-17.
[14]陳展.檔案數據開放推進路徑探略[J].浙江檔案,2019(1):20-22.
[15]宣炳宇.我國科研檔案數據開放問題與優化策略研究[D].上海:上海師范大學,2022:47.
[16][17][22]周林興,崔云萍.大數據視域下檔案數據質量控制實現路徑探析[J].檔案學通訊,2022(3):39-47.
[18][25]金波,楊鵬.大數據時代檔案數據治理研究[J].檔案學研究,2020(4):29-37.
[19]趙躍.大數據時代檔案數據化的前景展望:意義與困境[J].檔案學研究,2019(5):52-60.
[20]浙江省人民政府關于印發浙江省促進大數據發展實施計劃的通知[eB/Ol].[2022-09-28].https://www.zj.gov. cn/art/2016/3/1/art_1229019364_55102.html.
[23]潘高志.提升檔案治理能力?服務縣鄉權責重構[J].浙江檔案,2020(7):41.
[24]國家檔案局政策法規司.2021年度全國檔案主管部門和檔案館基本情況摘要(一)[eB/Ol].[2022-09-29]. https://www.saac.gov.cn/daj/zhdt/202208/fedf617068af49b7a92b8 0f54723746b.shtml.
[26]國家檔案局政策法規司.2021年度全國檔案主管部門和檔案館基本情況摘要(二)[eB/Ol].[2023-01-12]. https://www.saac.gov.cn/daj/zhdt/202208/b9e2f459b5b1452d8ae8 3d7f78f51769.shtml.
[27]楊鋒,張新.主動融入服務大局?實現更高質量發展——“十三五”上海檔案事業發展回望[J].中國檔案,2020(8):36-37.
[28]金波,楊鵬.大數據時代檔案數據安全治理策略探析[J].情報科學,2020(9):30-35.
[29]浙江紹興局館協同推進檔案事業高質量發展[eB/ Ol].[2023-01-13].http://www.zgdazxw.com.cn/news/2022-08/26/content_336194.htm.
[30]浙江省檔案館啟動省檔案數據中心建設[eB/Ol].[2022-10-07].https://www.saac.gov.cn/daj/c100206/202007/7d cd942d610c40a78a2ebe7d2c7e82bc.shtml.
[31]江蘇昆山市檔案館數據資源人工智能校對系統上線應用[eB/Ol].[2023-03-07].https://www.saac.gov.cn/daj/ c100202/202203/176b674a17ef48dd869fb6252148d621.shtml.