朱小慧 丁華東/上海大學文化遺產與信息管理學院
2018年3月14日,上海市檔案局與江蘇省檔案局、浙江省檔案局、安徽省檔案局在滬正式簽署開展民生檔案“異地查檔、便民服務”工作意向性合作協議,拉開長三角民生檔案一體化建設序幕,一個覆蓋300余家綜合檔案館的“民生檔案公共服務朋友圈”進入大眾視野[1]。2020年10月,三省一市共同打造的民生檔案跨區域一體化在線查檔平臺“長三角‘一網通辦’”正式上線,實現滬蘇浙皖原有民生檔案查檔平臺的互聯互通,成為全國首個跨省檔案查詢利用平臺,用戶可選擇互聯網查檔或政務網跨館查檔。
檔案數據整合的核心任務即是從不同數據儲存庫獲取、整理、集成、序化數據,它是跨系統、跨區域、跨部門、跨層級檔案資源交換、數據共享、遠程利用的基礎支撐,長三角民生檔案數據整合實踐的進行自有其動力體系,主要包含政策、需求、理論、技術四個方面。分析長三角民生檔案數據整合的動力來源,既可理順其整體邏輯脈絡,又能為其他跨區域檔案數據整合共享利用項目提供示范,令其可在推進動力、推行策略、推廣實踐等方面找到理論與實際兩方面的可靠可行、切實有效的經驗借鑒。
支持政策是由黨和國家從全局出發,輔之現實考察,為檔案數據整合定制宏觀上的戰略規劃、統籌指導及微觀上的行動指南、行為準則,使整合實踐兼具權威性與可行性。政策類型和形式多樣,從主體層次角度主要可分為國家中央級政策和地方黨政組織政策[2],要發揮政策多重疊加效力,形成長三角民生檔案數據整合的強大驅動力。
長三角一體化建設在宏觀層面的政策條件已相對完善,也間接為長三角檔案資源的互通共享營造良好的政策環境。2018年11月,習近平總書記在首屆國際進口博覽會上宣布,支持長三角區域一體化發展并上升為國家戰略[3]。2019年3月,據國務院辦公廳要求,長三角12項民生檔案查詢“一網通辦”在G60科創走廊九城實施試點,并逐步向26+X個城市推廣[4]。同年5月,中央政治局會議審議通過《長江三角洲區域一體化發展規劃綱要》,強調要強化區域聯動發展,加快公共服務便利共享[5]。2020年8月,習近平總書記在扎實推進長三角一體化發展座談會上指出要堅持目標導向、問題導向相統一,特別要在一體化發展中補齊民生短板[6]。2021年,國家發改委下達專項投資12億元,確保長三角一體化戰略經費充足,并加強投資計劃執行監督檢查,及時跟進實施情況,督促協調解決有關問題,推動戰略持續取得實效[7]。
地方層面的支持政策更聚焦長三角民生檔案一體化發展,三省一市檔案部門是項目主導者、政策執行者與監督者、利益相關者。滬蘇浙皖檔案部門聯合制定《長三角地區民生檔案“異地查檔、便民服務”辦事指南》,作為民生檔案異地查檔服務參照標準。2018年6月,合作項目被納入《長三角地區一體化發展三年行動計劃(2018—2020年)》。為深化合作、全面推進長三角查檔“一網通辦”總目標,2019年9月三省一市共同簽署《長三角地區檔案部門重點協同項目備忘錄》,提出建立民生檔案查詢數據結構及服務操作標準體系、檢索數據庫[8],長三角檔案一體化進入全面提速新階段。同時,各省市打通內部檔案數據整合壁壘促進長三角聯動發展,如上海已將20種通辦民生檔案全部納入異地查檔服務體系[9];浙江[10]、江蘇[11]均專設相關工作領導小組;安徽省檔案局、檔案館協作完成省市縣三級國家綜合檔案館婚姻登記、獨生子女證、知青3個檔案查詢類共375個公共服務事項實施清單制定工作,統一檔案數據標準[12]。
社會需求和社會價值是任何社會活動存在的根基和意義。在建設服務型政府和完善公共服務體系的雙重影響下,檔案部門越來越主動地將檔案工作融入公共服務中,加快檔案公共服務能力培養。因此,新時代檔案服務政策更突出公共取向、深入融合時代內涵、注重增進公共價值、追求服務價值實現。總之,檔案服務的社會需求包括公共事業建設對檔案服務的需求、社會公眾生產生活對檔案服務的需要,即“服務社會、服務公眾”,以滿足這一社會需求為重要工作內容已逐漸成為檔案業界共識和檔案信息服務的永恒主題[13]。以需求為牽引,才能保證檔案資源的建設重點、開放內容與公眾需求的精準精細化對接,最大限度滿足公眾用檔需求,實現檔案資源價值極致化和社會效益最優化。實際上,面向社會、服務民生或以用戶為中心的工作理念,都是以人民為中心的發展思想在檔案領域的貫徹落實。
社會需求充當了長三角民生檔案數據整合實踐的內生動力。大數據時代,一方面,數據強勢滲透并流動傳播于社會生活中,客觀上授予民眾包含信息權、數據權在內的數字權利[14],出于數字化生存的基本需求,民眾的主體權利意識、知識水平、實踐能力及數字技能日益提高,其對檔案資源的需求也越發多樣化、個性化、專深化;另一方面,“數智”技術的賦能助力數據獲取路徑便捷化、獲取內容豐富化,民眾對檔案信息服務質量的要求也日漸提升,智能化、高效化、知識化成為公眾對檔案信息服務方式選擇的關鍵評估指標[15]。然而,現實是網絡信息技術的普及應用致使檔案數據爆炸式增長、分布散亂、價值密度低,導致資源供給與利用需求的斷裂,這就反向倒逼了檔案數據整合不得不以需求為導向,加速推進。所以,必須對民生檔案數據的分布與建設情況、歸屬與流向、民眾需求等特點進行調查摸底、分析研究,探尋合適的數據整合技術,制定科學合理的數據整合計劃[16]。如,江蘇省檔案局民生檔案調研組對全省110家檔案館館藏全部民生檔案及其利用情況、是否已經聯通相關網絡、是否在政務網/互聯網上部署民生檔案專門利用系統等18項內容進行全面排查摸底,摸清了省內各級國家檔案館民生檔案種類數量、文件級目錄數據條數、目錄全文數據容量等情況,為全省檔案數據整合提供科學統計依據;江蘇省還成功實現在全省統一使用電子簽章在線出具檔案證明,精確服務異地群眾就業、買房、入學等[17]。
理論是實踐的先導,大規模的社會行動尤其需要理論的支撐,科學的理論旨在發現事物的本質和規律[18],具有客觀性、時代性和真理性,可轉化為實踐的科學引導動力,使具體行動具備內在邏輯性。長三角民生檔案數據整合實踐由以下幾個理論作為支柱。
信息資源與傳統資源的最大區別在于信息邊際成本遞減,信息規模越大,價值也越大。信息集群理論認為,信息集群是基于現代信息技術和組織管理程序,聚集各個系統或區域內檔案館及其他信息機構的信息資源,形成一個具有協作功能的有機整體,包括功能交互、信息共享與數據通信;集群內各類信息資源進行統一處理,避免冗余,為用戶提供統一透明的界面,實現數據共享;其目的是對信息資源集成化、程序化、共享化、協調化,實現集群資源配置最優化,拓寬集群資源應用領域,深度挖掘信息資源價值,全方位滿足檔案館不同層次用戶的信息需求[19]。檔案館信息集群具有地理集聚、靈活專業、合作競爭的特征,優勢突出:成員館信息、技術、人員等優勢互補,可提升各自檔案資源整合能力和競爭優勢;成員館通過數據整合,將分散資源變成綜合資源、稀缺資源變成富有資源,可提升各自信息資源增值能力;成員館分工協調、互通有無,可提高各自經費的利用率;成員館信息資源標準化、統一化共建共享,可提高各自服務水平和效率[20]。
憑借民生檔案“異地查檔、便民服務”項目契機,長三角區域各級檔案館進行一體化建設摸索,并已初步形成信息集群,其民生檔案數據整合也以多樣化形式顯現對信息集群理論的應用。如,上海市檔案部門依托大數據、云計算、人工智能等新興技術建成的市“一網通辦”政務服務總門戶,大力開展電子文件歸檔和電子檔案管理工作,制定《上海市公共數據和一網通辦管理辦法》,通過與大數據中心和政務服務部門協作、檔案數據與政務數據的整合實現服務主體與服務內容的協同與共享,通過在平臺開設面向社會公眾的在線查檔、監督評價窗口實現服務主客體間的協同共建與資源共享[21]。
協同理論是系統科學的重要分支理論,1976年物理學家哈肯發表《協同學導論》,定義協同為一個可與外界自由交流的開放系統,基于一定前提條件,通過內部各單一子系統間的非線性互動,最終能產生含特定功能的有序化自組織結構,其最終目的是使系統從無序變為有序、從失衡變為平衡,進而令系統增值。協同的基本特征有:目標性,經子系統彼此合作借力,實現系統整體演進,最終實現質的飛躍;關聯性,各子系統聯系緊密;網絡性,協同系統是一個多層次、多角度、輻射范圍廣的立體性而非平面化的系統;動態性,協同是動態變化的,故協同和競爭密切關聯,相互依存、相互轉化。協同效應是協同作用產生的結果,指在一個由多個子系統構成、完全開放、結構較為復雜的大系統中,內部各子系統間的相互連接和作用使大系統整體功能增強,這種整體效應即為協同效應。它是系統有序結構形成的內在推動力,普遍存在于紛繁復雜的大自然系統和社會系統中,仔細分析,其內部皆存在一定程度的協同作用[22]。
協同是系統內各要素相互聯系和作用的過程,在長三角檔案一體化大系統內,民生檔案數據整合子系統的創建與運行都在踐行協同理論:整合主體上,體現為三省一市檔案部門跨區域協同,省(市)內檔案館與大數據中心、民政部門等其他政府機關的跨部門協同,共同創造了集省、市、縣、村社多層級于一體的檔案資源系統;整合內容上,表現為實現了多類檔案數據的協同,滬蘇浙皖各級民生檔案數據的協同,檔案與其他政務數據的協同;整合策略上,呈現為統一數據標準、統一檢索平臺、聯合編目等多種推進策略的協同,元數據技術、數據庫技術、網絡協議技術等多種推進技術的協同。
文件連續體理論是在電子文件環境下催生的,其模型中的四個維度包含社會中一切記錄化信息及其在不同時空延伸中可能存在的所有形態和作用,適用范圍廣泛,主要特征有二:一是連續性。連續體本質指其核心概念“文件”在不同維度中不同存在形態的連續性,在形成維,作為行為痕跡記錄在文檔中;在捕獲維,文檔被捕獲入某一管理系統,轉為證據文件;在組織維,文件在管理框架內成為檔案被組織管理,作為個人或組織記憶;在聚合維,檔案在社會背景下聚合為檔案群,作為集體記憶。二是動態性。四個維度體現文件在不同時空由弱到強的聚合層次,因為不同形態的文件在四個維度中的轉換是廣泛人類互動的結果,在文件隨時空變化而持續被形成、捕獲、組織和聚合的過程中,其不同形態并無固定轉化次序,或跨維度轉化、回流式轉化、多維度并存,或只存在于一個維度而不作任何轉化,所有運動方向皆取決于其所處情境[23]。據此,文件連續體理論倡導文件與檔案管理一體化,強調一體化管理過程中主體軸全員互動交流、管理要素協調運用、管理策略靈活創新、管理活動協作開展、管理成果全員共享。長三角民生檔案數據整合實踐也映射出其對文件連續體理論思想的合理化用。如,浙江省檔案館不僅完成婚姻登記歷史數據向民政部門歸集,在全省婚姻登記辦事窗口設省檔案服務網專門用戶,還在全省“婚姻登記系統”新增數據在線數字化歸檔,實現婚姻登記歷史檔案和新增檔案在各地檔案館和民政部門間的共建共享[24]。
科學技術是第一生產力。如果說政策、需求、理論動力分別完成了長三角民生檔案數據在制度設計、建設方向、邏輯根源三個層面的整合,那正是因信息技術的注入,才使長三角民生檔案數據得以真正在數據本體層實現集成和整合。數據本體層的檔案數據整合是一個將數據從部分到整體、從無序到有序、從零散到系統的管理活動過程,注重檔案資源有序化、體系化建構。從技術角度,強調檔案數據整合的各類技術及其實現過程,重視對集成成果的開發利用[25]。數據整合內容可細分為兩個層面:一是數據流動層面,整合是對生成加工活動及流程的重新組合;二是數據內容層面,如不同形式數據、相同形式信息之間的重組等,涵蓋數據、內容和應用三個具體方面的整合[26]。由此,檔案數據整合的基本途徑有以下三種。
數據整合目的是打破數據壁壘,運用數據集成技術將離散、多元、異構的檔案資源組織成為一個內部各子系統之間數據可流動的整體,以便于統一管理利用。長三角檔案部門在民生檔案數據整合層面做了許多努力,如依靠數據接口、系統對接、中間件等技術聯通三省一市民生檔案數據庫,構建統一的民生檔案資源庫與共享平臺,建立互認互通的民生檔案數據標準體系,實現聯合編目、統一檢索、統一標準、統一辦理等,破除信息煙囪現象[27],使長三角地區民生檔案資源可跨區域、跨部門、跨層級流通、獲取和維護。
內容整合的目的是實現知識層面的融合與關聯,使海量檔案數據以結構化、網絡化的知識體系呈現。當前長三角民生檔案還只是淺層次的數據整合,內容整合有待下一步探索,如可應用元數據技術、語義本體、知識圖譜等對民生檔案數據進行多維度、多粒度、多角度的揭示和描述,盡可能將全域民生檔案資源創建關聯鏈接,以構建全面、完整、富有語義的關聯數據網絡,再以可視化方式呈現,讓公眾可從任意數據單元通過RDF鏈接獲得更多潛在相關的民生檔案資源,簡化資源共享與知識發現[28]。長三角雖在數據整合方面沒有直接采用語義技術,但在了解民眾用檔需求上已有初步實踐,如上海市檔案部門借助市政務服務平臺,利用數據挖掘技術深度分析用戶信息與過往行為數據,結合用戶畫像、知識圖譜技術主動預判用戶需求,實現智能導航、個性化服務推薦等功能[29]。
過程整合的目的是提高各主體及其與客體之間應用檔案資源的自主性,采取網絡協議、訪問權限等技術對檔案數據的傳輸過程、共享應用設定統一規則和制約,主客體只需符合規則便可自由存用數據資源。如江蘇省檔案部門在研制電子簽章技術時,與省政務辦、大數據管理中心、安徽省檔案館及大數據局、中信公司5方共同討論跨區域平臺互聯在線出證工作條件、實現路徑和技術細節,制發省政務電子簽章,建成蘇皖跨區平臺民生檔案在線出證試點,可提供異地查檔在線出證服務,提高兩省民生檔案數據整合與共享靈活度,普惠更多民眾[30]。
推動檔案數據整合是為了檔案資源能得到有效利用,如實現共享服務和知識創造。長三角檔案數據整合四個動力相輔相成、缺一不可,共同孕育完整的動力系統:政策為需求實現筑牢政治保障,為理論落地提供可行方案,為技術實施調配各類資源;需求倒逼政策健全、賦能理論革新、創新技術應用;理論為政策制定與調適、需求梳理與分析、技術創造與實驗予以思想向導;技術使政策執行、需求變現、理論驗證成為現實。為此,有必要進一步加強政策保障,落實有關理論,掌握需求趨向,融合新舊技術,促使長三角民生檔案數據整合實踐提質增效,拓寬檔案資源共享空間,提升檔案信息服務便民程度。