閆鵬
日前,國務院辦公廳印發《科學數據管理辦法》(以下簡稱《辦法》)第一次從國家層面上實現科學數據的統籌管理,《辦法》出臺使得科學數據管理問題受到社會各界的廣泛關注。早在2001年英國倫敦召開的“Digital? Curation:? digital archives , libraries? and? e-science? seminar”國際研討會上便提出檔案學家與數據專家應當在e-science中開展關于科學數據管理的跨部門交流與合作,以確保科學數據的長期保存與開發利用。近年來,我國檔案界逐漸意識到大數據與數據管理的重要性,檔案工作在大數據時代下如何創新發展成為業界討論的熱點。有的學者提出“數據管理應當成為檔案服務新領域”。于英香教授指出:“大數據時代產生了需要檔案部門監督或者參與管理的大量數據,‘檔案數據無論是來源、規模還是類型、結構都變得或將變得復雜多元,這些數據如何管理是檔案部門最關心的課題。”科學數據作為重要的原生數據,本質上講也是一種“檔案數據”,需要檔案部門的參與管理;隨著國家與社會對于科學數據的廣泛重視,參與科學數據作為檔案部門與社會動態互動方式,將有助于提高檔案工作者的社會融合深度與服務領域寬度。本文引入利益相關者理論,試圖通過構建檔案部門與利益相關機構的互動關系模型,提出檔案部門參與科學數據管理的策略建議,力求助力檔案部門參與科學數據管理。
一、利益相關者理論下檔案部門參與科學數據管理互動模型
利益相關者理論起源于企業管理中,強調通過平衡考慮各利益相關者的權益要求,謀求企業長久發展。1984年美國研究經濟倫理與戰略管理的學者弗里曼明確提出了利益相關者理論,并對利益相關者做出了具體的闡釋,即為“能夠影響一個組織目標的實現,或者在一個組織實現目標過程中會受到影響的個體或群體”。每一個社會組織在其運營的過程中都無法避免與其他機構產生利益互動,因而利益相關者理論是一個對于管理活動具有實踐意義的理論分析框架。
科學數據管理是一項復雜與系統的工作,需要涉及社會多方利益相關機構。檔案部門要想參與其中,需要準確把握定位并合理分析其與其他機構的利益互動關系。參照辦法中相關規定,本文將利益相關者確定為政府部門,數據中心,科研機構,并根據利益相關者理論的“公司治理的利益相關者模型”,構建一個檔案部門參與科學數據管理與利益相關者的互動關系模型。
1.檔案部門
檔案部門在長期的數字化建設中,資源數字化、數據庫的建設及數字資源長期保存等方面有完善的理論體系及技術支撐,在元數據方案設計、數據標準化組織等業務領域有較多的實踐經驗。此外,我國檔案館一直有參與科研的傳統。“早在1961年黨中央批準了《關于科學技術研究機構當前工作的十四條意見》(草案),其中便規定要專門建立專題技術檔案,”即科研檔案。“科研檔案作為科技研究活動的直接記錄,記載與反映了科技研究活動的全過程與具體成果。”大數據時代下,科學數據實際上就是科研記錄的數據形態,而參與科研數據管理就是科研檔案管理工作在大數據時代下的拓展與延伸,在長期科研檔案管理實踐中積累的成套性、專業性、階段性的科技檔案管理模式完全適用于科學數據管理。因此,檔案部門要轉變意識,探尋參與科學數據管理的角色轉換。
2.政府部門
各級政府部門是科學數據管理的發起者與重要推手,隨著科學數據對于未來社會和國家發展的戰略意義逐漸得到重視,政府開始從國家層面來部署科學數據管理的基礎設施,制定相關政策將科學數據強制性匯交到國家數據共享交換平臺,面向社會和相關部門開放共享,構建新的數據驅動的經濟社會發展范式。政府部門作為科學研究的主要資金來源與主管機構,有權對科學研究中產生的數據的流向與共享制定相關政策與制度約束。“科學數據共享離不開完善的科學數據管理政策法規的保障。國外一些發達國家已制定了較完善的科學數據管理與共享的相關政策。”進而保障了科學數據得到有效地管理與共享。政府在政策制定過程中,可以參考檔案部門提供的反饋及時做出調整,不斷優化政策導向,促進科學數據管理的協調有序進行;此外,政府部門同樣需要出臺相關政策,支持檔案部門的角色地位。
3.科研機構
《辦法》規定有關科研院所、高等院校和企業等法人單位是科學數據管理的責任主體。科研機構作為科學數據的主要生產者,對數據的產生語境和產生流程有著獨一無二的認識,這對后期科學數據的描述、組織、保存并保證能夠最終被其他用戶所理解、使用是至關重要的;作為數據的擁有者,科研機構需要制定合理的數據使用管理計劃,“按照有關規范進行科學數據采集生產、加工整理和長期保存,確保數據質量,并做好科學數據保密、安全以及開放利用等工作。”這要求研究人員在進行科學研究的同時,還要具有收集、分析、共享及有效管理和保護研究數據的能力,給工作繁重的科研人員提出了更多的挑戰。檔案部門可以參與具體科研過程,利用長期電子文件與科研檔案管理經驗提供科學數據全生命周期的整合匯總、長期保存等服務,實現科學數據管理的良性循環發展。
4.科學數據中心
科學數據中心大多是政府主導建立的公益性質的數據整理和服務機構,是科學數據開放共享的重要載體。早在人們普遍認識到科學數據價值之前,已經有大量數據被保存在各類數據中心。這些數據中心大多以數據密集型的學科為導向,通過數據管理與共享服務于本學科的發展與進步。如美國航空航天局(NASA)數據庫、人類基因組計劃(HGP)、美國國家海洋與大氣部(NOAA)等均為各學科領域權威的數據監護中心。中國也早在2004年開始,進行數據中心的試點工作。現有的各種學科數據中心是科學數據管理的先行者,具有較為成熟的管理經驗與制度。這些數據中心在數據管理的技術支持、工具平臺的設計、標準法規的制定等方而都擁有堅實的業務基礎,可以為檔案部門科學數據管理服務提供成熟的模式與框架。伴隨科學數據的日益關注與科學數據類型的日益多樣,科學數據中心主要接收的也是國家科技計劃項目產生的科學數據,雖然鼓勵由社會資金資助形成的其他科學數據移交,但無法覆蓋所有科學數據;而數據中心的數據監護也存在無法覆蓋科學數據的全生命周期、無法充分挖掘其價值的局限性。需要檔案部門及其他部門提供業務補充。
二、檔案部門參與科學數據管理路徑分析
1.提供科學數據管理研究的理論借鑒
當下科學數據管理中面臨著數據海量且增長迅速,科學數據無序雜亂而難于管理,科學數據真實,可靠性、完整性及可持續利用性難以保障等多方面的困境,檔案學科發展中也曾面對著同樣的難題,檔案學的相關理論與原則諸如來源原則、鑒定理論以及文件生命周期理論等,可為其研究提供有益的指導與借鑒。具體而言,來源原則所強調尊重來源、完整性及元數據在其中的應用,這對確保科學數據的真實性、完整性及可信性具有重要意義,并且可以指導海量科學數據的整理;檔案鑒定理論的原則與標準應用可以很好地解決海量資源的評估與選擇,確保有價值的數據得以保存與利用;文件生命周期理論對數據生命周期的完整性認識及對科學數據全程管理及前端控制的思想為科學數據管理研究提供全新的思考。檔案部門,特別是檔案學界應當重視對于科學數據管理研究中理論輸出,在科學數據研究中發揮自身獨特作用。
2.融入科學數據管理實踐的全過程
科學數據的管理要立足于數據本身,掌握其形成規律。當下對于數據形成規律的研究構建了諸多數據生命周期模型。這與檔案部門業務工作有著共通之處。因此,檔案部門要在全程管理與前端控制思想指導下,關注并參與到整個科學數據生產、管理、提交利用等全過程。宏觀層面上,檔案部門依賴自身經驗與管理實踐為依托,參與政府部門制定的政策法規與管理規范當中,與數據中心進行數據匯總格式的協商、數據的提交規范的探討及研究。微觀層面上,科學數據管理的實際情況,需要檔案部門要深入科研機構進行嵌入式管理。具體而言,在數據生產階段,協助科研單位及相關部門共同制定本機構的數據提交政策、數據管理方案、數據長期保存規劃等,明確機構的階段和長期的科學數據管理計劃,構建數據管理架構和基礎設施。在數據管理階段,檔案人員可以參與到具體的科研項目中去,通過其自身的優勢,協助科研機構制定數據管理計劃,確定合適的元數據管理,量身打造數據長期保存策略。在數據提交階段,辦法對科學數據要求匯交的規定,檔案部門應當與科學數據中心等合作以確保提交數據的規范統一。
3.開展科學數據管理業務培訓
科學研究正在向數據密集型發展,對于科研人員自身的數據管理意識和能力提出了更高的要求。近年來,圖書館領域結合自身特色,開展數據處理、分析等操作技能培養、數據管理與分享等方面的培訓。確保館藏資源的安全一直是檔案工作的主旋律,安全可信,長期可用是檔案部門業務工作的出發點與落腳點。科學數據作為一種新的管理對象,對于檔案部門以至于整個社會來講都是一個挑戰。首先,檔案部門自身在科學數據管理方面也處在學習階段,需要不斷學習和積累科學數據管理方而的經驗,以提高自身數據安全管理能力。其次,除了直接參與科學數據管理工作外,檔案部門還可以通過為科研人員提供線上的課程、資料, 還有線下的講座、研討會、案例分析等方式提高科研人員的數據安全意識,增強其數據管理能力。美國國家檔案和文件管理局開設數據管護與培訓項目,英國數據檔案館專門為社會科學領域的學者提供培訓服務等均是檔案界近年來積極開展數據管理較為成功的案例。
4.提供科學數據保存服務
《辦法》主要針對的是受政府預算資金的科研項目,而非國家資金支持的科研活動中產生的數據,同樣具有重要的保存價值數據。國外學者相關研究中提出“數據存儲庫分為通用存儲庫、機構存儲庫、領域存儲庫、出版物存儲庫、圖書館/檔案館/博物館以及科研項目存儲庫等類型”。已經開始將檔案館視為一種重要的數據存儲庫類型,以為數據集提供存儲和訪問平臺,支持標準化的數據質量控制和完整的全生命周期管理。面對科學數據迅猛發展的浪潮,作為人類智慧結晶的一部分,檔案館作為公共事業單位,在大數據時代,應當作為科學數據管理基礎設施的一部分承擔起科學數據,特別是受社會資助項目的科學數據長期保存工作。
科學數據管理是一個廣泛而復雜的主題,仍然處于研究與實踐的起步階段,這給檔案部門帶來了數字化轉型拓展的機遇,也為檔案工作提出了更高的要求,檔案部門要在科學數據管理中找準自己的位置,積極主動參與進來,有為才能有位!
(作者單位:上海大學圖書情報檔案系)