999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

社會科學數據長期保存現狀調研與啟示

2024-05-11 00:00:00單嵩巖張靜潘亞男
檔案與建設 2024年3期

摘 要:社會科學數據是社會科學研究中必不可少的基礎要素,其長期保存具有重要意義。文章通過網絡和文獻調研梳理社會科學數據長期保存關鍵問題、國內外社會科學數據管理政策、長期保存研究進展,并總結國外社會科學數據檔案館實踐經驗,從促進集中管理、加強頂層設計、重視鑒定、開展合作等方面為我國科學數據管理和保存提供經驗借鑒。

關鍵詞:社會科學數據;數據保存;社會科學數據檔案館

分類號:G273.2

Investigation and Enlightenment of the Current Situation of Long-term Preservation of Social Science Data

Shan Songyan1,2, Zhang Jing1,2,3, Pan Yanan1,2,3

( 1.Archives of Chinese Academy of Sciences, Beijing 100190; 2.National Science Library, Chinese Academy of Sciences, Beijing 100190; 3.Department of Information Resources Management, School of Economics and Management, University of Chinese Academy of Sciences, Beijing 100190 )

Abstract: Social science data is an essential basic element in social science research, and its long-term preservation is of great significance. Through the network and literature research to sort out the key issues of long-term preservation of social science data, domestic and foreign social science data management policies, long-term preservation research progress, and the summary of the practical experience of foreign social science data archives, this paper aims to provide experience for China’s scientific data management and preservation institutions in terms of promoting centralized management, strengthening top-level design, attaching importance to appraisal, and carrying out cooperation.

Keywords: Social Science Data; Data Preservation; Social Science Data Archives

科學數據是科技創新發展的重要基礎性戰略資源,是科學研究中必不可少的基礎要素,也是科學研究的牽引力。社會科學數據通常是從社會研究方法或行政記錄的數字文件中產生的統計數據[1],是廣義范疇科學數據的重要構成,在人文社科的實證研究中具有重要價值和決定性意義[2]。為了保障社會科學數據的持續可獲取性和可用性,社會科學數據長期保存工作已成為支持人文社科研究不可或缺的一部分。

國內外針對社會科學數據長期保存的研究主要聚焦于三個方面:一是對社會科學數據長期保存工作的經驗總結與分享。耿志杰等[3]、 Brvar等[4]分別介紹了荷蘭數據歸檔網絡服務中心(Data Archiving and Networked Services, DANS)和斯洛文尼亞社會科學數據檔案館(Slovenian Social Science Data Archives,ADP)的社會科學數據長期保存工作實踐經驗。二是對社會科學數據長期保存組織活動的研究。歐洲社會科學數據檔案委員會(Consortium of European Social Science Data Archives,CESSDA)[5]、美國政治與社會研究校際數據知識庫聯盟(Inter-university Consortium for Political and Social Research,ICPSR)[6]等組織機構發布相關指南從鑒定、存儲、保存技術策略、元數據、格式等方面提出社會科學數據長期保存建議。三是對社會科學數據檔案館長期可持續發展方面的研究。Palaiologk等[7]開發了基于活動的成本計算模型,研究數字存儲庫在經濟方面的可持續性。Eschenfelder等[8]利用組織研究理論分析社會科學數據檔案館在業務模式方面的長期可持續問題。

社會科學數據長期保存是一個綜合性問題,不僅要考慮數字保存及管理的標準、策略、工具的開發和實施,還要綜合考慮業務模式、活動成本等影響,以便更好地實現長期可持續性發展。

1 社會科學數據長期保存關鍵問題

隨著社會科學數據的收集和積累,社會科學數據長期保存問題也愈發受到重視。開展家庭及社會生活、健康與養老、社會態度等方面的調查研究時,必須要長期縱貫調查,積累國家社會變遷的數據,才能獲得規律性認識。比如美國著名的“國民收入動態追蹤研究”(Panel Study of Income Dynamics, PSID) [9]使用了1968年以來的超過50年的數據。

雖然從比特的層面上看,數字信息之間沒有區別,數字資源長期保存技術可以為社會科學數據長期保存提供借鑒,但社會科學數據不僅具有大數據特點,還具有獨特科學內涵,因此其面臨著獨特的長期保存要求。本文參考數字保存聯盟(Digital Preservation Coalition,DPC)的數字保存手冊[10],結合社會科學數據特點,分析社會科學數據長期保存在機構戰略、組織活動和技術解決方案三個層面涉及的關鍵問題。

1.1 制定健全的長期保存機構戰略

長期保存機構戰略是為解決長期保存問題而制定的具有共識性和需要遵守的文件,包括機構政策、合作模式、審核和認證、依法依規、風險管理、標準和最佳實踐等內容。而社會科學數據在審核和認證、依法依規方面有著更嚴格的要求。

(1)審核和認證要求

社會科學研究需要對長期、跨領域數據對比分析,因此對數據真實性和完整性有著較高要求。為了更好地解決存儲過程中數據易篡改、易損壞、解碼不正確等問題,維護數據的真實、完整、可用和安全,不僅需要保存機構制定合理的管理制度,基于最佳實踐開展工作,同時也需要通過審計和認證來增加機構可信度。

(2)依法依規要求

社會科學數據是社會科學研究形成的原創成果,天然具有知識產權屬性。對于社會科學數據保存機構來說應在保存前確認版權所有者和訪問范圍,獲取備份數據、訪問數據和處置不可讀數據的許可,在保存好數據的同時做好版權保護。

1.2 全生命周期的組織活動實踐

組織活動是長期保存工作實踐中涉及的環節,包括形成、選擇和鑒定、存儲和備份、保存技術策略、利用、元數據方案等。對于社會科學數據來說,形成和存儲備份方面具有更大的挑戰。

(1)形成階段要求

社會科學研究會形成文本、照片、音視頻等多種格式的社會科學數據,為便于管理和使用需要以精確的方式組織和存儲。在社會科學數據形成階段就設計存儲結構、撰寫說明文件、選擇保存格式、制定元數據方案,可以有效提高數據的可用性、完整性和數據質量。

(2)存儲可持續要求

隨著社會科學數據的日益增長,在存儲和備份海量數據方面面臨著巨大壓力,需要從管理體系、工作流程、保障機制和鑒定等方面充分考慮社會科學數據長期保存可持續發展要求。

1.3 技術解決方案和實際部署

技術解決方案是從計算機技術角度保障長期保存文件真實、完整、可用和安全,包括校驗和、文件格式、信息安全、永久標識符等。對于社會科學數據來說,文件格式和信息安全等方面會有更多的需求。

(1)格式長期可用性要求

社會科學數據格式多樣,為了預防數據在未來出現不可讀的問題,需要保障格式具有長期可用性。一方面可以提出適合長期保存的存儲格式,對不符合通用格式要求或格式即將過時的社會科學數據進行格式遷移,對無法遷移的社會科學數據進行數據生成與應用環境的仿真;另一方面也需要強化社會科學數據存儲格式的學科通用性和交互性,保障不同機構社會科學數據方便共享利用。

(2)信息安全要求

社會科學數據涉及個人敏感信息,如參與者姓名、地址、電話號碼等。這些社會科學數據在保存過程中需要防止敏感信息泄露和丟失,維護數據安全。

整體來看,科學數據的價值發揮與共享利用要求科學數據長期保存在管理上堅持集中統一、全生命周期管理的基本原則;從具體實施上,需要統一技術標準、強化數據通用可交互、多舉措保障長期保存,最終實現可持續發展。

2 社會科學數據長期保存實踐調研

本文調研了英國、芬蘭、美國、中國等9個社會科學數據檔案館的政策文件、工作進展報道、門戶網站和CoreTrustSeal評估報告,以DPC數字保存手冊為分析框架,梳理了社會科學數據檔案館長期保存實踐現狀(見表1),以為我國科學數據長期保存,尤其是社會科學數據長期保存提供借鑒參考。整體來看,社會科學數據長期保存實踐具有一定的地域差異,歐美地區比亞洲地區更成熟和完善。從國內外社會科學數據檔案館實踐來看,社會科學數據長期保存具有以下四個方面的特點:

2.1 形成了較為統一的最佳實踐

社會科學數據長期保存在國際上已經形成了較為統一的最佳實踐。從表1可以看出,社會科學數據檔案館多采取CoreTrustSeal認證可信存儲庫資質,采用數據文件倡議(DDI)元數據方案和開放式檔案信息系統(OAIS)模型作為參考標準和最佳實踐,采取多副本異質存儲,將文件格式遷移和介質更新作為保存技術策略,通過控制訪問權限、隱藏敏感信息保障信息安全,并使用數字對象標識符(DOI)作為永久標識符。

2.2 重視頂層設計

社會科學數據檔案館普遍會制發機構保存政策,說明保存目標、角色責任、財務可持續性等管理要求,也會包括標準和最佳實踐、保存技術策略和信息安全等實踐要求。如英國數據檔案館(UK Data Archive,UKDA)發布的保存政策[11]包含政策適用范圍、要求、角色和責任、模型、保存規劃和戰略、It架構、安全、合作、供資和資源規劃等。芬蘭社會科學數據檔案館(Finnish Social Science Data Archive,FSD)也發布了記錄管理和檔案形成計劃[12],政治與社會研究校際數據知識庫聯盟發布了數字保存政策框架[13],數據歸檔和網絡服務中心發布了保存計劃[14]。

2.3 多來源構建標準規范體系

社會科學數據檔案館所采用的標準規范一般有三種來源:本機構制發標準規范、采用合作機構標準規范、引用其他機構標準規范。本機構制發標準規范,如芬蘭社會科學數據檔案館制定了數據采集和選擇標準、推薦格式列表[15];澳大利亞數據檔案館(Australian Data Archive,ADA)制定了ADA收集策略、首選文件格式[16];數據歸檔和網絡服務中心制定了科學數據鑒定和選擇準則、首選文件格式[17]。英國數據檔案館則是采取了合作伙伴英國數據服務數據中心(UK Data Service,UKDS)發布的《館藏發展策略》《館藏發展的選擇和評估標準》和科學數據保存推薦格式[18]作為參照標準。引用其他機構標準規范,如政治與社會研究校際數據知識庫聯盟推薦使用國會圖書館的“推薦格式規范”。

2.4 開展多種形式合作實現優勢互補

對于社會科學數據來說,無論是歸檔、長期保存還是共享利用,都不是某一社會科學數據檔案館關起門來就能做好的工作。目前,社會科學數據檔案館有多種合作方式。第一,社會科學數據檔案館負責長期保存,合作的數據中心提供利用等服務。如英國數據檔案館負責長期保存社會科學數據,通過英國數據服務數據中心歸檔、檢索和訪問,雙方在文件格式、館藏選擇等標準規范上相互參考。第二,社會科學數據檔案館提供歸檔和利用等服務,委托第三方提供技術支持。如澳大利亞國家計算基礎架構(National Computational Infrastructure,NCI)根據澳大利亞數據檔案館的需求提供在線數據服務和網絡基礎設施,使澳大利亞數據檔案館可以提供數據存儲和在線利用。第三,社會科學數據檔案館成立合作組織,分享數據、技術方法等。如歐洲20多個國家級的社會科學數據檔案館共同成立了歐洲社會科學數據檔案委員會;韓國社會科學數據檔案館、日本社會研究和數據檔案中心、中國學術調查研究資料庫和中國學術調查數據資料庫組成了亞洲社會科學數據檔案網絡(Network of Asian Social Science Data Archives,NASSDA)。

目前我國已經認識到科學數據的重要性,科學數據中心管理體系構建獲得突飛猛進的進展[19-20],檔案部門也在不斷探索科學數據與科研檔案協同管理[21],但同時我們也應該看到我國不管是社會科學數據,還是自然科學數據,都主要受重大項目資助,重點保存依托單位科研項目產生的科學數據,以共享利用為重點,覆蓋的科學數據范圍相對有限,長期保存基礎弱。

3 對我國科學數據長期保存的啟示

從以上分析可以看出,我國應當積極學習歐美地區的社會科學數據長期保存經驗,進一步加強集中統一管理、機構政策制定、數據選擇和鑒定、多樣化機構合作等方面的工作,以進一步提升我國科學數據長期保存能力。

3.1 借鑒已有最佳實踐集中管理長期保存科學數據

國外社會科學數據多采取集中式長期保存。如英國數據檔案館負責長期保存來自政府部門、研究機構和研究人員、公共和商業組織的關于社會、經濟和人口的科學數據;芬蘭社會科學數據檔案館負責長期保存關于芬蘭社會、人口和文化的科學數據。通過集中管理社會科學數據,可以對館藏數據整理和匯編,提高數據利用率、提升數據質量。集中式長期保存有利于減少軟硬件環境等重復配置,有利于加強數據關聯分析與共享利用,因此我國需要從國家層面設立國家科學數據存儲平臺,統籌已有的科學數據管理和存儲機構,促進數據積累、共享和利用,減少數據重復性建設,支持數據深度挖掘,更好支撐相關研究工作。

3.2 明確要求制定科學數據長期保存機構政策

科學數據長期保存是項系統工程,既涉及政策、制度、標準等管理問題,也涉及存儲和備份的選擇,更新、遷移、仿真、封裝等保存技術策略的選擇。當前在社會科學數據長期保存方面已經有了一定的理論基礎和實踐經驗,但不同的機構有不同的現實情況和保存需求,如何結合自身館藏特點、保存需求以及人財物情況等制定最合適的保存策略尤為重要。如英國數據檔案館借鑒OAIS參考模型、以開放和可用的文件格式、數據遷移和介質更新為基礎,結合工作實際制定保存政策[22],主要包含社會科學數據的選擇、接收、保存、數據管理、提供利用等方面。政策為更好地實現社會科學數據長期保存的標準規范要求、最佳實踐、信息安全和可用資源方面提供指導。因此,我國科學數據保存機構在開展長期保存工作時,應將制定機構長期保存政策作為第一步,在國家統一要求框架下規范組織活動、設計技術解決方案,保障科學數據長期、安全、可靠地保存。

3.3 實施科學數據鑒定

科學數據并不都具有長期保存價值,且考慮到長期的效益和成本問題,不經選擇地保存數據從長遠來看將會產生巨大的可持續壓力,實施數據鑒定是必要的。國外的檔案機構、保存機構和數據中心都積極發布數據鑒定標準。如英國數據服務數據中心要求從“相關性、科學或歷史價值、新資源或新類型的數據、國際價值、唯一性/丟失風險、可用性/再分配/運營效益、數據和資源的可復制性”這七個方面鑒定和選擇社會科學數據。澳大利亞數據檔案館在館藏策略中則規定了數據集的主題范圍、應具有二次分析潛力、按樣本人口選擇數據集。美國政治與社會研究校際數據知識庫聯盟則是從學科、數據生成技術和涵蓋人群三個方面劃定數據選擇范圍,同時也對政府數據和優先選擇數據提出要求。但在我國科學數據長期保存工作中,鑒定往往是被忽視的問題。科學數據保存機構需要結合數據類型、形成特點和利用需求等,明確科學數據鑒定標準和工作流程,并定期對保存數據進行重新評估和處置。

3.4 加強機構間多樣化合作

國外社會科學數據保存機構之間的多種合作模式,能有效提升社會科學數據管理效能。因此我國科學數據保存機構也應在分析本機構和相關機構優劣勢的基礎上,開展多樣化合作,實現優勢互補。一是應加強科學數據中心和檔案部門等科學數據管理部門之間的合作,充分發揮科學數據中心的技術優勢和檔案部門在收集、鑒定等方面的建制化優勢;二是應加強科學數據形成部門和科學數據管理部門之間的合作,進一步完善科學數據長期保存工作流程,落實各方職責;三是建立更廣泛的科學數據保存聯盟,不斷提升國家層面科學數據保存標準規范和實踐方案的規范化、體系化程度,促進科學數據跨領域、跨學科、跨管理主體的共享利用。

4 結 語

數據密集型科研范式興起,科學數據在科學研究中的重要性日益凸顯。社會科學數據在國際上已經形成了相對統一的長期保存標準、最佳實踐,對我國開展科學數據長期保存具有一定的借鑒意義。我國科學數據長期保存在未來發展中也應當促進集中管理、制定保存政策加強頂層設計、完善標準規范要求開展數據鑒定,加強機構間多樣化合作,不斷提升科學數據長期保存能力,促進科學數據共享利用和價值發揮。

*本文系國家檔案局科技項目“檔案視角下科學數據長期保存策略與實證研究”(項目編號:2021-R-31)階段性研究成果。

作者貢獻說明

單嵩巖:查找資料,起草論文初稿;張靜:修改論文;潘亞男:審改定稿。

注釋與參考文獻

[1]ICpSR. Glossary of Social Science terms. [EB/ OL]. [2021-03-10]. https://www.icpsr.umich.edu/ web/ICpSR/cms/2042.

[2]蔣穎. 歐洲社會科學數據的服務與共享[J].國外社會科學, 2008(5):84-89.

[3]耿志杰,陳佳慧.荷蘭數據歸檔和網絡服務中心的科學數據長期保存機制[J].圖書館論壇, 2021(11):128-135.

[4]Irena Vipavc Brvar; Janez tebe. Analysis of current situation and perspective of digital preservation in the Social Science Data Archives (ADp)[J]. Knjinica Revija Za podroje Bibliotekarstva in Informacijske Znanosti,2011(1):185-197.

[5]CESSDA. Data Management Expert Guide. [EB/ OL]. [2021-03-02]. https://www.cessda.eu/training/ training-Resources/Library/Data-Management-ExpertGuide/1.-plan/Research-data.

[6]ICpSR. Guide to Social Science Data preparation and Archiving. [EB/OL]. [2021-03-10]. https:// www.icpsr.umich.edu/files/deposit/dataprep.pdf .

[7]palaiologk A S, Economides A A, tjalsma H D, et al. An activity-based costing model for long-term preservation and dissemination of digital research data:the case of DANS[J]. International Journal on Digital Libraries,2012(4):195-214.

[8]Eschenfelder K R, Shankar K. Organizational Resilience in Data Archives: three Case Studies in Social Science Data Archives[J]. Data Science Journal,2017(4).

[9]pSID. the panel Study of Income Dynamics(pSID) is the longest running longitudinal household survey in the world. [EB/OL]. [2023-06-07]. https:// psidonline.isr.umich.edu/default.aspx.

[10]DpC. Digital preservation Handbook. [EB/ OL].[2021-04-01]. https://www.dpconline.org/ handbook/contents.

[11][22]UKDA. Data preservation and trust. [EB/ OL]. [2021-03-16]. https://www.data-archive.ac.uk/ managing-data/data-preservation-and-trust/.

[12][15]FSD. Documents. [EB/OL]. [2021-03-02]. https://www.fsd.tuni.fi/en/data-archive/ documents/.

[13]ICpSR. Digital preservation policies and planning at ICpSR. [EB/OL]. [2021-03-10]. https:// www.icpsr.umich.edu/web/pages/datamanagement/ preservation/policies/index.html.

[14][17]DANS. preservation plan of EASY.[EB/OL]. [2023-06-19]. https://dans.knaw.nl/en/ preservationplan/.

[16]ADA. ADA Self-Deposit process Overview.[EB/OL]. [2021-04-20]. https://docs.ada.edu.au/ index.php/Main_page#ADA_Collection_policy_Criteria_ Assessment.

[18]UKDA. Deposit data. [EB/OL]. [2021-03-16]. https://www.data-archive.ac.uk/deposit/.

[19]虞香群. 《科學技術研究檔案管理規定》修訂內容及相關問題的探討[J].山西檔案,2021(3):47-53.

[20]賈歡,李澤鋒,劉越男. 多學科科學數據倉儲元數據方案比較研究[J]. 檔案管理,2022(4):61-64.

[21]孔祥盛. 匯交政策視角下科學數據與科研檔案協同管理困境與反思[J]. 檔案與建設,2023(1):62-66.

(責任編輯:邵澍赟)

主站蜘蛛池模板: 久久午夜夜伦鲁鲁片无码免费 | 日本a级免费| 99re视频在线| 四虎成人精品| 日本草草视频在线观看| 亚洲中文精品久久久久久不卡| a国产精品| 秋霞国产在线| 毛片一区二区在线看| 亚洲精品无码不卡在线播放| 国产中文一区二区苍井空| 亚洲精品无码av中文字幕| 中日韩一区二区三区中文免费视频| 成人免费网站久久久| 中国成人在线视频| 欧美日韩精品一区二区视频| 91黄视频在线观看| 日韩精品无码一级毛片免费| 孕妇高潮太爽了在线观看免费| 国产日本欧美在线观看| 国产91麻豆免费观看| 午夜三级在线| 婷婷六月综合网| 国产正在播放| 精品无码人妻一区二区| 国产三级毛片| 日本午夜三级| 一级全免费视频播放| 美女无遮挡免费视频网站| 亚洲欧美一区二区三区蜜芽| 亚洲三级视频在线观看| 一级毛片免费观看不卡视频| 亚洲第一视频网站| 人与鲁专区| 伊人久久福利中文字幕| 久久先锋资源| 久久精品国产999大香线焦| 国产va视频| 99久久精品国产自免费| 国产精品视频第一专区| 丁香婷婷激情网| 久久久久国产精品熟女影院| 日本免费高清一区| 91精品综合| 91精品伊人久久大香线蕉| 色婷婷久久| 亚洲丝袜第一页| 国产精品综合久久久| 亚洲va在线观看| 欧美成人A视频| 午夜国产精品视频| 天天躁夜夜躁狠狠躁躁88| 1769国产精品免费视频| jizz国产在线| 国产精品福利导航| 色视频久久| 国产91av在线| 4虎影视国产在线观看精品| 国产人成在线观看| 综合亚洲网| 欧美日韩专区| 久久精品亚洲热综合一区二区| 国产高清免费午夜在线视频| 天堂网国产| 国产99在线观看| 欧美在线国产| 国产在线97| 极品性荡少妇一区二区色欲| 国产亚洲欧美在线视频| 亚洲av日韩av制服丝袜| 国产欧美日韩视频怡春院| 青青热久免费精品视频6| 国产永久在线视频| 成人在线天堂| 国产网站免费| 国产精品思思热在线| 青青热久麻豆精品视频在线观看| 超清无码一区二区三区| 亚洲综合二区| 欧美日韩精品在线播放| 午夜限制老子影院888| 国产精品黑色丝袜的老师|