羅敏 姜鑫


摘要:隨著開放獲取運動的不斷深入發展,檔案機構陸續加入開放數據的陣營中并迅速發展。通過對國外檔案館數據開放獲取政策的考察分析,探討如何在保護個人隱私的前提下促進檔案館開展開放獲取運動,有助于發揮檔案數據開放獲取的社會價值和經濟效益,并為完善我國檔案館數據開放政策提供參考性建議。因此,文章研究使用內容分析法,在調研國外檔案館制定和執行的有關個人數據開放獲取政策基礎上,結合各國已有的數據保護法,從數據存儲規范、數據重用規范和數據權益規范著手,針對檔案數據開放獲取政策中開放個人數據的規定進行了研究解讀。最終提出國外檔案館數據開放政策中對個人數據保護的規定較為成熟,我國在豐富的檔案數據開放理論研究和實踐中,應盡快完善開放獲取頂層設計,加強個人數據保護制度建構,搭建開放數據平臺,實現資源共享。
關鍵詞:科學數據;開放獲取;檔案館;個人數據;隱私保護
分類號:G275
Research on the Open Access Policies of Personal Data in Archives in the Context of Open Scientific Data
Luo Min1,Jiang Xin2
(1. College of Information Management of Heilongjiang University, Harbin, Heilongjiang, 150080; 2. Research Center of Information Resources Management of Heilongjiang University, Harbin, Heilongjiang, 150080)
Abstract:With the continuous development of the open access movement, the archives have been promoted to join the open- data camp and develop rapidly. Through the investigation and analysis of the open access policy of data in foreign archives, we can explore how to promote the open access movement of archives under the premise of protecting personal privacy. Give full play to the social value and economic benefits of open access to archival data, and provide reference suggestions for perfecting the open access policy of data in archives in China. Therefore, this paper uses content analysis method on the basis of the policy on open access to personal data developed and implemented by foreign archives, and in combination with the data protection laws already in place in various countries, the research and interpretation of the provisions of open personal data in the open access policy of archives data should be carried out from the basis of data storage norms, data reuse norms and data rights and interests norms. Finally, this paper puts forward to that the provisions on personal data protection in the data opening policy of foreign archives are more mature, and in the rich research and practice of open data in archives, we should improve the top-level design of open access as soon as possible, strengthen the construction of the personal data protection system, and set up an open data platform to realize the sharing of resources.
Keywords:Scientific Data; Open Access; Archives; Personal Data; Privacy Protection
在科學數據開放共享的大環境下,數據已成為國家基礎性戰略資源,為開展科研活動和促進社會創新發展帶來更多的機會。以歐美為代表的眾多國家都已制定了推動科學數據開放獲取的政策。如歐盟于2014年發布“地平線2020計劃”,要求所支持科研項目的研究成果、研究報告和科學數據都必須開放獲取,確保研究結果的公開和透明;2018年9月歐洲科研資助機構聯盟發布“開放獲取S計劃”,闡述了未來科學數據開放獲取的基本原則[1]。我國國務院于2018年頒布《科學數據管理辦法》,明確了科學數據從采集、匯交、保存到共享利用等規定。然而,數據量的增長和信息技術的快速發展使科學數據開放獲取面臨許多實際問題。
作為提供公共服務的數據中心,檔案機構存儲著大量且密集的數據,是推動數據開放的核心力量,但由于檔案的特殊性,側重“保密”的責任定位在一定程度上阻礙了檔案館有效開展數據開放運動。為解決這一問題,美國國家檔案與記錄管理局發布《2018—2022戰略計劃》,提出讓公眾公開獲取聯邦政府記錄來提高透明度、培養公眾參與以及加強民主[2];新西蘭檔案館頒布的《2057戰略》提出三個戰略領域,其中之一是堅持信息公開透明以支持開放政府行動[3]。此外,考慮到檔案館密集的館藏資源可能包含個人隱私數據,在開放獲取過程中難免與隱私保護產生沖突,要明確數據開放并不是無限制的開放,還需對可能帶來潛在影響的矛盾進行關注和研究。即如何在開放數據的背景下協調好數據開放工作和個人數據保護問題是當前各國檔案機構需盡快解決的問題。
研究采用內容分析法,通過調研國外檔案館網站開放獲取數據政策,從數據存儲規范、數據重用規范、數據權益規范三個方面著手,針對政策文本內容進行深入分析,并提煉評述性的說明。
國外檔案館大部分已經頒布了關于個人數據歸檔管理及開放獲取數據的政策,或者遵循本國信息委員會發布了數據管理文件(見表1)。在已有的數據保護法下各國更加重視開放數據過程中個人數據的保護。筆者對國外檔案館在開放科學數據背景下開放個人數據的政策規定進行研究,探討如何在保護個人隱私的前提下充分實現檔案數據開放獲取的社會價值,創造經濟效益,以促進檔案館開放數據運動的發展,并確保數據使用者和數據主體間的利益雙向平衡,從而為我國檔案館數據開放政策制定和完善提供參考。
國外檔案館頒布的數據開放政策旨在通過指導檔案部門正確處理包含個人數據的檔案資源以平衡開放獲取與個人隱私安全之間存在的緊張關系。自檔案移交進館時起,檔案管理人員首先根據價值鑒定判定是否長期保存,同時規范數據存儲格式和標準,以確保數據質量和數據可用性;其次,在數據開放利用階段,需要明確受到豁免或限制的特殊情況,在發揮開放數據價值時保護利益主體的權益。基于此,筆者就搜集的政策文本進行內容分析,分別論述個人數據的存儲規范、重用規范和權益規范,并總結個人數據歸檔工作依據各國不斷修正更新的數據保護法所做出的調整。

2.1個人數據存儲規范
(1)數據存儲格式及標準
檔案管理工作中,數據格式和標準規范性對推進數據開放和個人數據保護起著重要作用。開放數據常常可能因為數據標準或格式的不一致直接影響數據的獲取和利用,對此,美國數據門戶網站Data.gov和英國Data.gov.uk的開放數據集均以統一的數據標準和通用數據格式發布在國家級的政府數據開放平臺[12],俄羅斯聯邦檔案署推行的指標則要求以RDF格式開放數據集[13]。
進入信息時代以來,為適應信息技術發展環境,電子數據和電子文件的歸檔標準也有了新的要求。美國國家檔案與記錄管理局發布的《2018—2022年度戰略計劃》提出,NARA正致力于以“開放政府”原則為基礎實現轉型,引領電子文件和電子檔案的管理實踐[14],并提出在現代化的電子檔案存檔2.0信息系統中開發處理電子檔案記錄的新應用。
(2)數據存儲原則
檔案需要經過價值鑒定來決定是否長期保存,這樣有利于緩解數據保護和利益獲取之間的沖突,保障具有持久價值的數據歸檔以及提高檔案質量和減少檔案館后期重新整理數據的成本。歸檔的目的在于確保和維護數據處于可用狀態,為公共利益服務。所以在考慮永久保存個人資料時,應考慮其在多大程度上促進了公共利益,特別是研究人員用于科學研究方面的作用。事實上,具有永久保存價值的數據量很少,根據維基百科顯示,在美國聯邦機構開展政府業務過程中創建或接收的所有記錄,大約只有1%至3%被認為具有永久保存價值并轉移到國家檔案館永久保存和查閱[15]。
數據的存檔和管理遵循最小化原則,即根據處理目的將所收集、處理的個人數據限制在必要的內容上,使接觸數據的工作人員控制在最小可行范圍內。特定條件下應該設立個人數據保護信息專員,授予更多權利來維護個人利益,包括賦予調查權、追責權及處罰權。
2.2個人數據重用規范
(1)科學數據研究豁免
數據保護法中對科學數據研究豁免做出相關的說明,指出存檔需要符合公共利益。《通用數據保護條例》提到,擁有公共利益記錄的政府當局或私人機構,應根據聯邦或成員國法律,為一般公共利益提供獲取、保存、評估、整理、描述、交流、推廣、傳播和訪問持久公共價值記錄的服務[16]。以公共利益為目的的數據重用允許機構在不經同意的情況下處理個人數據,不受目的限制的約束,比如用于統計、科學和歷史的研究、言論和信息自由的處理,但是仍應實施適當的保障措施,保障數據主體的權益和自由,尊重數據保護的本質,盡量減少不利影響。
(2)隱私影響評估
披露檔案個人數據之前還應進行隱私影響評估(Privacy Impact Assessments,PIA),結合數據的性質、數據主體年齡和背景等因素,考慮重用是否會對數據主體造成經濟、生理或精神層面的持續性損害。美國國家檔案館的隱私政策指出,PIA用于分析如何收集、存儲、保護、共享和管理個人身份信息,其目的是證明系統所有者和開發人員在系統的整個生命周期中都有意識地考慮到了隱私保護[17]。澳大利亞信息委員會于2014年發布《隱私影響評估指南》[18],說明了隱私影響評估的過程。英國內閣辦公室在2012年發布《開放數據白皮書:釋放數據潛力》,提出在數據開放過程中進行隱私影響評估[19]。
2.3個人數據權益規范
(1)數據主體權益
數據保護法強調數據主體對個人數據感知和控制的重要性,給予公民更多的個人數據控制權,即數據主體的知情同意權、擦除權、更正權等,認為數據主體有權知道自己的數據為什么被收集、有什么用途、是否正在被處理以及申請擦除或修改不當的個人數據,但是在可能損害公共利益實現的情形下,這些權利則不適用。
當數據發布、重用和訪問時,為確保所披露的信息在任何情況下都不能指向特定的主體,可以采取匿名化處理,即刪除可識別出數據主體的標識符,使數據主體不能從特定文檔的信息中被識別出來。在結構化的數據集中,可以通過刪除記錄級別的標識符實現,使其指向特定的集合而非單獨的個體,如指向整個地理區域中的全部個體。
(2)數據使用者權益

原始記錄性是檔案的本質屬性,所體現出來的憑證價值使其區別于并優于其他資料[20]。為了讓檔案使用者能有效地利用檔案數據,數據歸檔之前的收集工作應該以明確的目的,保證其合法性、公正性和透明性。所有新收集的檔案,無論是數字檔案還是紙質檔案,都應酌情進行風險評估和抽樣,以確定這些檔案是否包括法律規定的個人數據,保障數據來源的可靠,以及數據本身的真實、完整和可用性。
作為檔案保存的個人數據并不需要實時更新,最重要的是展現歷史的完整性,而非當前的準確性,在更正時可以通過補充語句來保證原始數據的完整。
新形勢下個人數據歸檔工作更加注重對個人數據的隱私保護,經考察分析,國外檔案館數據開放政策在不斷更新的數據保護法下相應地進行了一些調整:第一,強調數據主體對個人數據的控制權,如知情同意權、擦除權、更正權等;第二,要求設置數據保護官、數據保護專員,對個人進行大規模、定期和系統的監測;第三,通知數據主體個人數據泄露情況;第四,對申請獲取個人數據的檔案服務請求進行隱私影響評估;第五,聲明用于科學歷史研究的個人數據處理豁免;第六,任何可能造成數據主體經濟損失或人身傷害的處理,都必須有適當的保障措施以維護數據主體的權益。綜上所述,考慮我國目前檔案館開放數據發展實際情況,筆者對國外檔案館開放數據政策內容要點進行了梳理(如表2所示)。
檔案館作為科學數據的管理者,支持和推動科學數據開放共享運動[21]。在我國豐富的檔案理論研究與實踐的基礎上,科學數據開放獲取是時代的新要求和事業的新發展,檔案館確立自己的行業標準不僅是響應國家數據開放政策,也是適應數據開放環境變化的必經之路。
4.1完善頂層設計,平衡檔案管理工作與開放共享需求
檔案館是收集、保管檔案的機構,其一貫的嚴謹作風與開放共享的大環境有著不可避免的沖突和矛盾,隨著開放獲取運動的推行,檔案館應根據實際情況開展檔案管理工作,將開放獲取更好地融入日常管理之中,避免固步自封。其中政策的支持和指導是平衡檔案管理工作有效開展和推進開放獲取運動持續健康發展的關鍵,在開放獲取環境下能夠有效引領檔案數據開放實踐。從國家層面完善政策細節,為檔案工作提供可靠的支撐,進一步促進國家檔案數據開放的有序進行,建立具有中國特色的檔案數據開放獲取政策體系[22]。
4.2推動制定專門的個人數據保護法
個人隱私需要法律的強制執行力來維護,英國、美國、德國、澳大利亞等多個國家已經制定和頒布了個人數據保護法律,成為各國相關法律的標桿。雖然我國的許多行政法規包含保護個人隱私的規定,但是太過分散,仍需一部基礎性的法規適用于不同場景下的個人隱私保護。2019年12月20日在全國人大常委會法工委的第三次記者會上,發言人岳仲明表示中國將于2020年制定個人信息保護法、數據安全法等[23]。此外,檔案個人數據主體的權益、檔案保管者的責任、檔案使用者利用檔案的權利應當同保護隱私的義務相協調[24],將檔案開放利用環節中所涉及的關鍵各方納入隱私保護法制定的考慮因素。
4.3加強檔案館開放數據建設
隨著大數據的縱深發展,檔案工作逐步從傳統檔案管理走向新時代檔案數據管理[25],數據與檔案服務間的結合引起越來越多的關注,其中個人數據保護問題、檔案管理技術變革問題、開放數據下政府對檔案工作的執法問題等較為突出,且人們獲取信息的渠道越來越多樣,檔案館需要開辟更多的途徑讓公民接觸檔案[26]。將開放數據融入檔案工作,建立檔案館開放數據共享平臺,不僅能夠為檔案館數據服務提供更為便捷的獲取途徑,也可以通過檔案工作進一步促進數據開放。檔案館開放數據建設使檔案管理工作更好地適應新時代數據服務要求,實現開放數據價值,推動社會發展與進步。
社會的數字化變革使傳播和獲取海量數據成為可能,與此同時,人們呼吁保護他們的個人隱私。在大數據技術的發展和支持下,我國檔案資源的開放利用有序展開,而檔案利用和隱私權保護兩者之間存在不可忽視的沖突,檔案機構和檔案工作者需要做出相應改變以應對這一挑戰。為實現檔案數據開放獲取的穩定推進以及適應科學數據開放環境的要求,我國應結合社會發展的實際情況,做好開放獲取的個人數據保護制度建構,加強檔案人員數據管理能力和電子檔案利用管理工作,完善檔案數據開放獲取頂層設計,保障檔案數據的準確性和持續可用狀態,以平衡檔案有效利用和個人數據保護之間的關系,充分發揮檔案數據開放獲取的價值,使檔案數據管理工作和個人數據保護工作在開放環境下日趨規范化和標準化。
*本文系國家社會科學基金項目“科學數據開放政策分析與評估研究”(項目編號:16BTQ060)和黑龍江省高校基本科研業務費專項資金項目“基于政策文本分析的科學數據開放共享政策研究”(項目編號:RWSKCX201922)階段性研究成果。
[1]范昊,王賀.歐洲開放獲取政策及其啟示——以“開放獲取S計劃”為例[J].圖書館學研究,2019(9):37-43+73.
[2]NARA.Strategic Plan 2018—2022[EB/OL].[2020- 02-13].https://www.archives.gov/about/plans- reports/strategic- plan/ strategic-plan-2018-2022#toc-nara-mission-vision-and-values.
[3]Archives New Zealand. Archives 2057 STRATEGY[EB/ OL].[2020-05-18].https://assets.ctfassets.net/etfoy87fj9he/ 3P6g4z4tVLrCzd3L5fYj2F/a30f98886043c7122304303e7e269c1/ archives_2057_-_strategy_english_1.pdf.
[4]The National Archives. Guide to archiving personal data[EB/OL].[2020-05-22].https://www.nationalarchives.gov.uk/documents/information-management/guide-to-archiving-personal-data.pdf.
[5]NARA.Open Data Policy[EB/OL].[2020-01-20].https:// www.archives.gov/data.
[6]OMB. Guidance on Inter-Agency Sharing of Personal Data[EB/OL].[2020-02-10]. https://obamawhitehouse.archives.gov/ omb/memoranda_m01-05.
[7]OMB. Privacy and Personal Information in Federal Records[EB/OL].[2020-02-10]. https://clintonwhitehouse3.archives. gov/OMB/pubpress/privacy.html.
[8]OAIC. Protective Security Policy Framework[EB/OL].[2020- 02- 12].https://www.protectivesecurity.gov.au/sites/default/ files/2019-12/pspf-infosec-08-sensitive-classified-information.pdf.
[9]OAIC. Guide to securing personal information[EB/OL].[2020- 02- 12].https://www.oaic.gov.au/privacy/guidance- and- advice/guide-to-securing-personal-information/.
[10]LAC. Guidelines for information management[EB/OL].[2020-02-13].http://www.bac-lac.gc.ca/eng/services/governmentinformation-resources/guidelines/Pages/introduction.aspx.
[11]Archives New Zealand. guidance on how to determine access levels[EB/OL].[2020-01-21].https://archives.govt.nz/publications/records-containing-personal-information-held-at-archives.
[12]陳展.檔案數據開放推進路徑探略[J].浙江檔案,2019(1):20-22.
[13]肖秋會.俄羅斯聯邦檔案署的開放機制建設與開放數據方案[J].檔案與建設,2017(4):21-23+35.
[14]馬海群.檔案數據開放的發展路徑及政策框架構建研究[J].檔案學通訊,2017(3):50-56.
[15]維基百科.國家檔案和記錄管理局[EB/OL].[2020-01-24].https://wiki.hk.wjbk.site/baike-國家檔案和記錄管理局.
[16]EU. General Data Protection Regulation[EB/OL].[2020-05-25].https://gdpr-info.eu/.
[17]NARA. Privacy Impact Assessments[EB/OL].[2020-05-30].https://www.archives.gov/ privacy/privacy-impact-assessments.
[18]OAIC. Guide to undertaking privacy impact assessments[EB/OL].[2020- 02- 15]. https://www.oaic.gov.au/privacy/guidance- and- advice/guide- to- undertaking- privacy- impact- assessments/#is-a-pia-necessary.
[19]黃如花,劉龍.英國政府數據開放中的個人隱私保護研究[J].圖書館建設,2016(12):47-52.
[20]劉旭光,劉蔚.檔案利用率質疑[J].檔案學通訊,2011(3):98-101.
[21]盛小平,王毅.利益相關者在科學數據開放共享中的責任與作用——基于國際組織科學數據開放共享政策的分析[J].圖書情報工作,2019(17):31-39.
[22]侯衡.中西方檔案開放理論比較研究[J].浙江檔案, 2015(1):13-16.
[23]法工委.全國人大常委會法制工作委員會發言人第三次記者會[EB/OL].[2020-05-20]. http://www.npc.gov.cn/wszb/ wzzb7/wszb_wzsl.shtml.
[24]閆靜.美國檔案開放利用中隱私保護立法經驗及特點分析[J].檔案,2015(10):52-55.
[25]陳雪燕,于英香.從檔案管理走向檔案數據管理:大數據時代下的檔案管理范式轉型[J].山西檔案,2019(5):24-32.
[26]馮惠玲,劉越男,馬林青.文件管理的數字轉型:關鍵要素識別與推進策略分析[J].檔案學通訊,2017(3):4-11.