文·歐陽愛輝 陳玉鳳
檔案數據開放是“檔案機構將收集保存的所有原始數據向公眾開放”[1]。2016年國家檔案局發布的《全國檔案事業發展“十三五”規劃綱要》中就提到了“要制定檔案數據開放計劃,落實數據開放與維護的責任”[2]。2021年出臺的《“十四五”全國檔案事業發展規劃》進一步提出,要“推動檔案全面納入國家大數據戰略……穩步推進開放檔案全文在線查閱”[3]。可見,檔案數據開放共享將成為當前時代的必然趨勢,但各類現代數智技術的應用,也使得個人信息數據泄露的概率大幅度提升,個人隱私受到無限的透視和隱性控制。故而,探討如何在保護個人隱私的前提下充分實現檔案數據開放獲取的社會價值,創造經濟效益,以促進檔案館開放數據運動的發展,無疑是當前我國檔案機構亟需解決的問題。
由于公私數據模糊混雜、數據容易被重新識別、涉及特殊群體等原因,檔案數據開放中個人隱私保護范圍的界定存在較大困難。首先,從數據保存方式的角度分析,隱私數據與公共數據大多混雜儲存在計算機云端中,因而在如此龐大的數據集群中篩選出屬于個人隱私保護的數據極其困難;其次,從數據識別過程出發,檔案數據開放中與個人隱私相關的數據分為兩類:一是可直接和快速地識別確切個體的信息,這一類信息往往被檔案部門采取不開放的保守方式進行保護;二是無法直接識別出確切的個體信息但可與其他信息相結合從而重新識別個體的信息。個人隱私保護范圍界定的復雜之處就在于即使最初階段檔案部門公開的數據中沒有個人隱私或者個人信息已被匿名化,但是通過把這些開放的數據與其他數據相聯系仍能夠重新識別個人,并且人工智能、云計算等技術多是對信息的二次利用,甚至三次、多次利用,往往會通過再識別技術重新識別個體的畫像、鎖定確切的個體,從而嚴重威脅到個人隱私;最后,伴隨著個體掌握著越來越多數據,這種數據被再識別的風險和評估難度將指數式提升。譬如,加拿大一家專門利用爬蟲技術的數據分析公司hiQLab,其充分利用大數據技術的運作機制,通過爬蟲技術和數據挖掘技術將毫無關聯的分散數據進行“二次加工和集成”,將碎片化的靜態單元數據通過時空整合的信息拼圖,形成網狀化的動態模塊數據。由此這些不觸及隱私的數據碎片經過疊加,便可以輕易追溯個人生活全貌,對個人隱私造成很大威脅。
一方面,在當前數智時代,檔案數據以及其所依賴的載體工具存在可分離性是檔案數據區別于其他傳統檔案信息的一大特征,即檔案數據的相關內容能夠采用人工智能等技術手段從最初的載體中分離開來,并通過后續的復制、修改、處理等方式載入到新的載體中。而在檔案數據開放過程中,會有檔案部門對其進行歸類整理并對外開放,檔案數據開放后,檔案數據利用者也往往為了不同的目的參與到其中對檔案數據進行修改、整理并再次傳播,故而使得檔案數據被轉載、復制、流轉,導致參與整個過程的主體數量多、權責不清晰,難以確定侵權主體,造成侵權責任認定難。
另一方面,盡管數智技術使檔案數據在整理、開放的效率得到了迅速提高,而這類技術如人工智能的廣泛應用,又導致檔案數據管理系統自身暴露出諸多缺陷,技術環節也存在不穩定和不安全的問題,故而極易造成檔案數據被修改、丟失等風險。然而當前人工智能主體地位并不明晰,其法律責任也尚不明確,導致侵權責任的認定程序復雜。同時,第三方利用主體在二次增值處理過程中廣泛應用區塊鏈、云計算等技術,而在區塊鏈技術中,其中心化的架構特征,中心化的隱私侵權自然人并不存在,如何認定侵權主體,至今仍是困擾理論界和實務界的難題,導致個人隱私保護責任難以明確[4]。
從法律層面看,我國2021年頒布的《數據安全法》《個人信息保護法》是與個人隱私保護較為密切的法律,體現了國家對數據及個人隱私保護問題的重視,但涉及檔案數據開放中隱私保護的內容極少,這導致相關個人隱私保護具體實現起來非常困難。譬如檔案部門在《數據安全法》中的地位,既未得到數據管理部門的認可,也未被檔案部門充分認識。盡管《檔案法》第27條對近年來個人信息泄露等突出問題,強調“利用檔案涉及……個人信息的,應當遵守有關法律、行政法規的規定”,將檔案利用中的個人信息保護提升到法律層面。《個人信息保護法》作為個人隱私保護的主要法律,只在附則第72條中簡單規定“法律對各級人民政府及其有關部門組織實施的統計、檔案管理活動中的個人信息處理有規定的,適用其規定”。這種法律彼此的簡單“相互引用”,進一步導致檔案數據開放中的個人隱私保護無所適從。
從技術能力層面看,技術安全隱患與技術能力不足加劇了檔案數據開放中個人隱私保護的實現難度。技術發展使得檔案數據收集更為便捷、檔案數據傳播更加快速、檔案數據的利用方式和利用主體更為復雜,這令檔案數據開放中侵犯個人隱私風險極大的提高。同時,商業利益的誘惑也不免會導致檔案數據利用者見利忘義、借助大數據技術源源不斷地悄悄采集、存儲和循環再利用數據,忽視對個體權利的普遍尊重和保護。在反復挖掘和多次利用中,檔案個人數據及隱私難免脫離可控范圍,導致身份信息和個人隱私慢慢掌握到技術官僚、網絡巨頭公司手中,讓不法分子有機可乘。而民眾對此要么不知情,要么即便知情或感受到各類數智技術帶來的權利弱化下的安全危機,也無能為力。
針對上述檔案數據開放中的個人隱私保護面臨的困境,筆者主張,應主要基于制度、組織、技術和素養四個層面促成個人隱私保護的具體完善路徑。
首先,在法律制定上。社會總是不斷變化發展的,現行法律不可避免的存在滯后性,然而我們可以通過不斷完善法律,使之具有更強的適用性。《檔案法》對檔案開放利用做了專章規定,但是有關檔案數據開放的內容過于籠統且缺乏實際操作性,因此,一方面,《檔案法》后續配套下位法的制定中,須明確開展檔案數據處理活動損害個人合法權益時的適用法律,從而與《民法典》《侵權責任法》《網絡安全法》《數據安全法》《個人信息保護法》等法律法規協調銜接。同時,明確檔案數據開放的標準,盡可能減少因開放標準不統一而導致的隱私侵權問題;另一方面,可在《檔案法》配套法律法規的制定中,增加對未經授權的檔案數據訪問、使用、披露、破壞、修改或銷毀等行為的風險控制措施和救濟條款,建立符合數智時代需要的個人隱私侵權需預防、監測和救濟機制,補充數據空間的個人隱私保護立法。
其次,在貫徹落實國家立法層面的《民法典》及出臺的《數據安全法》《個人信息保護法》前提下,結合檔案業務需求,制定有關檔案用戶個人信息保護、檔案用戶隱私章程等的行業規范,平衡好檔案精準服務與數據隱私安全之間的需求。另外,還可制定統一的《檔案數據脫敏處理標準規范》和《隱私影響評估指南》,構建檔案數據開放中隱私保護框架,提升數據開放的標準化、規范化,以便在檔案數據開放共享、公布利用等工作環節中,應對各種黑客程序、網絡病毒、蓄意侵權等行為給個人隱私保護帶來的挑戰,對檔案中的個人隱私進行保護,盡可能減少個人隱私泄露侵權等風險發生的可能性。
最后,在制度運行工具上,應當建立基于整個數據生命周期的隱私影響評估機制,將隱私影響評估視為隱私保護制度運行的有效工具,并且考慮構建包含檔案數據主體、檔案數據利用者、檔案領域專家、技術專家、檔案部門等在內的利益相關者對話平臺,建立一個貫穿檔案數據開放前、開放后的對話磋商機制。由此,在檔案數據開放前,可以充分考慮到開放檔案數據和確切個體發生聯系的可能性及其潛在影響,對“可直接識別確切個體的信息”,充分利用并及時更新匿名化技術實施數據開放審查,對“可間接識別確切個體的信息”,審慎考慮直接公開的風險及與其他信息相結合后使數據去匿名化的潛在風險。在數據開放后,也更能夠通過迅速溝通協商啟動隱私風險響應機制,及時化解檔案數據被再識別化的風險。
保護檔案數據開放中個人隱私僅僅停留在法律法規層面是不夠的,還需要相應機構進行協助和實施。需要建立健全相關制度監管組織,打防結合,強化對檔案中個人信息侵權行為的治理。當前我國在檔案數據開放領域設置專門的個人隱私保護機構還不具備條件,但可以考慮在相關數據安全管理機構中設置檔案數據開放的專門隱私保護小組,負責履行涉及隱私保護政策的執行、推廣、監督和受理隱私侵權投訴等職責,進而有效保護個人隱私。
個人隱私保護先進技術的應用對有效保障個人隱私安全至關重要。一方面,應加大對隱私安全技術的投入力度,為研發隱私保護技術提供資金保障。除國家層面加大對個人隱私保護技術的資金投入外,國家檔案局在科研項目評審中,也可適當傾斜于檔案數據主體隱私保護技術的立項,以項目促研究、以項目推動隱私保護技術的研發;另一方面,在完善數據脫敏、匿名化、加密技術等技術基礎上,適度引入以大數據、人工智能、區塊鏈等新興數字技術為依托的智能化推薦模型,根據檔案工作者預設的風險感知模型自動做出合理判斷,減少因風險不確定性造成的潛在損失,尤其以區塊鏈技術具有的去中心化、時序數據、集體維護、可編程和安全可信等特點,剛好可用于滿足隱私數據的完整性、可限制性以及可審計性等數據安全需求,實現個人隱私所有權、使用權、監管權的分離[5]。
隨著數智時代的到來,實現檔案數據開放中的個人隱私保護并非檔案部門一方之責和一方之事,而是也有賴于個人隱私保護的客體——公民一方的廣泛參與和積極配合,其中,具有重要價值的便是公民隱私保護素養的提升。正如有學者指出,“對數字檔案用戶隱私的有效保護,需以提升檔案用戶隱私保護意識與能力為基礎,從根源處避免隱私泄露的可能性[6]。”因此,為提高檔案數據主體隱私保護素養,一方面,從教育部門到工信部門、檔案部門都應加強隱私教育力度和宣傳力度。教育部門應加大對基礎教育中信息學科的重視,從小培養公民的隱私意識和信息保護觀念。工信部門應充分利用國家網絡安全宣傳周等契機加大宣傳力度,在全社會形成良好的公民隱私保護氛圍;檔案館可通過講座和海報宣傳或將隱私保護教育課程、隱私風險感知測評模塊嵌入檔案網站、APP、數字檔案館開放平臺以落實好個人隱私教育;另一方面,也可以鼓勵公民自主學習相關法律知識,不斷促使檔案數據主體自覺地發掘并學習如何保護個人隱私的方法與技能。
在信息日益走向開放的時代,檔案數據開放無疑會愈發廣泛,但其中涉及的個人隱私也越來越多。我們唯有根據中國實際需要不斷展開理論和實踐探索,才能真正有效促成檔案數據的高效安全開放,切實維護好個人隱私,推動我國檔案事業的高質量發展。