摘要:大數據時代的檔案工作有不同于以往的工作內容,檔案信息安全更是不容忽視。該文梳理了大數據背景下關于檔案信息安全的研究成果,提出了檔案數據本身存在安全問題以及存儲環境、數據挖掘、數據分析過程中的安全問題,并提出了利用數據存儲技術保障檔案信息存儲中的安全、在運用數據挖掘技術的過程中保障檔案信息安全、在運用數據分析技術的過程中保障檔案信息安全的策略。
關鍵詞:檔案;大數據;信息安全
中圖分類號:G271
文獻標識碼:A
文章編號:1009-3044(2020)05-0024-03
開放科學(資源服務)標識碼(OSID):
大數據自產生以來就迅速發展,目前大數據觀念已經深入影響到了世界各國的國家政策制定、學科研究等領域。大數據與各個學科都產生了聯系,關注新技術、新方法一直是各學科研究的方向,所以檔案學與大數據相結合也推動了許多新研究的出現。檔案信息化建設在檔案領域產生了巨大影響力,是當前的研究熱點之一,檔案信息安全風險也隨之出現。所以,在大數據背景下,新時期的檔案建設要注重檔案信息安全,發現檔案信息存在的安全風險,并積極完善檔案信息安全,使檔案能夠實現更長時間的保存與利用。
1 研究現狀
1.1國內研究現狀
國內學者對于大數據背景下檔案信息安全的研究主要包括以下幾個方面:
1.1.1大數據背景下檔案信息安全保障框模型研究
肖秋會、李珍認為大數據環境下檔案信息安全保障體系的構建應遵循法規標準導向原則、數據驅動原則、安全管理原則、技術保障原則,從宏觀治理層、中觀管理層、微觀技術層三個層面來進行;陶水龍用四個層面來區分檔案大數據的管理,提出利用副本來保障信息安全。
1.1.2大數據背景下保障檔案信息安全的措施研究
陳慧提出在大數據時代,從宏觀層面上看應完善法律法規、加強制度保護,從技術層面上看應采用大數據技術保障檔案信息安全;郝志瓊提出了做好電子檔案與紙質檔案并存工作、建立健全檔案信息化安全管理制度等措施以保障大數據時代的檔案信息安全。
1.1.3大數據背景下對國外檔案信息安全保障案例研究
肖秋會、伍黎丹研究了“數字連續性計劃”,該計劃由澳大利亞國家檔案館實施,有利于保障檔案數據不被篡改,進而維護檔案數據在長期保存中的安全;馮慧玲以美國國家檔案局為例,分析了其近年來在檔案信息安全保障方面的措施,如提高國家控制力、完善法制環境等措施值得我國借鑒。
1.2 國外研究現狀
國外關于大數據背景下檔案信息安全的研究主要包括以下幾個方面:
1.2.1 大數據背景下檔案信息管理的研究
Brain Kellv等闡述了大數據背景下檔案信息管理的范圍應擴大,在線社交媒體信息也應歸檔,并研究了推特歸檔在可持續性等方面的挑戰;KofiKorantengAdu等人指出大數據背景下檔案信息資源的管理力度應增大,政府部門在檔案信息管理方面應承擔責任。
1.2.2 大數據背景下檔案信息安全風險研究
Juan Voutssas等以拉丁美洲國家的發展為例,從文化意識、技術、法律、方法論、經濟以及社會因素這六個角度探討了檔案數據的保存及風險。;Mike Kastellec闡述了限制檔案信息保存的因素,并將其分為技術性因素和非技術性因素,包括訪問維度、保存范圍、法律以及財政預算;Edward M.Corrrado從人力資源的角度出發,將大數據環境下數字檔案保存所涉及的風險分為三類:技術系統、元數據收集和元數據編目,并指出還需要足夠的政府行政支持。
1.3研究述評及啟示
國內外關于大數據時代的檔案信息安全研究有一些共同點,共同關注點都集中在檔案信息資源的保存與利用過程中的問題與解決策略等方面。此外也各有優勢與不足。
國外的研究比較傾向于檔案信息管理的問責,強調政府的主導性。國內關于檔案信息安全研究在內容和層次上看都有不斷拓展、不斷深入的趨勢。但目前研究尚存在一些不足,比如對大數據時代檔案信息安全保障的研究仍然沒有擺脫傳統形態檔案安全的邏輯框架,有些研究是在紙質檔案安全保障體系的基礎上將對象換成了數字檔案;此外對于研究成果在實際工作中是如何貫徹執行的,取得了怎樣的反饋,對此的關注比較少。
2 大數據背景下我國檔案信息安全管理的基本情況
2. 1法律法規逐漸完善
近年來,我國在法律法規建設的過程逐步考慮到檔案信息化的因素,逐漸完善了此類法律。隨后順應大數據的發展又逐漸制定和發布了一些涉及檔案大數據、電子文件等的法律、規章或標準。從法律方面來看,除了《中華人民共和國檔案法》以外,《電子簽名法》《保守國家秘密法》等法律中的一些條款與檔案信息安全均有一定的聯系。從行政法規方面來看,目前我國的檔案行政法規中的《電信條例》《計算機信息系統安全保護條例》等都是與大數據背景下的檔案信息安全相關的。從規章方面來看,《電子檔案移交與接收辦法》《文書類電子文件元數據方案》等與檔案數據的采集有一定的聯系。總體而言,我國近年來關于檔案大數據方面的法律法規有一些進展,但整體上大部分法律法規仍然是針對傳統的紙質檔案,仍需完善。
2.2 信息基礎設施建設逐漸推進
國家信息基礎設施是指用來保障國家重要領域所建立的信息網絡,如電信、金融等領域的信息網絡,信息基礎設施建設是大數據背景下保障檔案信息安全的重要前提,推進信息基礎建設是國內外公認的世界數據安全工作的核心部分。在此背景下,我國也重視信息基礎設施的規劃與安排,政府逐步出臺了一些相關的政策和指導規劃,嚴格控制網絡病毒、網絡攻擊、網絡竊密、計算機病毒等網絡犯罪問題,用法律來保障信息基礎設施,提高檔案信息的安全性。
3 大數據背景下我國檔案信息安全存在的問題
3.1 檔案大數據本身的安全問題
檔案的本質屬性就是原始記錄性。但是在大數據環境下,檔案信息的原始性、真實性成為一個問題。在大數據環境下,電子檔案、電子文件的收集、歸檔、鑒定、保管、提供利用直至最終銷毀都離不開計算機等軟硬件,也離不開網絡與大數據,所以檔案管理的各個環節都不可避免地受到一定的風險影響。首先,在檔案數字化的過程中,紙質檔案的載體、存儲空間和表現形式都受到了改變,并且其載體有被更替的風險、存儲空間有被壓縮或擴大的風險、表現形式有被更改的風險,在這些過程中都會對檔案的原始性和真實性產生影響。此外,在存儲數字化檔案的過程,檔案信息對系統有一定的依賴型,當檔案信息需要被轉移的時候,要經過不同系統的多次讀取與錄入,在此過程中可能會有較多的新的元數據加入,從這個層面來看很難保證檔案的原始性。所以,在大數據環境下檔案數據本身存在很大的安全問題。
3.2 檔案大數據的存儲環境的安全問題
檔案大數據的存儲過程中也會產生安全問題。首先,計算機的硬件或系統產生的故障會給檔案數據帶來安全問題。比如發生水災、地震、火災等災害時,會造成硬件安全問題,從而導致檔案數據的丟失或損壞。其次,檔案管理軟件或檔案數據庫也存在一些內部安全問題。另外,網絡環境也會造成存儲環境不安全,如計算機病毒、網絡黑客等情況可能造成數據被惡意使用。在目前的共享開發的大數據背景下,想要完全保證存儲環境安全難度較大,還需進一步努力。
3.3 數據挖掘和數據分析過程中的安全問題
在對檔案大數據進行數據挖掘和數據分析的過程存在一定的安全風險。首先在數據挖掘和數據分析之前,傳統的紙質檔案要進行數字化,轉化成數字化的檔案。對紙質檔案進行數字化的過程中會有一些安全影響因素,比如數字化后的檔案數據是否有效、可用,是否和檔案原件一致,這一環節一旦出現錯誤或疏漏,隨后的數據挖掘和分析也會產生數據安全問題。此外,在對檔案數據進行挖掘過程中,如何從海量數據中提取信息,并保持結果的真實準確,也是大數據背景下檔案信息安全的一個難題。在檔案數據分析的過程中,數據有泄露風險,且數據保密與開放之間的平衡關系難以維持。
4 大數據背景下檔案信息安全保障策略
4. 1利用數據存儲技術保障檔案信息存儲中的安全
隨著大數據技術的發展,檔案的數據在原本的結構化的檔案目錄的基礎上,還增加了許多非結構化的檔案全文數據。在這種情況下,應建設檔案大數據存儲系統以存放和保存檔案數據,使數字化的檔案能保存下來并提供利用。而檔案數據存儲的關鍵是平臺建設。數據存儲技術首先涉及檔案大數據平臺建設中的信息安全。建設檔案大數據平臺之前應先對現有的檔案資源進行整合,建立一個分布處理、集中管理的存儲體系,該體系應以檔案數據為中心。檔案大數據存儲平臺應實現統一集中存儲、具備高容量和高穩定性、應支持空間的靈活分配和配置。在此基礎上,為了保障檔案大數據的信息安全,就還要求大數據存儲平臺能有完善的權限控制規則和高度的安全性,具有可靠性和安全性。具體體現在以下幾個方面:應提供全面的可視化服務,管理員可隨時監管、分析基礎設施中發生的所有事項;解決各種數據庫之間的兼容問題,確保海量的檔案數據可以存儲;存儲平臺中應有快速識別威脅來源或突發事件的設施,并有相關的緊急預案,如遠程或本地有備份或恢復解決方案。所以總的來說,為了確保檔案信息安全,在原本的檔案大數據存儲平臺的基礎上還應特別完善權限控制、數據兼容、風險規避等環節。
4.2 在運用數據挖掘技術的過程中保障檔案信息安全
除了數據存儲技術以外,數據挖掘技術也是大數據技術的一個重要組成部分。數據挖掘指的是運用技術從數據集里識別出有用的、有效的信息,并最終將其轉化成可理解的知識,該過程較復雜且也存在著檔案信息安全的風險。在運用數據挖掘技術的過程中首先要保證檔案信息不失真、保持檔案信息的完整性。檔案的本質屬性是原始記錄性,即使在大數據背景下,數字化的檔案也應和傳統檔案一樣具有原始記錄性。在運用數據挖掘的過程中要保證數字檔案是真實客觀反映相關社會活動,記錄不能被非法篡改,要保證檔案信息的真實性。此外,在數據挖掘的過程中還要保證檔案信息的完整性。只有保證檔案信息的完整性才能使其客觀真實地反應一定的社會活動,才能給利用者提供合理、客觀的信息支持。所以在運用數據挖掘的過程中應把需要的部分信息放入整體檔案中來對其進行分析,不能斷章取義、避免太過局限。
另外還要保證一般意義上的檔案信息安全,也即避免檔案信息數據的泄露,尤其是關于個人隱私的信息。運用挖掘分析技術講所有數據錄入資源庫中后,最佳目的是為了有效利用這些信息,而不是流失或泄露。所以這是檔案信息安全風險中的一個比較大的問題。比如用戶在網上查檔是留下的個人信息,對其進行數據挖掘后可以產生用于分析用戶行為的新信息,但與此同時用戶并不知道自己的個人信息已經被記錄和挖掘。比如,當用戶在瀏覽、查詢或下載檔案信息時所留下的痕跡,對其進行數據挖掘之后可以向用戶推薦其可能感興趣的信息。但在滿足用戶需求的同時,用戶并不知道自己的數字活動正在被記錄,因此這種動機良好的數據挖掘在某種程度上卻也成了“監視”用戶瀏覽習慣的手段,一旦出現用戶信息泄露,后果和危害都會很大。對此可以用模糊處理的技術對用戶數據進行處理,同時在利用用戶數據的過程中也必須用數字化節制技術,不斷更新和提升減災能力,降低信息二次利用所造成的風險。其中數字化節制也就是面對信息數據豐富甚至過剩的時候,應有“信息駕馭力”,也就是“辨別、篩選、剔除”無效信息數據的能力。在進行數據挖掘的過程中,必須高度重視完善和創新檔案數字化節制措施,必要時刪除部分數據,以妥善處理“記憶”與“刪除”這一檔案數據的核心矛盾。
4.3 在運用數據分析技術的過程中保障檔案信息安全
數據分析技術也是比較重要的大數據技術。檔案大數據分析就是指利用可視化技術,對檔案相關的數據進行可視化分析,較為直觀地展現出數據之間的關系,主要以分布式數據分析、非結構化數據處理為主。在運用數據分析技術的過程中一方面要對外包業務進行嚴格規范,考慮到大部分檔案館理部門的大數據技術都來自商業廠商,有不同的公司為檔案大數據提供技術支援,所以業務外包是不可避免的。而對檔案大數據的數據分析又涉及重要的檔案信息,所以要避免外包商對數據的泄露或流失。應嚴格將業務外包法制化和標準化,確保合作機構的可信度;另一方面也要考慮保密與開放的平衡。數據分析技術必然會涉及大量檔案數據的公開,因此不得不考慮檔案數據是否涉及保密、是否適宜公開,應平衡保密與開放利用之間的關系。要對開放的在線檔案數據進行定期審核,避免疏漏。此外還要在法律上明確檔案開放的范圍,嚴格按照法律標準開放利用檔案數據。
5 結束語
在當前的大數據時代下,大數據對檔案信息安全的影響與日俱增。保障檔案信息安全是工作也并非是一朝一夕就能達成的,需要檔案工作者不斷堅持、不斷優化管理方法,是一個逐步發現問題、解決問題的過程。本文的研究尚不夠深入和全面,隨著科學技術地進步和相關技術的發展,相關的研究成果也會不斷修正,以更好地為檔案工作服務。
參考文獻:
[1]肖秋會,李珍.大數據環境下檔案信息安全保障體系研究[J].中國檔案,2018(04):76-79.
[2]陶水龍.基于流程管理的電子檔案安全策略的探討[Jl-北京檔案,2012(1):9-11.
[3]陳慧.大數據時代檔案信息安全價值實現策略研究[J].檔案學研究,2018(06):35-37.
[4]郝志瓊.淺析檔案管理信息化安全體系建設[J].檔案與建設,2018(07):47-48.
[5]肖秋會,伍黎丹.澳大利亞國家檔案館的數字連續性計劃研究[J].信息資源管理學報,2015(4):19-23.
[6]馮惠玲,加小雙,數字轉型背景下美國電子文件管理戰略布局與行動探析[J].檔案學通訊,2015(6):44-51.
[7] Brain Kelly, Martin Hawksey,John 0'Brien.Twitter ArchivingUsing Twapper:Technical And Policy Challenges[Jl.7th Intema-tional Conference on Perservation of Digitial Objects,2010.
[8] KofKorantengAdu, Luyande Dube, Emmanuel Adjei. Digitalpreservation: The conduitthrough which open data, electronicgovemment and the right to information are implemented[Jl.Li-brary Hi Tech,2016(34):733-737.
[9] Juan Voutssas.Long-term digital information preservation:chal-lenges in Latin America[J].Aslib Proceedings,2012(64):83-96.
[10]許敏,淺析電子時代的檔案信息安全[Jl,檔案天地,2019(01):41-42.
[11]趙福榮.檔案信息安全管理體系建設研究[J].浙江檔案,2018(10):54-55.
[12]王衛平.論大數據對檔案工作的影響及其帶來的挑戰[J].檔案現代化管理,2014(4):58-60.
[13]王平,安亞翔.大數據時代的檔案信息平臺建設[Jl.檔案與 建設,2015(10):8-13.
[14]張文元,張倩.大數據技術與檔案數據挖掘[J].檔案管理,2016(02):33-35.
[15]張倩.“大數據”技術在高校檔案信息服務中的應用探索[J].檔案與建設,2014(03):27-31.
[16]張倩.檔案大數據智能處理平臺風險防范預案研究[J].檔案與建設,2017(06):35-37.
[17]潘建華.大數據背景下檔案信息共享平臺安全性研究[J].山西檔案,2016(03):73-75.
[18]黃忻,大數據背景下檔案信息安全保障的SWOT分析[J].山西檔案,2017(02):65-67.
【通聯編輯:朱寶貴】
收稿日期:2019 -12 -15
作者簡介:諸悅(1996-),女,江蘇鎮江人,碩士在讀,主要研究方向為圖書情報。