鄧青菁,付達杰,邱蒙雯
?
基于信息生命周期視角下的大數(shù)據隱私風險管理框架的分析
鄧青菁1,2,付達杰2,邱蒙雯1
(1. 江西財經職業(yè)學院 圖書館,江西 九江 332000;2. 江西財經職業(yè)學院 信息工程學院,江西 九江 332000)
大數(shù)據的時代背景下,圖書館運用大數(shù)據更好的為讀者提供服務的同時,也會給讀者帶來隱私方面的風險。基于信息生命周期視角對大數(shù)據隱私風險展開分析的基礎上,對圖書館的大數(shù)據隱私風險管理框架的建構和實現(xiàn)方法展開分析,形成了基于信息生命周期的大數(shù)據隱私風險管理框架,可為關注這一話題的人們提供參考。
信息生命周期;大數(shù)據;圖書館;隱私風險管理框架
在云計算、大數(shù)據等技術取得快速發(fā)展的同時,人類已經進入到大數(shù)據時代。對于圖書館來講,在讀者信息管理的整個生命周期內,盡管運用大數(shù)據可以更好的為讀者提供服務,但也會給讀者帶來隱私風險。因此,還應加強對信息生命周期視角下的大數(shù)據隱私風險管理框架的研究,以便更好的進行大數(shù)據的安全應用。
在大數(shù)據時代,從信息生產、采集、傳輸、計算分析到存儲和應用的整個過程中,都存在信息泄露的風險[1]。因為大數(shù)據的應用可以帶來可觀的效益,以至于信息成為各行各業(yè)戰(zhàn)略級資源,導致個人信息保護約束被不斷削弱,各領域都開始進行個人數(shù)據的大量收集和存儲以滿足業(yè)務需求。而對于圖書館來講,在智慧化發(fā)展的過程中,勢必要通過數(shù)據采集、計算分析、傳輸、存儲和應用提供一站式檢索等智能化服務。在為讀者提供個性化服務的過程中,也要對讀者個人信息進行收集和挖掘,對讀者信息需求特點進行總結,以便實現(xiàn)對讀者閱讀需求和趨向的合理預測,滿足讀者的服務要求[2]。借助網絡,需要對讀者信息進行傳輸。借助網絡互動接口,圖書館可以為讀者提供知識導航、個性推薦等服務。而包含讀者個人信息、使用記錄等在內的數(shù)據均為讀者隱私,一旦在某個環(huán)節(jié)出現(xiàn)信息泄露問題,就會引發(fā)風險[3]。
從圖書館信息生命周期視角來看,圖書館在讀者信息管理方面存在較多的隱私風險。首先,在數(shù)據收集方面,讀者在登錄圖書館平臺進行信息提交和資源搜索的過程中,相關數(shù)據信息都將被后臺服務器自動記錄。在到實體圖書館獲取服務的過程中,包含門禁系統(tǒng)、借閱系統(tǒng)等系統(tǒng)在內都會對讀者借閱信息和個人信息進行采集。在這種情況下,讀者實際上失去了對隱私的控制權,無法阻止個人隱私數(shù)據被采集。其次,圖書館在數(shù)據分析和計算方面,也會利用數(shù)據挖掘技術對收集到的數(shù)據進行處理,從而結合讀者需求信息提供更好的服務。結合讀者行為規(guī)律,圖書館也將對讀者的偏好和趨向進行預測,完成讀者潛在需求的挖掘,同樣會給讀者帶來隱私風險。再者,在數(shù)據傳輸?shù)倪^程中,圖書館通常利用公開的網絡技能型讀者個人信息傳輸。采用鏈路竊聽、木馬等手段,可以對讀者信息進行獲取,同樣會給讀者隱私帶來威脅。此外,在數(shù)據存儲方面,圖書館目前廣泛采用了云計算技術,以降低數(shù)據存儲成本和實現(xiàn)數(shù)據循環(huán)利用。采用該種存儲方式,可以通過登錄賬號隨時隨地的進行讀者個人隱私信息的查看,難以保證數(shù)據不被泄露。最后,在數(shù)據應用方面,圖書館會根據讀者請求對各種數(shù)據進行頻繁存取。在設備缺乏病毒防御能力,并且系統(tǒng)訪問無需身份認證的情況下,就可能導致讀者隱私信息遭到泄漏或破壞。
針對圖書館大數(shù)據隱私風險,還要完成相應管理框架的構建,以便采用隱私保護理論和大數(shù)據技術加強讀者隱私風險管控,避免讀者隱私信息泄露或遭到破壞。考慮到隱私風險存在于各個環(huán)節(jié),還要從信息生命周期視角進行框架的構建,實現(xiàn)對隱私風險的全生命周期管理。從風險管理需求上來看,依據法律,圖書館應當加強對讀者利益的維護,同時堅持隱私保護政策開放,以便在隱私保護和大數(shù)據決策收益之間達到一種平衡。為此,管理框架的構建應保證讀者享有隱私數(shù)據采集、存儲、處理等過程的告知權,能夠根據自身需求選擇是否進行隱私大數(shù)據的采集和使用。圖書館在面向讀者的過程中,需要向讀者說明大數(shù)據隱私風險、數(shù)據采集的目的和圖書館采取的隱私保護措施,從而得到讀者的許可和授權。讀者作為大數(shù)據生產者,同時也是大數(shù)據決策受益人,將根據自身價值衡量結果做出選擇。圖書館在讀者大數(shù)據的隱私風險管理方面,則要完成生命周期管理模塊的設計,圍繞隱私大數(shù)據生命周期各階段進行隱私風險分析和評估,并采取相應的措施進行隱私保護管理。在建模的過程中,重點需要對隱私信息生命周期特點進行突顯,同時需要加強對各種大數(shù)據隱私風險的監(jiān)測和評估。從總體上來看,在圖書館進行讀者隱私大數(shù)據管理的過程中,風險因素即包含來自于外部的威脅,同時也來自于內部問題。從外部來看,在圖書館進行信息服務提供的過程中,可能遭受黑客攻擊、服務中斷等因素的威脅。從內部問題上來看,網絡漏洞、決策者人為泄露信息、服務環(huán)境惡化等因素的存在也都容易導致隱私風險的產生。針對這些問題,建立的隱私風險管理框架能夠從法律和技術層面采取相應的措施進行隱私保護,因此能夠實現(xiàn)對隱私風險的全面管理。
結合上述思路,可以完成如圖1所示的基于信息生命周期的大數(shù)據隱私風險管理框架。從框架構成上來看,可以大致劃分為三部分,即大數(shù)據生命周期管理模塊、隱私風險評估模塊和隱私保護模塊。在大數(shù)據生命周期管理模塊設計上,符合信息生命周期發(fā)展規(guī)律,確定了大數(shù)據產生、采集、存儲、計算和應用各環(huán)節(jié)對應的管理對象,即數(shù)據生產者、大數(shù)據采集設備、大數(shù)據存儲服務器、云計算服務器和大數(shù)據決策者[4]。結合讀者隱私數(shù)據生命周期各環(huán)節(jié)涉及的對象和整個管理流程,可以完成隱私信息特征的挖掘,確定信息傳播機理,為隱私風險評估奠定良好基礎。而在隱私風險評估方面,將對各環(huán)節(jié)讀者隱私被侵犯可能面對的風險問題進行詳細敘述和劃分,能夠為后續(xù)采取隱私保護措施提供科學依據。最后,結合各環(huán)節(jié)存在的隱私風險,提出了隱私安全動態(tài)監(jiān)控、隱私安全動態(tài)評估、隱私安全管理技術、事故審計問責、法律與規(guī)定保護等措施,確保生命周期各環(huán)節(jié)實體行為引發(fā)的隱私風險能夠得到有效管控[5]。按照管理框架,讀者將根據閱讀服務等級和收益進行大數(shù)據應用范圍的選擇。對于圖書館來講,則要根據讀者授權在采集讀者隱私數(shù)據時通過隱私安全動態(tài)監(jiān)控避免進行不相關數(shù)據的采集,體現(xiàn)圖書館以負責為中心的隱私風險管理原則,避免對讀者隱私數(shù)據進行過度采集和挖掘。在利用設備進行大數(shù)據采集和傳輸?shù)倪^程中,則要結合這一環(huán)節(jié)隱私數(shù)據易被竊取等特點加強隱私安全動態(tài)評估,對數(shù)據來源多樣性進行分析,實現(xiàn)對違反隱私策略的行為進行跟蹤和問責,避免讀者隱私數(shù)據遭到泄漏。在大數(shù)據云存儲階段,考慮到黑客可以通過攻擊大數(shù)據存儲服務器進行圖書館云空間訪問,所以還要采用身份認證等隱私安全管理技術避免讀者隱私數(shù)據被非法獲取。在大數(shù)據計算和分析的二次利用環(huán)節(jié),由于圖書館需要利用云計算服務器進行大數(shù)據聚類、分類等處理,完成讀者隱私的進一步挖掘和分析,容易出現(xiàn)分析人員違背規(guī)章制度進行讀者隱私數(shù)據進行泄露和破壞等行為,因此還要建立安全事故審計問責制度,通過問責預防數(shù)據安全問題的發(fā)生。最后,在圖書館決策者制定大數(shù)據應用決策時,可能出現(xiàn)在與第三方服務商進行信息資源爭奪過程中侵害讀者隱私安全的行為,以至于違背讀者意愿進行數(shù)據交換和共享,因此還要借助法規(guī)和行規(guī)對決策者的行為進行約束,確保大數(shù)據的應用范圍能夠得到有效限制。

圖1 基于信息生命周期的大數(shù)據隱私風險管理框架
在讀者隱私安全動態(tài)監(jiān)控方面,圖書館可以采用P3P系統(tǒng)。通過將該系統(tǒng)與圖書館網頁瀏覽器綁定在一起,則能在讀者借助瀏覽器進行圖書館資源或服務獲取的過程中,同時在后臺進行P3P系統(tǒng)啟動。系統(tǒng)結合網站要求,會進行讀者個人處理策略的生成,由讀者根據需求完成隱私偏好設定。在隱私設定方面,需要采用EPLA語言,即讀者通過標記語言定義隱私保護策略,確保讀者能夠獲得的隱私的控制權,明確網站需要收集的信息。讀者根據圖書館網站提供的隱私保護選項,可以確定哪些數(shù)據信息可以被收集。在默認系統(tǒng)設置的條件下,讀者任何信息都不允許被搜集。在讀者進行各種網頁瀏覽的過程中,一旦有網頁存在搜集行為,P3P系統(tǒng)會在讀者進入網站前提醒讀者,與讀者設定的策略進行比對,詢問讀者是否進行隱私策略的修改[6]。如果讀者選擇修改策略,可以自由瀏覽該網頁,否則將退出該網頁。實際上,采用該種方法對讀者隱私安全進行動態(tài)監(jiān)測,即利用讀者隱私協(xié)商保護機制加強讀者隱私保護,能夠采取自定義方式由讀者確定圖書館可以搜集的隱私數(shù)據。
在讀者隱私安全動態(tài)評估方面,主要采用隱私泄露影響評估的方法,即結合法律規(guī)定對隱私風險帶來的影響進行全生命周期的評估。在此基礎上,則要采用安全目標識別的方法,對隱私風險發(fā)生的可靠性和嚴重程度進行分析,確定風險大小。采用模糊層次分析法,可以對各風險因素的權重進行確定,然后通過模糊評估確定風險帶來的損失。在權重確定時,可以引入信息熵,結合信息量大小進行客觀賦值。根據各項隱私風險對應的風險等級隸屬度,則能完成圖書館讀者隱私風險等級的定義,將讀者隱私風險劃分為高、較高、中等、較低、低五個等級,結合風險損失概率進行風險等級的判定。最后通過采取安全多方計算的方法,實現(xiàn)對圖書館、云服務提供商、第三方評估機構等各方協(xié)同問題的計算,確定各評估主體的隱私能夠得到保護[7]。針對讀者隱私大數(shù)據,存在多樣隱私風險。聯(lián)合采用多種方法進行隱私安全評估,可以實現(xiàn)對讀者隱私風險的系統(tǒng)評估。從隱私安全評估流程上來看,圖書館需要先完成讀者隱私安全需求的評估,然后通過信息流的描述實現(xiàn)隱私風險識別。采用模糊層次法,則能實現(xiàn)隱私風險量化分析,最終得到隱私風險解決方案。
在讀者隱私安全管理方面,圖書館還應采用多種技術手段,加強對讀者隱私的全面保護。首先,圖書館可以實現(xiàn)對讀者隱私數(shù)據的匿名化處理,使讀者隱私數(shù)據精度得到降低。采用該技術,需要對讀者隱私信息的個性化特征進行去除,保證讀者無法被輕易定位。采取該種措施,可以將讀者隱藏在群體中,在完成讀者偏好分析的同時,加強讀者隱私數(shù)據保護。其次,可以采用數(shù)據加密技術進行隱私數(shù)據處理,如DES算法、RC2等等[8]。采用不同的算法,擁有不同的安全強度,并且算法應用范圍和運行速度存在一定差異。采用密鑰進行數(shù)據非對稱加密,需要利用公開密鑰完成數(shù)據加密,然后利用對應私有密鑰完成解密。相較于對稱加密算法,盡管非對稱加密算法相對復雜,但是可以更好的實現(xiàn)通信過程中數(shù)據加密,因此可以滿足能夠直接識別讀者身份的隱私數(shù)據風險管理要求。針對讀者閱讀行為等數(shù)據,由于安全強度要求不高,因此可以采用對稱加密算法進行數(shù)據處理。此外,在讀者登錄圖書館平臺進行資源或服務獲取的過程中,可以采用身份認證技術和訪問控制技術,保證只有經過授權的用戶才能進行讀者信息數(shù)據庫訪問。而對讀者的訪問權限,也要進行一定的限制,即通過限制數(shù)據刪除、修改等權限避免讀者信息被非法使用或篡改。
在讀者隱私數(shù)據二次利用和應用決策方面,圖書館還要加強隱私安全管理制度的建設,以便利用法規(guī)和行業(yè)規(guī)范加強讀者隱私風險管理。針對目前大數(shù)據時代圖書館讀者隱私保護需求,國家還應出臺相關的法律法規(guī)確保圖書館、網絡運營商等機構在采集和使用讀者隱私數(shù)據時保證行為規(guī)范,加強對讀者隱私的保護[9]。在行業(yè)規(guī)定上,圖書館還應建立讀者隱私風險管理制度,針對收集得到的讀者隱私數(shù)據進行一致化處理和清洗、過濾等操作,確保與圖書館服務無關的讀者隱私數(shù)據能夠被及時刪除[10]。在讀者隱私數(shù)據使用方面,則要提高管理過程的透明度,確保管理決策者能夠在多方監(jiān)督下進行讀者隱私數(shù)據的使用。最后,圖書館需要建立問責機制,即結合讀者隱私風險評估和動態(tài)監(jiān)測結果進行隱私泄露事件的追蹤調查,確定數(shù)據泄露原因,采取相應措施進行責任人或機構的追責。
通過分析可以發(fā)現(xiàn),在整個信息生命周期內,讀者隱私大數(shù)據都存在泄露的風險。面對這種情況,圖書館在加強讀者隱私大數(shù)據利用的同時,還應加強讀者隱私保護。為此,圖書館還要從法律和技術層面完成由大數(shù)據生命周期管理模塊、隱私風險評估模塊、隱私保護管理模塊構成的大數(shù)據隱私風險管理框架的建構,從而實現(xiàn)對讀者隱私風險的系統(tǒng)管理。
[1] 馬凱航, 高永明, 吳止鍰等. 大數(shù)據時代數(shù)據管理技術研究綜述[J]. 軟件, 2015, 36(10): 46-49
[2] 劉紅霞. 物聯(lián)網技術在圖書館中的應用[J]. 河南科技, 2015, 14: 4-6.
[3] 王家玲. 智慧圖書館模式下讀者隱私技術保護研究[J]. 圖書館雜志, 2017, 36(9): 82-88.
[4] 朱光, 崔維軍, 張薇薇信息生命周期視角下的大數(shù)據隱私風險管理框架研究[J]. 情報資料工作, 2016, 01: 99-103.
[5] 馬曉亭, 陳臣. 基于大數(shù)據生命周期理論的讀者隱私風險管理與保護框架構建[J]. 圖書館, 2016(12): 62-66.
[6] 曾子明, 秦思琪. 嵌入PbD理論的云圖書館隱私管理架構[J]. 圖書館論壇, 2017, 37(1): 93-100+18.
[7] 彭華杰. 大數(shù)據時代圖書館讀者的隱私危機與隱私保護[J]. 圖書館工作與研究, 2014(12): 56-59.
[8] 卜曉波. 試論大數(shù)據云計算環(huán)境下的數(shù)據安全[J]. 軟件, 2018, 39(2): 197-199.
[9] 閆實, 付佳, 石莉. 大數(shù)據環(huán)境下基于智慧校園的教學改革[J]. 軟件, 2018, 39(2): 208-211
[10] 馬曉亭. 大數(shù)據時代基于服務等級協(xié)議的圖書館讀者隱私感知與保護研究[J]. 情報理論與實踐, 2014, 37(4): 57-60.
Analysis of Big Data Privacy Risk Management Framework Based on Information Life Cycle Perspective
DENG Qing-jing1,2, FU Da-jie2, QIU Meng-wen1
(1. Jiangxi Vocational College of Finance and Economics, Library, Jiujiang 332000, China; Jiangxi Vocational College of Finance and Economics, School of Information Engineering, Jiujiang 332000, China)
Under the background of big data, the use of big data in libraries can better serve readers, but it also brings privacy risks to readers. Based on the analysis of big data privacy risk from the perspective of information life cycle, this paper analyzes the construction and implementation of the big data privacy risk management framework of the library, and forms a big data privacy risk management framework based on information life cycle. This paper can provide a reference for people who pay attention to this topic.
Information life cycle; Big data; Library; Privacy risk management framework
TP309.2
A
10.3969/j.issn.1003-6970.2018.09.009
江西省教育廳科技項目“面向大數(shù)據的隱私保護技術研究”(GJJ171300)
鄧青菁(1990-),女,助教,主要研究方向:計算機信息管理;付達杰(1983-),男,教授,主要研究方向:數(shù)據挖掘與學習分析;邱蒙雯(1992-),女,助理館員,主要研究方向:信息管理。
本文著錄格式:鄧青菁,付達杰,邱蒙雯. 基于信息生命周期視角下的大數(shù)據隱私風險管理框架的分析[J]. 軟件,2018,39(9):42-45