俞藝涵,付鈺,吳曉平
基于多層模糊綜合評估的隱私保護效果評估方法
俞藝涵1,2,付鈺2,吳曉平2
(1. 海軍航空航天大學教練機模擬訓練中心,遼寧 葫蘆島 125001;2. 海軍工程大學信息安全系,湖北 武漢 430033)
針對由單一數據層面進行隱私保護效果評估無法刻畫網絡環境整體隱私保護效果的問題,借助模糊綜合評估方法,從數據全生命周期凝練隱私保護效果影響因子,通過分區塊、多層次地模糊綜合評估,并依據數據隱私差異確定各因子與各區塊權重,綜合計算得到網絡環境整體隱私保護效果評估結果。實例分析表明,該方法可行有效。
隱私保護;隱私保護效果評估;模糊綜合;多層次
隨著信息技術的不斷發展,網絡環境中的數據呈爆炸式增長。海量數據中不可避免地存在眾多隱私信息,如何對開放式網絡環境中的隱私信息進行保護成為近年來的研究熱點[1]。當前,針對數據生命周期各個階段已有較多的隱私保護研究成果,如隱私保護數據發布、隱私保護數據挖掘等,但對各類隱私保護方法的實際效果缺乏規范化的評價方法。

針對以上問題,本文結合數據實際應用環境和隱私場景對隱私保護效果的影響因素進行歸納,并考慮到隱私概念的模糊性,設計了一種基于多層模糊綜合評估的隱私保護效果評估方法,該方法將隱私保護效果評估由單一數據自身層面擴展至整個數據生命周期,由多層次、分區塊的隱私保護效果評估結果整合計算得到網絡環境整體隱私保護評估效果,可為下一步指導隱私保護具體實施提供依據。
隱私保護效果評估需以明確隱私保護效果影響因子為前提,文獻[8]將對隱私保護效果的評估刻畫至整個隱私生命周期中,將其與以下幾大因素相關聯:一是隱私信息的概率分布;二是信息所有者;三是信息接收者,主要指信息接收者所擁有的背景知識、興趣點、隱私觀念等;四是信息使用時的約束條件,即數據使用在時間、空間、環境條件上的限制;五是隱私操作,即隱私保護措施。本文以此為基礎,綜合考慮當前網絡環境下隱私數據所面臨的安全風險總結得出隱私保護效果的3個主要影響因子,每個影響因子包含文獻[8]所提的多個因素且存在交叉,具體如下。
(1)數據隱私類別
數據隱私類別是指數據隱私信息中所蘊含的隱私信息的類別,其對隱私保護效果的影響具有本質性。數據隱私類別一方面決定數據在隱私層面的重要性,另一方面會影響隱私所有者、數據使用者、數據攻擊者在不同隱私應用場景下對數據的隱私態度與處理方法,從而影響隱私保護效果。若將隱私保護的對象視為一種資產,則數據隱私類別是對該資產的一種量化,本文將數據隱私類別對隱私保護效果產生的影響稱為資產因子。
(2)隱私風險來源
隱私風險來源是指隱私數據在整個生命周期中可能面臨隱私泄露風險的原因,其與數據隱私保護效果具有間接關聯性。以數據隱私安全全局角度來看,當數據隱私面臨的風險越高時,對于已實施的隱私保護措施的隱私保護效果應給予越低的評價??紤]到隱私風險間接地影響隱私保護實際效果,本文將隱私風險來源對隱私保護效果產生的影響稱為威脅因子。
(3)隱私保護實施
隱私保護實施是指隱私數據在整個生命周期中所被采取的隱私保護措施,其對于隱私保護效果的影響具有直接性。隱私保護實施采用的隱私保護技術、隱私保護強度、隱私保護范圍等因素將影響隱私信息的泄露概率,泄露概率越高,隱私信息的脆弱性越大,本文將隱私保護實施對隱私保護效果產生的影響稱為脆弱性因子。
在實際評估過程中,上述3個隱私保護效果影響因子分別對應多個方面十個指標,因此,在采用模糊綜合評估方法對隱私保護效果進行評價時,因評估因素集中的因素數量過多,不可避免地將出現一些因素的權值取值較小(接近于零)的情況,即在計算綜合評價結果時丟失對應因素信息。另外,在當前網絡環境中對數據隱私保護效果進行評估時,評估對象類似于一個無邊界的復雜系統,很難厘清一個因素與評語集對應的隸屬關系,從全局角度進行評估將丟失用戶個體差異信息,使評估結果缺乏準確性。
綜上,在利用模糊綜合評估方法對隱私保護效果進行評估時,為使評估結果盡可能地科學、準確,本文利用模糊綜合評估的多級分層模型展開具體評估工作,具體步驟如下。




根據二級因素評估結果,將其作為行向量構造對應一級因素模糊評估矩陣。




的確定由評估時的具體情況和數據隱私差異決定。的計算過程如圖1所示。
Figure 1 The minimum evaluation unit evaluates the process hierarchy



圖2 空間維度上的評估擴展示意
Figure 2 Schematic diagram of evaluation extension on spatial dimension
公開臨床醫療數據有利于各類醫學問題的研究,但在公開的臨床醫療數據集中通常會涉及患者隱私信息。目前存在眾多臨床醫療數據集,其保護患者隱私的方法各不相同。本節以所提基于多層模糊綜合評估的隱私保護效果評估方法對真實醫療數據集MIMIC-III[10]的隱私保護效果進行評估。

Step2 針對臨床醫療數據集隱私保護效果評估需求,生成如圖3所示隱私保護效果評估指標集。


圖3 臨床醫療數據集隱私保護效果評估指標集
Figure 3 Evalution index set of privacy protection effect of clinical medical data set

表1 臨床醫療數據集隱私保護效果評估評語集定義



由二元對比決策法得到模糊評估矩陣對應的權值向量。


再依據數據隱私差異由二元決策法得到其對應的權值向量。





根據隨機抽取的100條記錄可以認為MIMIC-III數據集隱私保護效果為良,這與MIMIC-III數據集通過模式識別算法移除個人健康受保護信息的實際情況相符。進一步,可以繼續抽取數據集中的記錄進行評估,亦可對其他醫療數據集進行評估,通過所提評估結果擴展計算方法得到更全面的臨床醫療數據隱私保護效果的評估結果。
本文針對網絡環境隱私保護效果評估問題,借助模糊綜合評估方法,將網絡環境隱私保護效果評估由單一數據層面轉向數據全生命周期,從隱私風險來源、隱私類別和隱私保護實施3個方面建立評估指標,通過劃分最小評估單元,分區塊、多層次地進行基于模糊綜合評估的隱私保護效果評估,由數據隱私差異確定各因素、各區塊權重,整合計算得到網絡環境中隱私保護效果評估結果。實例分析表明,所提方法簡便可行,在明確網絡環境整體隱私保護效果的同時,可得到影響隱私保護效果的主要原因,為優化下一步隱私保護具體實施提供理論依據。
[1] CHANG V, SUN G, LI J. Guest editorial: security and privacy for multimedia in the internet of things (IoT)[J]. Multimedia Tools & Applications, 2018:1-2.
[2] SWEENEY L. K-anonymity: a model for protecting privacy[J]. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 2002, 10(5):557-570.
[3] DWORK C, MCSHERRY F, NISSIM K. Calibrating noise to sensitivity in private data analysis[J]. Proceedings of the VLDB Endowment, 2006, 7(8):637-648.
[4] LU Q W, WANG C M, XIONG Y. Personalized privacy-preserving trajectory data publishing[J]. Chinese Journal of Electronics, 2017, 26(2): 285-291.
[5] FUNG B C M , WANG K , YU P S. Top-down specialization for information and privacy preservation[C]//International Conference on Data Engineering. 2005: 205-216.
[6] JIANG H W, ZENG G S, MA H Y. Greedy clustering-anonymity method for privacy preservation of table data-publishing[J]. Journal of Software, 2017,28(2):341–351.
[7] XU J, WANG W, PEI J, et al. Utility-based anonymization using local recoding[C]//Proceedings of the Twelfth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2006.
[8] 李鳳華, 李暉, 賈焰, 等. 隱私計算研究范疇及發展趨勢[J]. 通信學報, 2016, 37(4): 4-14.
LI F H, LI H ,JIA Y, et al. Privacy computing: concept,connotation and its research trend [J]. Journal on Communications, 2016, 37(4): 4-14.
[9] 俞藝涵, 付鈺, 吳曉平. 基于Shannon信息熵與BP神經網絡的隱私數據度量與分級模型[J]. 通信學報, 2018, 39(12): 10-17.
YU Y H,FU Y, WU X P. A metric and classification model for privacy data based on Shannon information entropy and BP neural network[J]. Journal on Communications, 2018, 39(12): 10-17.
[10] JOHNSON A E W, POLLARD T J, LU S, et al. MIMIC-III, a freely accessible critical care database[J]. Scientific Data, 2016, 3: 160035.
Evaluation method of privacy protection effect based on multi-layer fuzzy comprehensive evaluation
YU Yihan1,2, FU Yu2, WU Xiaoping2
1. Flight Simulation Training Center, Navy Aviation University, Huludao 125001, China 2. Naval University of Engineering, Wuhan 430033, China
Aiming at the problem that the evaluation of the privacy protection effect from a single data level cannot describe the overall privacy protection effect of the network environment, with the help of the fuzzy comprehensive evaluation method, the privacy protection effect influencing factors were condensed from the entire life cycle of the data. According to the data privacy differences, the factors and block weights were determined, and the overall calculation results of the overall privacy protection effect of the network environment were obtained. Case analysis shows that the proposed method is feasible and effective.
privacy protection, evaluation of privacy protection effect, fuzzy synthesis, multi-level
s: The National Natural Science Foundation of China(61672531), Cyberspace Security Special Project(SQ2018YFGX210002-04)
TP393
A
10.11959/j.issn.2096?109x.2020082

俞藝涵(1992? ),男,浙江金華人,海軍工程大學博士生,主要研究方向為信息安全、模擬仿真、隱私保護。
付鈺(1982? ),女,湖北武漢人,博士,海軍工程大學副教授,主要研究方向為信息安全風險評估。

吳曉平(1961? ),男,山西新絳人,博士,海軍工程大學教授、博士生導師,主要研究方向為系統分析與決策。
論文引用格式:俞藝涵, 付鈺, 吳曉平. 基于多層模糊綜合評估的隱私保護效果評估方法[J]. 網絡與信息安全學報, 2020, 6(6): 121-127.
YU Y H, FU Y, WU X P. Evaluation method of privacy protection effect based on multi-layer fuzzy comprehensive evaluation[J]. Chinese Journal of Network and Information Security, 2020, 6(6): 121-127.
2020?05?08;
2020?08?20
俞藝涵,chenyike1992@163.com
國家自然科學基金(61672531);網絡空間安全重點專項(SQ2018YFGX210002-04)