杜銀霞 李紅睿
摘?要:本文主要論述了大數據敏感數據的分級,分析了大數據安全需求環境下敏感數據保護技術具體應用。旨在為大數據安全敏感信息的保護提供一些參考建議,提升大數據安全保護有效性。
關鍵詞:大數據安全;敏感數據保護技術;信息泄露
隨著信息技術的發展和信息量的暴增,信息安全保護的需求日益上升,國家為此頒布《網絡安全法》、《電信和互聯網用戶個人信息保護規定》等規定,以保證廣大人民群眾、企業、國家的切身利益。大數據在現如今已經覆蓋了各大網絡平臺,且業務數據全程數據保護狀態。雖然大數據安全保護措施以面向全社會積極開展,但一些敏感數據的保護仍舊存在漏洞,需要進一步完善。研究大數據安全與敏感數據保護技術的應用實踐對于提升大數據平臺的可信度有著重要的意義。
一、大數據敏感數據的分級
大數據敏感數據根據應用場景可劃分為B域系統、O域系統、M域系統和信令、DPI系統四類,按照數據內容可劃分為A、B、C、D四類。A類數據指與用戶身份相關的數據,如可以表明用戶人實體人份、用戶的基本資料、自然人身份、網絡身份等相關的信息。B類數據指與用戶服務閑逛的內容信息,如用戶訂購的服務內容、業務內容等。C類數據是指由用戶服務衍生出來的相關數據,即用戶服務內容發生的應用數據,如消費賬目記錄、服務記錄、訂購記錄、業務往來記錄等。D類信息指企業在運營管理的過程中產生的數據,如企業干禮數據、網絡營運王麗數據、與合作伙伴的合作信息、企業業務信息等。對以上信息進行細分,可分出更多的敏感信息內容,如C1-1信息為消費賬目記錄信息中的一部分具體內容,及具體的賬目服務日記等。這類數據被定義為詳單信息,可對應具體用戶的主叫號碼及歸屬地、被叫號碼及通話時長等字段。
大數據類型較多,常見的有原始數據、脫敏數據、標簽數據、群體數據等,這些大數據的安全與敏感級別不同,因此開放度也不同。其中原始數據屬于安全與敏感度級別最高的數據,其次為脫敏數據,它是指對大數據網絡明天的大數據敏感屬性進行模糊、脫敏、加密、加擾、轉化之后的數據,識別和處理難度較大,需要應用逆向推算、枚舉推算等技術進行分析。脫敏技術是提高大數據安全的重要舉措。要增加大數據的安全性與敏感性,必須對數據進行匿名操作與脫敏處理,按照相關的安全與敏感級別實施分級管理。由此可見大數據敏感數據分級是降低大數據敏感風險的重要方法。
二、敏感數據保護技術的具體應用
(一)數據匿名處理技術
數據匿名處理是大數據安全與敏感保護的處理方法之一,目的是通過用戶匿名來保護信息,降低大數據信息的風險性。常用的匿名方法有等價匿名法、標準識符匿名法、K匿名算法等。等價匿名指采用與數據價值相等的信息對大數據進行個性化的匿名,如采用興趣模型對用戶的興趣進行等價測算,尋找興趣模型與用戶興趣之間的相似性,將其作為等價權值進行大數據樹洞,從而阻斷了根據背景內容識別用戶的途徑,保護了用戶的大數據信息安全。指采用三目運算符、內置函數、匿名函數等度大數據信息進行匿名保護,通過標準運算符代替大數據信息,創建全新的對象語句,保護用戶的服務數據。K匿名算法指通過對大數據信息中引入K匿名算法對大數據進行抽象化、概括化的描述,從而達到保護個人、企業數據因素的目的。K匿名算法往往是將大數據中同一屬性的數據采用K條信息鏈接進行匿名,攻擊者在識別用戶信息是由于大數據屬性范圍變大,因此增加了大數據識別的難度,因此安全性和敏感數據保護程度增強。以上方法在大數據安全與敏感數據保護中可同時應用,通過標簽打碼來消除敏感信息,降低信息泄露的危險系數,通過等價匿名來保護用戶數據,防止數據脫敏保護的過程中發生信息丟失的問題,而K匿名則增加了大數據信息識別和攻擊的難度。
(二)敏感數據清除技術
敏感數據清除也是提高大數據安全的重要方法之一。為了防止大數據使用記錄泄漏,在使用完畢后需要對敏感數據徹底清除。常規的數據清除法攻擊者可對清除數據進行恢復,采用數據覆蓋法利用新數據覆蓋原始數據,之后再采用數據清除軟件清除,就可以徹底清除敏感數據。覆寫技術采用的是二進制數據存儲法,在原始數據上覆蓋上毫無規律的0、1,存儲在硬盤上的原始數據信息編碼就會混亂,破壞了數據文件的完整性。它就好比碎紙機,是最具安全的大數據敏感數據清除法之一。根據敏感數據的保密級別,覆寫技術軟件覆寫常用逐位覆寫、跳位覆寫、隨機覆寫等不同模式,覆寫的次數越多,則敏感數據清除的安全性越高。此外,數據清除還用消磁、盤體銷毀的方式。消磁需要借助消磁機來實現,消磁后的硬盤或磁帶表面磁性顆粒方向發生了改變,數據書序排列也方發生了改變,原有的數據就會失去價值。消磁清除可通過保修進行恢復,敏感數據有一定的恢復概率,盤體銷毀會生產污染。因此覆寫技術是安全性最高的大數據消除技術。
三、結語
綜上所述,大數據平臺數據安全與敏感保護是云技術及其服務創新發展背景下互聯網服務行業面臨的巨大挑戰。在信息時代,大數據每天的產生量難以技術,而數據安全隱患處處存在,影響著大數據平臺的可靠性與新任務,同時也影響著大數據平臺服務企業的競爭優勢。企業為了更加長遠的發展,必須充分利用人工智能技術等對大數據網絡平臺進行數據安全及敏感處理,加強大數據的安全及敏感保護,為用戶提供一個安全的網絡平臺應用環境,切實的保護用戶的利益。只有這樣,才會提升大數據平臺在同行業的競爭力,為平臺吸引越來越多的用戶,提升大數據平臺運營管理的經濟效益,保持平臺更加長遠的生命周期。
參考文獻:
[1]馬曉亭,梁俊榮.大數據環境下圖書館敏感數據保護方法研究[J].圖書館學研究,2016(21):50-55.
[2]馬曉亭.大數據環境下圖書館敏感數據的識別與保護[J].圖書館論壇,2017(04):129-136.
[3]王曉周,喬喆,白雪,王馨裕.大數據安全與敏感數據保護技術應用實踐[J].電信工程技術與標準化,2019(11):60-63+92.
課題來源:河北省教育廳科技處2019年度高等學校科學研究科技-指導項目課題編號:Z2019004