■ 賽迪智庫
隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,個人數(shù)據(jù)、工業(yè)數(shù)據(jù)等快速匯聚成為常態(tài),數(shù)據(jù)泄露、數(shù)據(jù)竊取呈現(xiàn)出高發(fā)態(tài)勢,大數(shù)據(jù)自身面臨的安全風險不斷加大。目前,數(shù)據(jù)泄露頻發(fā),個人大數(shù)據(jù)成為數(shù)據(jù)泄露的重災(zāi)區(qū)。2018年6月,AcFun彈幕視頻網(wǎng)發(fā)公告稱,平臺有800萬-1000萬左右的用戶數(shù)據(jù)被黑客竊取。隨后,該網(wǎng)站用戶數(shù)據(jù)在暗網(wǎng)中被銷售,共計泄露900萬條用戶數(shù)據(jù)。2019年2月,深網(wǎng)視界科技有限公司的MongoDB數(shù)據(jù)庫被發(fā)現(xiàn)未做訪問限制,導致超過250萬人的數(shù)據(jù)可被獲取,數(shù)據(jù)類型包括人臉識別圖像及圖像拍攝地點等。據(jù)統(tǒng)計,2019年第一季度我國累計泄露簡歷數(shù)據(jù)5.9億份,多是我國企業(yè)的MongoDB數(shù)據(jù)庫和ElasticSearch服務(wù)器沒有做訪問限制,或者是防火墻出現(xiàn)錯誤所導致的。
大數(shù)據(jù)清洗、存儲、分析、挖掘相關(guān)的平臺和軟件近年來漏洞頻出,引發(fā)安全風險。Hadoop框架核心組件之一YARN曾被發(fā)現(xiàn)存在信息泄露漏洞,黑客能夠利用該漏洞獲取用戶密碼。我國研究人員發(fā)現(xiàn),一些黑客曾利用Hadoop Yarn資源管理系統(tǒng)REST API未授權(quán)訪問漏洞開展網(wǎng)絡(luò)攻擊。2018年11月,研究人員發(fā)現(xiàn)Apache Spark中存在安全漏洞,攻擊者可通過發(fā)送特制的請求利用該漏洞在服務(wù)器上執(zhí)行惡意代碼。
一是傳統(tǒng)安全防護技術(shù)難以滿足大數(shù)據(jù)時代隱私保護需求。傳統(tǒng)隱私安全保護技術(shù)以匿名化技術(shù)為主,如K匿名、L多樣性等,但相關(guān)技術(shù)在大數(shù)據(jù)挖掘技術(shù)下可能失效,大數(shù)據(jù)挖掘和分析能夠?qū)δ涿麛?shù)據(jù)進行重新識別,引發(fā)隱私安全擔憂。例如,2019年8月,澳大利亞某政府部門將部分匿名化交通數(shù)據(jù)向社會開放,但由于安全風險未做到位,導致交通數(shù)據(jù)經(jīng)分析和挖掘后被重新識別,個人交通出行隱私因此被泄露,給政府部門敲響了開放數(shù)據(jù)風險的警鐘。
二是大數(shù)據(jù)挖掘技術(shù)帶來數(shù)據(jù)濫用風險,如大數(shù)據(jù)殺熟、價格歧視等。攜程等互聯(lián)網(wǎng)公司被質(zhì)疑利用用戶的行為、喜好等數(shù)據(jù),在同一產(chǎn)品上對不同用戶區(qū)別定價,由此引來網(wǎng)友一片聲討;滴滴則被網(wǎng)友發(fā)現(xiàn)存在同一出發(fā)點和目的地,不同賬戶面對的估價不同的現(xiàn)象,因此懷疑滴滴在定價方面存在大數(shù)據(jù)殺熟和價格歧視,滴滴對此回應(yīng)稱估價是實時變化,因此出現(xiàn)該現(xiàn)象。