◆李華恩
(五邑大學計算機學院 廣東 525300)
探討云計算與大數據時代下的隱私與策略
◆李華恩
(五邑大學計算機學院 廣東 525300)
互聯網時代進入了云計算階段加之智能移動設備的推廣普及,人們無時無刻享受著云帶來生活與工作上的便捷與高效。但在享用科技成果的同時,我們也受到了來自大數據對隱私的威脅。本文重點探討云計算時代誕生后對個人用戶信息的變化以及從社會及技術層面嘗試探討如何解決其帶來的負面影響。
隱私; 云計算; 大數據; 安全; 網絡
自從人類進入第三次科技革命時代,電子計算機變得愈發普及,互聯網設備也開始與人們形影不離。人們通過互聯網記錄、交互、分享信息。這里我們將這種自我有意識地將其公開或在某些協議背景下分享給某人的數據稱之為自我數據,而另外一種,是互聯網或商業公司,會在供應于用戶使用的應用程序中收集用戶操作時的行為、習慣、行蹤等數據,它們以此來提高用戶體驗,盡管用戶在使用程序前同意了某些協議,但這更多是一種被迫,而大多數用戶也許根本不清楚自己同意了什么內容,這種人們所沒察覺到,卻被使用的數據我們可以將其稱為忽略數據。放在10年前,自我數據量與忽略數據量或許只有十年后今天的十萬分之一,原因在于計算機時代的初期,無論是計算機的運算能力或者是硬盤的儲存數據量都是極為有限的,但2006年一項技術的推廣與普及,完全將整個局面顛覆,那便是云計算技術。
云計算(Cloud Computing)的組成包含了分布式計算(Distributed Computing)、并行計算(Parallel Computing)、效用計算(Utility Computing)、網絡存儲(Network Storage Technologies)、虛擬化(Virtualization)、負載均衡(Load Balance)、熱備份冗余(High Available)等傳統計算機和網絡技術,我們不妨將上述五種主要組成云計算的傳統網絡技術做個簡化。首先分布計算原理即是將一項工程,分布于整個可利用的大系統中,以最有效率的途徑拆分給各部分系統完成,之后匯總結果,我們可將其視為協同工作; 并行計算,即在處理這項工程時,調用可供其使用的計算機資源來解決復雜的計算任務,我們將其視為云處理能力。網絡存儲,即通過匯聚獨立儲存設備的容量進行統一擴容,資源儲備,我們可將其類比為云記憶能力; 效用計算,即無需用戶或企業組建自己的數據中心,而由網絡存儲內容中資源共享來完成數據中心的職責。
我們再將上述從云計算提取出來這幾項核心部分與人類大腦進行對比??梢园l現,除了缺少“思考”功能,其余每一項對應的恰恰是我們人腦在解決問題時的核心功能。人類只需要將云計算得出的數據協助自己的工作,配合數據操控者的思考能力,一個前所未有的高效率時代——云計算時代便如此降臨。
數據并不是什么高深的專有詞匯,它可謂是人類社會最重要的組成之一,但大數據,卻是云計算時代才得到誕生。根據全球網絡報告,截至2016年全球網民數量已經接近總人口的一半,達到34.2億人口。在以往,無論是超級計算機還是極高容量的存儲設備都是是無法收集、存儲及運算如此龐大的用戶信息,因為無論這些設備再強大,都是個體,但云概念的誕生,它共享與融合的本質,使得整個系統的運算能力與存儲能力得到爆炸式的提高,由此誕生大數據的概念。
大數據涉及的方面十分廣泛,但本文只討論其在互聯網世界中對用戶隱私部分的影響及探討如何解決。上文詳細分析了云計算及其衍生出的大數據時代,我們不妨將這項跨時代的網絡成果的運用推演在一位普通上班族用戶身上,看看會是什么結果。A先生是一位普通的上班族,屬于輕度網絡社交群,網絡購物平臺的多樣性與便捷性使得他的主要購物渠道是線上,乘坐交通工具上下班的A先生習慣在路途中拿起手機,瀏覽了一下更新的微博與當天的新聞動態,在遇到感悟時會社交平臺抒發一下自己的感受?;氐郊液?,洗漱完畢的他開始在瀏覽器上搜索起自己感興趣的詞條,當然其中還包括某些不為人所知的愛好。有時候,在網上找到與自己興趣相投的論壇,A先生會注冊一個該社群的賬號,發帖留下了自己的聯系信息以此認識些志同道合的朋友,但謹慎的A先生也不太希望網絡世界介入自己的生活,所以他也擁有自己的社交小號。
以上便是A先生的一天,可能他的生活代表著以億萬計市民的生活,但在他背后的云計算能將其信息搜集到什么程度?我們不妨一看。
首先,在網購的時候A先生需要填寫自己的收貨信息,其中便包含了他的實名認證手機號碼、常駐住址或公司地址,真名或習慣用的匿名; 而網購平臺也會記錄下A先生所購買產品品種、類別。而在他使用的智能手機中,手機廠商會在默認的情況下開啟定位記錄A先生的位置,以此進行某些服務,在他使用微博與瀏覽新聞的過程中,程序廠商也在記錄著A先生在關注何類話題,關注哪類用戶或在什么內容上停留的時間更久; 當A先生回家使用電腦瀏覽論壇時候,他的IP也會記錄在他駐足的每一個頁面處。
以上便是大概估算下一天中A先生在網絡世界所發送出去的數據量,當然,也可能是你我一天發送出去的數據量,當這些數據從一天延伸到一周,一個月,一年,通過云計算的收集、分析、推演,恐怕不難得出一個比我們自己更為了解的“自己”。
由此可見云時代的來臨,我們每一個人都很難獨善其身,即使你不使用互聯網設備,你身邊的人記錄的點點滴滴也會在大數據的整理下一定程度將你的行蹤暴露。雖然有一些文章與書籍介紹如何盡可能地安全使用互聯網設備,但這些充其量只能使我們的重要信息難以落入陌生黑客的手里,但對于我們日常生活所需軟件背后的互聯網公司而言,我們這些資料數據早已以合同的方式自愿為他們使用。若這些公司將這些用戶大數據運用得當,我們會發現當自己再次打開購物軟件時映入眼簾的全是自己感興趣或即將需要的貨物的優惠頁面,當打開導航軟件,它能準確為什么實時規劃最合理省時的路線; 它們將會化成比自己更了解自己的智能管家,無時無刻推送著我們感興趣的內容,做著最合我們心意的事。但若我們的這些大數據被泄露或被以壞處利用,我們行蹤將無處可逃,它也將會令一個個詐騙劇本在大數據的素材下編織得天衣無縫。
上文在探討云計算與大數據帶來的隱私問題,并不是希望社會否定及杯葛這項跨時代的技術。趨于統一是世界的發展的趨勢,互聯網的誕生恰恰就是將世界聯系在一起,而云計算機則是這項技術的成熟與后續,我們要做的是面對,接下來本文將嘗試從社會責任與技術兩個層面去討論這項技術帶來的問題的策略。
如今,不少用戶會對自己個人信息較為敏感從而不愿意主動提供給軟件服務公司,因此很多公司遮遮掩掩試圖讓用戶忽略式地同意軟件隱私合同。這種做法恰恰令隱私安全問題成為隱患。李克強總理曾在首屆世界互聯網大會上推廣互聯網+的概念,這也意味著國家鼓勵以及重視新時代中互聯網與傳統行業結合發展,其中,云計算下的大數據更是其中不可或缺的一環。互聯網公司不必膽怯,而是應該讓用戶清楚明白在使用此款軟件時需要收錄他們何種資料及數據,他們有權選擇是否使用。在這種人人皆知自己信息要為軟件程序使用的背景下,社會的關注度也會隨之上升,相關法律法規及監督機制也會完善與規范。
Behrouz A.Forouzan曾在其著作《計算機科學導論》關于安全的章節討論過,數據安全的三個目標:機密性、完整性、可用性。
由于篇幅有限,本文中我們主要討論涉及用戶數據私密數據的安全部分即機密性與完整性的改進空間。以現階段技術層面來講,能對數據機密性產生威脅的手段有兩種:嗅探與流量分析。首先討論嗅探,嗅探是指對數據的非授權訪問或偵聽。但不法分子能通過嗅探來獲得用戶資料加以利用的前提是該數據是未經加密或者只做常見的加密處理,據世界互聯網安全大會統計,目前全世界仍然有約百分之二十甚至更多的軟件在傳輸客戶資料數據時不對數據進行任何的加密,這無疑是對用戶資料的不負責任。由此看來,在政策層面要求涉及用戶隱私數據交換分析的軟件公司實施強制性的用戶資料加密處理是很有必要的。
另一種會對數據機密性造成威脅的技術是流量分析,流量分析是指攻擊者通過在線流量進行監控和收集,這種攻擊技術雖然不受數據加密的約束但它只能通過對流量的監控來推斷數據的類型,而對用戶數據內容并沒有窺視與竊取的能力。
第二個重點需要解決的便是數據的完整性,傳統觀點認為數據完整性的攻擊威脅主要在篡改、假冒、重放和抵賴四種方式上。經過對四種方式進行分類討論之后我們不難發現,篡改、重放與抵賴都是基于信息被偵聽的情況下才能發生。結合上述對機密性的討論,由此可見,安全性問題在技術上最根本的研究方向應該是需要一套完善的對數據加密與解密的體系。
目前傳統大企業對于公司內部機密文件采取的是對稱密鑰密碼術。具體地講,假如A公司有一份機密文件‘Am’需要傳送給B公司,首先A公司會將機密文件‘Am’從明文經過加密算法轉換成密文‘SAm’,此時他們通過一個普通信道(該信道并不隱蔽)進行傳輸,之后A公司與B公司便需要另一個安全通道來傳遞解開密文的算法(密鑰),密鑰可能是通過雙方見面的方式遞交也可能通過互相連通的安全信道進行傳遞。誠然,這種方法在安全性與保密性方面都能很好地兼顧,他能幫助公司解決內部文件的傳達。但若要為如今互聯網時代龐大的用戶數據交換選擇一種類似的保護措施,傳統的對稱密鑰密碼術便存在很大的漏洞。首先是人為的安全性問題,密鑰的公式是由某一方的公司所設計,且不說既得利益方會不會出賣密鑰,在傳遞或傳輸的過程不被攔截或竊取就已經很難保證,另一個缺點就是時間效益,畢竟用戶大數據的交換要比公司的機密文件傳達頻繁得多,假如每一次的資料傳輸都要選擇一個安全的信道或者見面傳遞,無疑是經濟與時間上的嚴重浪費。
我們可以嘗試在這種方案上進行改良。在對于需要公司內部或者合作公司之間甚至是公司與國家之間對用戶的隱私數據進行傳輸時,可使用由國家層面的授權機構開發的將明文按照某一隨機規律轉換密鑰,這種轉換密鑰安裝在需要用戶提供資料的軟件接口,所有傳輸的用戶數據都將以密文的形式進行傳遞,而傳遞到目標機構后,再由該機構以某種身份確認的方式(如生物指紋識別、工作卡授權)等向密鑰機構核實身份,由密鑰機構提供對應的密鑰,由于整個過程都是在互聯網層面進行,不僅耗時短,也降低了用戶資料泄露的風險。
在早已進入云計算時代的今天,數據的收集量與分析能力已遠超以往任何一個時代,近年來手機程序愈發智能為人們提供了無限便捷的同時,我們也目睹了越來越多的用戶信息遭受泄露,一個個網絡或電話欺詐案例導致無數家庭損失慘重,這背后若無大數據的分析,單憑騙徒們的花言巧語是不可能達成的。用戶的隱私泄露已經到達一個我們無法想象的程度,但卻沒有多少人愿意正視這個問題,本文是對這個云時代用戶隱私的探討,希望引起更多人的注意,有拋磚引石之用,使得我們在享受技術發展帶來果實的同時也能共同解決雙刃劍帶給社會的傷害。
[1][美]Behrouz,A,Forouzan.計算機科學導論[M].北京:機械工業出版社,2015.
[2]云創大數據.云計算是什么意思 什么是云計算[EB/OL].云創大數據.