鄭香偉
(呼倫貝爾職業技術學院,內蒙古 呼倫貝爾 021000)
隨著計算機技術、互聯網、物聯網的快速發展,以及大量傳感設備的投入使用,催生了海量數據的爆發式增長,尤其是移動互聯網的發展和智能手機的普及,使每個人都成了數據的生產者和使用者。大數據因其蘊含的巨大價值,迅速引起企業、政府、個人的高度重視,并且像國土、能源、人才、技術等資源一樣,成為關乎國家安全、國計民生的戰略資源。
如今,大數據與云計算、人工智能、智能制造等諸多前沿技術結合,融入了政治、經濟、生產、生活各個領域。大數據已經成為維系國家運行、社會發展、企業經營、個人生活不可或缺的基礎要素。大數據因其所具有的價值屬性被他人覬覦而時刻受到安全威脅,數據有多重要,其安全就有多重要,大數據安全甚至上升為很多國家的國家戰略。我國也為保護數據安全,同時也是保障國家、社會和人民安全,出臺了一系列法律法規,為數據安全提供法律和制度保障。即便如此,因數據泄露而為組織和個人帶來的損失每天都在發生。由于保護與威脅數據安全的技術同步發展,要想保障大數據安全,必須從大數據全生命周期各個環節分析、排查安全隱患,并不斷提升安全技術和措施,時刻保持“魔高一尺道高一丈”的競爭優勢。
大數據時代,數據安全除了面臨與傳統信息安全同樣的威脅,還因數據采集、傳輸、存儲、處理、應用等各環節不斷升級的軟硬件技術,數據安全的內涵已得到廣泛擴展,具體包括以下幾方面:①與傳統信息安全、網絡安全一樣,由軟硬件漏洞引起的黑客、木馬病毒等惡意攻擊造成的數據泄露。 ②數據存儲云平臺、數據服務提供商、數據中心等大數據設施的大量建設和投入使用,為數據安全隱患提供了新的場景。 ③在智能設備普及、生物識別技術廣泛應用的情境下,容易帶來數據過渡采集并被非法濫用的風險。 ④在安全技術不足和管理措施不到位的情況下,數據在交互、共享等應用過程中,極易帶來敏感信息泄露等安全隱患。
不同來源的數據存在不同的安全問題,一旦被非法使用,會對不同主體產生危害。從產生數據的主體劃分,大數據的來源主要有個人、企業和政府負責管理的公共設施3個方面。
個人大數據主要來源于個人通過網絡終端與服務端之間的信息交互。當前移動互聯網的迅猛發展,智能移動終端成為個人大數據產生和交互的主要載體。智能手機中安裝的每一款應用都會要求用戶開放不同的權限來獲取用戶數據,同時在注冊的過程中也會要求用戶提供諸如真實姓名、手機號、身份證號、指紋、面部特征等個人敏感信息,否則無法使用。在使用網絡應用的過程中,用戶的每個點擊、每次搜索、瀏覽的每個頁面,甚至聊天記錄、行動軌跡都有可能被記錄和分析,成為個人數據產生的源泉。這些包含了個人敏感信息和日常行為的詳細記錄如果被非法使用,會對個人隱私、人身和財產安全帶來巨大安全隱患。
企業對大數據所蘊含的價值重視程度最高,數據將成為與人力、資本同等重要的企業資源和生產力,對企業的戰略決策、技術創新、產品研發、市場營銷都將起到決定性作用。企業大數據來源可以從企業內部和外部兩個角度來分析。① 在企業內部,工業物聯網將生產設備、工藝流程、物料資源、資金流動、生產信息等整合為一體,使企業成為一個具有感知、決策、資源消耗與價值產出的復雜有機體。數據在企業生產過程中不斷被產生、傳遞、存儲、處理和交互,時刻保障著企業的正常運作。然而,物聯網的應用也為企業數據安全帶來挑戰,網絡上的任何一個設備節點都有可能成為黑客攻擊的入口,進而盜取企業數據,甚至劫持或摧毀網絡設備。另外,設備故障、生產事故、管理漏洞等內部原因導致企業數據損毀丟失,也會給企業運營帶來災難性影響。② 在企業外部,來源于上游供應商、下游用戶的反饋是企業重要的數據資源,決定著企業的生產和銷售決策,尤其對于某些互聯網企業,來自用戶的數據幾乎成為企業生存發展的決定性因素。企業上下游之間的數據傳輸和交互,通常在專網或公網上進行,一方面存在數據被竊取或截獲的外部風險,一方面存在數據本身脫敏不足導致敏感信息泄露的內部風險。
公共大數據主要來源于政府各個部門在實施社會管理過程中產生和收集的數據。這部分數據體量龐大而且來源廣泛,涉及全社會生產、生活的方方面面。可以說,公共大數據是社會真實生活的數字映像,而且隨著技術的發展,這個“映像”將越來越清晰、越來越接近客觀實體。來源于公共管理產生的大數據,如:城市交通、公安監控、地理勘測、環境監測等;來源于收集整理的公共大數據,如:來自企業數據的經濟運行、來自學校數據的教育發展、來自醫院數據的醫療衛生、來自電力石油煤炭企業數據的社會能源消耗與供應等。公共大數據分由不同政府部門收集、管理,各部門在數據傳輸、存儲和交互過程中容易出現技術和管理漏洞。這些數據往往包含著與國家和社會相關的敏感信息,一旦泄露會對國家安全和社會穩定帶來威脅。
多樣、海量、高速變化的大數據已經超出傳統的數據存儲和處理能力,要挖掘大數據的價值,必須采用新的技術。而同步快速發展的云計算為大數據匯集、存儲、分析和處理提供了技術支持,實現了大數據資源的價值開發和利用。在云計算背景下,數據從產生、存儲、分析、交互、應用,直到銷毀全生命周期各個環節都存在安全問題。必須保證每個環節的安全,才能實現大數據的安全。
以個人數據采集和傳輸為例,數據從客戶端發送和接收,一般通過公網與服務端交互,在此過程中會帶來以下數據安全與隱私問題。
3.1.1 完整性問題。在客戶端采集的數據,一般先在本地緩存,然后再整體壓縮、打包進行傳輸。如果傳輸失敗或被中斷,則會造成數據丟失和不完整。即使是同步發送,由于公網傳輸的網絡問題,一般也會產生不可避免的數據丟失,最終導致數據分析結果失去準確性。
3.1.2 隱私性問題。數據在傳輸過程中如果不采取保護措施,可能會被第三方截獲,導致包含用戶隱私的數據泄露。另外,很多應用在安裝時就被要求開放很多隱私權限,過度獲取用戶信息,也容易導致隱私泄露和非法濫用。
3.1.3 準確性問題。數據在傳輸過程中有可能會被惡意第三方劫持、偽造或篡改,常見的“刷票”就是典型的偽造數據行為。數據失去準確性,也就失去了靈魂,使后期的分析結果也不再可信。
當前大數據主要通過云存儲平臺進行保存,通過云計算進行分析處理。數據安全是云存儲平臺的首要問題,是云計算的前提保障。云服務提供商的安全技術和管理水平、軟硬件設備的可靠性、必要的數據容災備份等,都直接關系到用戶的數據安全。從用戶的角度看,一般需要通過用戶名和密碼才能訪問存在云上的數據,必要時還需進行安全驗證,如果用戶對數據沒有進行加密,或密碼被破解,就會出現數據被非法竊取、閱讀、篡改、刪除等風險。
通過數據分析處理才能挖掘出數據蘊含的價值。云計算、人工智能技術在大數據中的應用,大大提高了數據處理能力和效率,能將來自不同系統、不同應用、不同活動的數據進行關聯,從而得出驚人的結果。如:將個人網頁瀏覽記錄、購物記錄、聊天記錄、行動軌跡等各方面信息進行關聯分析,就可以對用戶進行準確的畫像,其中很可能就包含了用戶的敏感信息及隱私。如果這項分析技術被濫用,就會給個人隱私泄露帶來風險,甚至被不法分子用來實施詐騙活動。
大數據的價值不僅僅體現在數據本身,數據的共享、交互能讓數據的價值成倍增長,因此這也成為大數據的重要應用形式。數據在分享、交互過程中,如果沒有提前進行脫敏處理,或脫敏不徹底,將會暴露企業的商業秘密或用戶隱私,為企業經營和個人敏感信息泄露帶來風險。
數據的價值體現在分析處理后的應用。應用存在的主要風險在于對組織或個人敏感及隱私信息的泄露。此類個人信息包括:姓名、年齡、電話、身份證號、銀行賬號、家庭住址、行動軌跡、生物識別信息等;組織機構敏感信息包括:機構名稱、機構領導信息、證照號碼、交易信息、生產決策、技術方案等。在數據處理過程中,根據脫敏規則,將數據中包含的敏感隱私信息進行有效脫敏是防止隱私泄露的重要手段。例如:在當前肆虐的新冠病毒疫情防控過程中,大數據技術起到了重要作用,在官方公布被感染者行動軌跡時,為保護個人隱私,將原來包含患者性別、年齡的信息進一步脫敏,采用“患者1”“患者2”的方式代替,這是社會對個人信息保護意識提升的積極表現。
大數據作為人類社會進入智能時代的開路先鋒,讓那些看似紛繁復雜的數據呈現出多彩的世界,為我們的生活開啟了新的篇章。然而,從數據誕生那一刻起,安全問題就一直伴其成長。數據安全已經成為國家、社會、個人安全的重要組成部分,并且其地位還在不斷提高。面對來自數據全生命周期各環節的安全隱患,我們必須時時警惕、處處小心,做到知己知彼、提前防范,讓數據安全高效地為人類發展服務。