Chenxi
大數據時代的到來使人的身份被數據化,每個人生活的方方面面都以數據的形式存在于互聯網上。
我們身處一個怎樣的時代?今天你在聊天軟件上聊過天的好友,很可能出現在你的Facebook推薦好友列表里,今天你在自媒體發表的一條消息里有和健身相關的器材,很可能就出現在了流媒體推送廣告里。如果你覺得,這樣的推薦還沒有冒犯到你,看看最近幾年都發生了什么。2016年,Amazon推出了“未下單先調貨計劃”,通過挖掘大數據預測用戶的下單,提前調貨發送至轉運中心,縮短配送時間。2017年,美國征信機構Equifax數據泄露,導致幾乎全美一半人口的個人信息掌握在黑客手中。2018年,劍橋分析公司非法收集Facebook用戶信息。并基于分析結果干預美國大選。
大數據時代的到來使人的身份被數據化,每個人生活的方方面面都以數據的形式存在于互聯網上,社會經濟生活的方方面面正在以更細粒度的數據形式呈現,進而整個社會的“像素”得到顯著的提升,并促進了數字“成像”的發展。在社會活動中,每個人以自組織或者組織的形式參與其中,組織的有機結合形成了可以通過“科學”層面的可能性、程式化和可重復要素的數據算法表達,以及我們越來越傾向于去嘗試“量化”的情感、心理和認知等“藝術”層面要素的表達,這些因素都推動著大數據驅動的管理范式走進我們的視野。盡管大數據所涉及的隱私保護邊界以及支撐大數據的隱私保護技術的發展中所出現的問題已經在風口浪尖,但對其中至關重要的問題的法律表述和技術支撐仍然要經過漫長的演化和推進。
什么是隱私?在具體的界定中,不同文化或個體可能有不同理解。但對個人或組織來說特殊或敏感的不愿意暴露的數據就是隱私,無疑是可以達成共識的隱私概念。從隱私的類型來看,隱私可劃分為:與銀行、金融機構相關的財務隱私,與患者患病和治療相關的醫療隱私,公民在行使投票權利時涉及的政治隱私,使某用戶在互聯網上暴露該用戶自己的信息以及誰能訪問這些信息的互聯網隱私,以及其他數據和信息的保護。我國的個人信息保護法尚在制定中,個人信息權的劃定和保護并沒有可實操的法規來保護。而我們很少了解到我們只有QQ號碼的使用權,我們更無法想象我們的個人信息數據在“黑市”上如何被批發。這些問題可能涉及大數據資源的重新分配。而這并不是相關法律法規制定推進過程中所面臨的唯一問題。
從數據保護技術的角度出發,基于大數據生命周期和大數據架構體系的不同的分類視角,匿名化技術、存儲加密技術、訪問控制權限設定等技術的發展和應用豐富了大數據信息保護的手段。比如,我們并不希望醫院在向疾控中心等研究機構提供疾病預防和決策相關的數據支撐時,泄露病人的隱私,上市公司也并不希望自己發布的財務年報和新產品信息在成為開源信息的時候,因為未經處理而給競對公司可乘之機。這就要求,在數據挖掘的過程中使用數據失真和數據加密技術來挖掘有價值的模式和規律而避免敏感數據的泄露。而在文章一開始描述的我們正面臨的大數據隱私問題,已經暴露了目前的大數據安全防護水平,而對大數據平臺的安全監管也對企業和社會提出了更多機制方面的挑戰。
我們的時代從來不缺乏新的技術,區塊鏈技術將對去中心化大數據交易過程中產生怎樣的影響還沒有完全的探索清楚,但區塊鏈技術在解決價值激勵、安全信任等方面是個有效方法正在得到證實,為改進數據市場相關問題提供了新的思路。然而不能忽略的是區塊鏈技術中數據擁有者對數據流通權限的確認和數據確權,以及共識機制和智能合約等關鍵自身技術中存在的問題,使區塊鏈的應用所可能產生的安全問題仍需要進一步探討。