徐高陽

很難想象“大數(shù)據(jù)”這個詞進入人們的視野至今已經(jīng)過了11個年頭,從2008年9月《自然》雜志推出了名為“大數(shù)據(jù)”的封面專欄后,這一理念就迅速成為了互聯(lián)網(wǎng)技術行業(yè)中的熱門詞匯,仿佛聊天不帶大數(shù)據(jù)就說明你不是個業(yè)內人士。
不止一次在地鐵、咖啡館等公共場所看到幾位身著襯衣、看似一絲不茍的中年男子在高談闊論,其話題總是離不開項目、融資、大數(shù)據(jù)。如今大數(shù)據(jù)在應用上已經(jīng)日漸成熟,它無處不在,應用于各個行業(yè),每個企業(yè)都在積累自己的數(shù)據(jù)庫并將其視若珍寶。
大數(shù)據(jù)在百度百科中的定義是,指無法在一定時間范圍內用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。
這個定義,在很多人看來云里霧里,我們的印象中好像很多公司都叫大數(shù)據(jù)公司,業(yè)務形態(tài)則有幾百種,感覺不是很好理解。在維克托邁爾-舍恩伯格及肯尼斯庫克耶編寫的《大數(shù)據(jù)時代》提到了大數(shù)據(jù)的4個特征:數(shù)量大、價值大、速度快、多樣性。
通俗地講,大數(shù)據(jù)的處理就像提煉“原油”的過程。通過如今的互聯(lián)網(wǎng)和生活中各種渠道,我們能得到海量的數(shù)據(jù),收集數(shù)據(jù)的過程就像是“原油”的采集。得到“原油”后再通過計算機一系列的算法和工具刪去沒用的信息、儲存有用的信息,來進行一系列的分析加工整合,就提煉出了“成品油”,得到有用的數(shù)據(jù),而這些“成品油”則應用在我們生活中的各個領域。
在工作方面,越來越多的公司將以數(shù)據(jù)為驅動進行管理和運營,簡單地說就是數(shù)據(jù)驅動創(chuàng)新(設計和生產(chǎn)環(huán)節(jié))、數(shù)據(jù)驅動管理(人、財、物的管理)、數(shù)據(jù)驅動服務(客戶服務、內部服務)。另外,傳統(tǒng)的工作考核方式將產(chǎn)生較大的變化,從工作量的衡量方式逐漸轉變?yōu)楣ぷ鲀r值的衡量方式,這會從根本上改變人們的工作方式,未來工作方向將以數(shù)據(jù)為指導。

在學習方面,大數(shù)據(jù)帶來了大量的新知識,對于傳統(tǒng)職場人來說,在大數(shù)據(jù)時代需要掌握一系列關于數(shù)據(jù)分析和數(shù)據(jù)管理方面的知識,以保持自身的職場競爭力。對于學生來說,大數(shù)據(jù)更是需要重點學習的內容之一,未來大數(shù)據(jù)技術將逐漸得到落地應用,所以掌握大數(shù)據(jù)相關技術是大數(shù)據(jù)時代的必然要求。
在出行、消費以及娛樂方面,大數(shù)據(jù)將會帶來更多的智能化體驗,大數(shù)據(jù)會對每個人進行針對性的數(shù)據(jù)分析(用戶畫像),匹配出更適合的產(chǎn)品。越來越方便,將是大數(shù)據(jù)時代帶給人們比較明顯的感覺。
大數(shù)據(jù)為生活帶來的便利是有目共睹的。但樂在其中的同時,大數(shù)據(jù)也無時無刻不在“監(jiān)視”著我們的生活。權威專家指出,大數(shù)據(jù)從創(chuàng)造之始就有被泄露的風險,它已被列入2017開放式Web應用程序安全項目十大風險防范項之中。
近幾年,大大小小的網(wǎng)上個人信息泄露事件頻發(fā),信息安全問題比以往任何一個時代都更為突出。越來越多的公民個人信息成為不法分子爭搶的“香餑餑”,要么被直接出賣非法獲利,要么被犯罪分子利用,從事電信詐騙、非法討債甚至綁架勒索等犯罪活動。犯罪分子通過各種途徑收集到人們被泄露出去的隱私,經(jīng)過篩選分析用戶特征,進行精準犯罪。例如在中國安全防范產(chǎn)品行業(yè)協(xié)會發(fā)布的一例案例中,上海某上市公司的總賬會計陳某,被不法分子收集到的信息克隆出公司微信群騙取169萬元,這就是典型的隱私泄露造成的網(wǎng)絡詐騙案件。
隱私泄露對個人所造成的影響畢竟是有限的,但對公司和國家造成的危害則是巨大的。不法分子通過各種途徑收集對方公司的某些重要信息,將信息兜售給其競爭對手從而對公司造成巨大損失,如果是重點行業(yè)的公司機密被泄露那不僅對公司來說是致命的,還會對國家安全造成威脅。例如土耳其5000萬居民信息泄露事件,某黑客攻擊土耳其存放國民身份信息的信息庫,并將導出的信息泄露到公網(wǎng)上,其中包括了土耳其總體埃爾多安的詳細身份信息,這對土耳其國家安全造成了嚴重威脅。
此外,大數(shù)據(jù)還可以做到裹挾用戶思想,改變其三觀,最終引導整個社會朝著某個設計好的方向發(fā)展。例如著名的Facebook用戶隱私泄露案件,其中數(shù)據(jù)研究公司劍橋(Cambridge Analytica)分析利用從Facebook手中獲取到的用戶數(shù)據(jù),分析用戶行為和思維并向用戶精準投放廣告,在用戶接收到的信息中加入影響總統(tǒng)競選的成分,從而潛移默化地影響廣大選民的思想,達到裹挾用戶思想的目的,甚至間接影響美國大選。
在使用智能手機上的App時,我們都習以為常地同意一系列條款,大多時候不會去細看其內容。里面往往隱藏了許多獲取用戶數(shù)據(jù)的條款,雖然沒有到偷偷使用收音和攝像功能監(jiān)控我們生活的地步,但已經(jīng)足夠通過我們在App上的登錄和操作來獲取一些基本的數(shù)據(jù)。
大數(shù)據(jù)殺熟就是基于這些數(shù)據(jù)的一種新時代的利潤創(chuàng)造方式,表面上美其名曰“更好地利用價值曲線”,實質上是違背商業(yè)道德的無恥行徑:“就算我允許監(jiān)測我的行為收集數(shù)據(jù),但并不代表同意你利用這些數(shù)據(jù),如通過對類似顧客分析得出的對價格的低敏感者并暗中修改價格?!?/p>
北京市消費者協(xié)會3月27日發(fā)布“大數(shù)據(jù)殺熟”調查報告,高達56.92%的被調查者表示有過被“大數(shù)據(jù)殺熟”的經(jīng)歷。其中,打車、購物以及酒旅住宿都是重災區(qū)。
2018年,一名網(wǎng)友就在某社區(qū)發(fā)帖稱:“我已經(jīng)是某電商平臺的老客戶了,一時心血來潮,再注冊一個小號,發(fā)現(xiàn)一款自營的電腦椅,名稱是多功能人體工學轉椅,用老號是顯示1399元的價格,但無貨,不可以加入購物車。用小號顯示是預售,可以加入購物車,并可以享受八折優(yōu)惠?!?/p>
據(jù)了解,大部分電商平臺都采用了“千人千面”的展現(xiàn)方式,打開App,每個人看到的商品都不盡相同,價格自然不好比對。平臺方均表示這是利用大數(shù)據(jù),給用戶個性化定制,以便更好地服務客戶。
但“千人千面”的背后,難免會出現(xiàn)給新用戶顯示低價、給老用戶甚至付費用戶顯示高價,對經(jīng)常購買、購買力強的消費者調高價格等“價格歧視”行為,間接實現(xiàn)“大數(shù)據(jù)殺熟”。
在出行打車領域也是如此。據(jù)測試,同時同地打車到同一目的地,滴滴信任值高的人比信任值只有初始分數(shù)的人收費要多出10余元。網(wǎng)約車平臺每次都能給到新用戶以低價、老用戶以“殺熟價”,“大數(shù)據(jù)殺熟”的“精準打擊”可見一斑。
根據(jù)北京消協(xié)的統(tǒng)計數(shù)據(jù),被網(wǎng)約車平臺“大數(shù)據(jù)殺熟”的用戶占比37.17%,而在“前瞻經(jīng)濟學人App”核心用戶群的調查問卷中,遭遇過“大數(shù)據(jù)殺熟”的用戶中有42.86%表示被網(wǎng)約車平臺“殺熟”。
值得注意的是,在多家媒體的采訪中,面對來勢洶洶的“大數(shù)據(jù)殺熟”,都有不少忠實用戶表示,“殺就殺吧,反正也用著習慣了,至少不會騙你”。有的用戶即便懷疑平臺存在殺熟行為,也苦于缺少替代性的產(chǎn)品,不得不睜一只眼閉一只眼,“甘愿”挨平臺的“小刀”。
電話營銷也是同理,在某個網(wǎng)站用手機號注冊之后,接下來一段時間就會不斷收到電話轟炸,“買房嗎?買保險嗎?賣房嗎?”不堪其擾。雖然用手機號注冊了網(wǎng)站的會員,但并沒有任何“默許電話騷擾”的認可成分在內。
但是這些行為很大程度上已經(jīng)在潛移默化中被人們習以為常了。更有甚者,有其他我們并沒有留下電話的機構或者個人打來電話,準確表明了他們對我們身份了如指掌的時候,我們也不會感到過于驚訝,而是會覺得“這又是誰把我的信息出賣了”。
2018年12月31日,創(chuàng)宇盾網(wǎng)站安全輿情監(jiān)測平臺發(fā)現(xiàn),某Twitter賬戶發(fā)布了一條關于超過2億份中國人簡歷數(shù)據(jù)泄露的推文。在他們發(fā)現(xiàn)的這個充滿簡歷的數(shù)據(jù)庫中,包括姓名、電子郵箱、電話、性別、婚姻狀況、政治面貌、工作技能、工作經(jīng)歷等信息一應俱全,雖然在這被公布之后數(shù)據(jù)庫很快被刪除,但有痕跡顯示其中數(shù)據(jù)已經(jīng)被復制了起碼12次之多。與之相關的招聘網(wǎng)站否認了與此次事件相關并表示“這些數(shù)據(jù)是從很多其他招聘網(wǎng)站上爬取的”。
而此前還有高鐵的信息泄露、華住集團住宿記錄的泄露、馬桶MT匿名社交軟件對通訊錄的訪問申請以及被人大點名批評的QQ音樂“對用戶信息的過分要求”。有些是因為黑客的攻擊,還有一些是來自應用軟件貌似合理的申請。
這一切確實令人心生寒意,因為每個人的一切都仿佛赤裸裸地暴露在取得數(shù)據(jù)者面前,而我們正因為無可奈何而對此變得越發(fā)淡然。
在大數(shù)據(jù)時代,也許數(shù)據(jù)的聯(lián)通將會是未來的一種趨勢:通過將更多的信息公開和提供給人工智能,在未來,我們能夠獲得更合理、更加準確的建議,人工智能可能會比我們更加了解我們自己,而前提是,獲得更多的關于我們和身邊的人,甚至所有人的數(shù)據(jù)。然而,在前往這個美好未來的路上,我們無疑還需要經(jīng)過更多的觀念調整和監(jiān)管變更。
據(jù)報道,馬云在某次浙商大會上說,你們知道中國各省份女性的胸圍尺碼嗎?他還賣了個關子,只暗示浙江是排最后幾位的。
馬云引用的是淘寶大數(shù)據(jù)。還有一次,他提問“誰知道哪個省份的比基尼賣得最好”,答案是新疆。馬云調侃是因為遠離大海,新疆小伙能做的最浪漫的事,就是哪天給心愛的人穿上比基尼,到海邊去浪漫一下。馬云的解釋當然是錯的。因為眾所周知的原因,在一些地方人們買比基尼只有上網(wǎng)。
這可能只是一句玩笑,但也說明數(shù)據(jù)掌握者已經(jīng)對我們了如指掌。數(shù)據(jù)泄露更多的是電腦硬盤信息的泄露,比如陳冠希因為修電腦,私密照片泄露導致娛樂圈動蕩,正值事業(yè)巔峰的他宣布永久退出娛樂圈?,F(xiàn)在隨著互聯(lián)網(wǎng)的快速發(fā)展,人類進入了大數(shù)據(jù)時代,成千上萬的信息匯總編輯后,包含了我們的很多隱私,我們無時無刻不在網(wǎng)絡聚光燈下“裸奔”。
大數(shù)據(jù)在我們的生活中早已無孔不入。今天,包括阿里這樣的互聯(lián)網(wǎng)巨頭都號稱自己是數(shù)據(jù)公司,數(shù)據(jù)早已成為一門大生意。隨便一個網(wǎng)站、App,就有可能把我們的姓名、年齡、電話、職業(yè)甚至身份證號、銀行賬戶、實時定位、家庭住址、個人喜好、社交圈子搞到,可見信息泄露已經(jīng)成為常態(tài)。
隨著黑客技術的發(fā)展,各種鏈接、各種App背后可能都暗藏木馬病毒,一不小心點擊進去就會造成個人隱私、重要信息泄露。
對于人口比較集中的區(qū)域,基本都有相關個人隱私信息登記表,一旦這些信息表被別有用心的人掌握,那么所有個人隱私信息都變成了不法分子謀財?shù)墓ぞ?。比如?018年9月7日晚,江蘇常州市公安局陸續(xù)接到常州大學懷德學院部分學生和院方報警:有在校學生身份信息遭到泄露,泄露信息的學生人數(shù)超過2600名。
現(xiàn)在很多商業(yè)網(wǎng)站及機構都有數(shù)據(jù)庫,存儲了大量用戶的個人隱私。據(jù)一份安全報告顯示,在被調查的網(wǎng)站中43.9%存在安全漏洞,一年或有55億條個人隱私信息因這些網(wǎng)站漏洞而泄露,而這些漏洞的修復率竟不足一成。比如2018年10月,F(xiàn)acebook存在漏洞,被曝受到黑客攻擊,近3000萬用戶隱私泄露。
個人信息被泄露的現(xiàn)象早已是司空見慣,買了車,推銷保險的就來了;買了房,裝修中介也知道了。然而為什么會有大量公民個人信息泄露?最大原因就是有利可圖、有機可乘、有法難平。近年來,公民個人信息交易黑市“剛需”旺盛,販賣公民個人信息已形成成熟的產(chǎn)業(yè)鏈。在市場經(jīng)濟和信息社會條件下,公民個人信息已成為一種重要的市場資源。金山軟件首席安全專家李鐵軍曾表示,日常生活中個人信息泄露的現(xiàn)象屢見不鮮,甚至已呈現(xiàn)產(chǎn)業(yè)化趨勢。
由此可見,在這大環(huán)境下,既有源頭,又有市場,自然就滋生一批“鉆空子”的人趁機謀利,由于此類犯罪成本低,獲取公民個人信息無需技術含量,通常為一些部門和行業(yè)從業(yè)人員利用職務便利竊取公民個人信息,央視“3·15”晚會就曾曝光,部分銀行工作人員通過中介向外兜售客戶個人信息將近3000份,造成損失達3000多萬元,說明個人信息泄露已經(jīng)不只是涉及隱私的問題,而是切切實實成為犯罪的“黑洞”。
除此之外,倒賣信息涉及部門已從傳統(tǒng)的工商、銀行、電信、交通、教育、衛(wèi)生等部門,向房產(chǎn)、物業(yè)、保險、郵政、快遞等行業(yè)迅速蔓延。而買賣的信息內容更是無孔不入,可以說是涉及到了個人生活中的方方面面。因此一些培訓、房地產(chǎn)、家裝等行業(yè)的專家,就會利用這些信息挖掘商業(yè)中的潛在客戶,或者實施非法商業(yè)競爭;而一些不法分子則利用這些信息實施電信詐騙、網(wǎng)絡詐騙等,甚至有些直接實施搶劫、敲詐勒索等嚴重暴力犯罪活動;還有的則被某些“調查公司”和“私家偵探”所利用,調查婚姻、非法討債等活動。我們的隱私就在一次次倒賣中變成了別人創(chuàng)造“價值”的工具,而最終買單的只能是我們自己。
數(shù)據(jù)安全涉及每個人的切身利益,如何合理合規(guī)地收集使用大數(shù)據(jù),如何平衡個人信息保護和產(chǎn)業(yè)發(fā)展,成為當下亟待解決的問題。
中國移動法律與監(jiān)管事務部副總經(jīng)理于莽表示:“數(shù)據(jù)的生命周期,包括了數(shù)據(jù)的產(chǎn)生、采集、存儲、流通、應用、銷毀六個環(huán)節(jié),涉及數(shù)據(jù)來源者、數(shù)據(jù)收集者、數(shù)據(jù)控制者、數(shù)據(jù)加工者四種主體角色。”
據(jù)于莽介紹,數(shù)據(jù)來源者也稱數(shù)據(jù)主體,在現(xiàn)實生活中,數(shù)據(jù)來源者并不單一。如在微信系統(tǒng)中,微信號的所有權屬于微信服務商,個人僅享有使用權,因此微信號的數(shù)據(jù)來源者既包括個人和微信服務商;數(shù)據(jù)收集者即記錄數(shù)據(jù)的主體,如各大平臺;數(shù)據(jù)控制者即存儲數(shù)據(jù)主體,不僅包括自行收集并存儲數(shù)據(jù),還包括通過數(shù)據(jù)公開、數(shù)據(jù)分享和數(shù)據(jù)交易等流通行為,從其他主體處取得數(shù)據(jù),成為數(shù)據(jù)控制者的主體;數(shù)據(jù)加工者則指通過數(shù)據(jù)整合、數(shù)據(jù)清洗、數(shù)據(jù)脫敏、數(shù)據(jù)標準化和數(shù)據(jù)建模等手段,有效地聚集和分析數(shù)據(jù),使數(shù)據(jù)產(chǎn)生新價值的主體。
相關專家指出,規(guī)范大數(shù)據(jù)首先要限制數(shù)據(jù)采集。數(shù)據(jù)采集是大數(shù)據(jù)獲取個人信息的源頭,所以要想防止個人信息泄露首先就要限制對于個人信息的采集,這是從根源上來解決問題。
其次應限制數(shù)據(jù)應用邊界。要想防止數(shù)據(jù)泄露,一個重要的基礎是要限制數(shù)據(jù)的應用邊界,這需要通過管理手段和技術手段來聯(lián)合完成。從技術的角度來說,邊緣計算與云計算的結合應用能夠在一定程度上限制數(shù)據(jù)的應用邊界,同時也能夠提升系統(tǒng)的整體響應速度,相信在5G時代邊緣計算將有長足的發(fā)展。另外,當需要進行數(shù)據(jù)交換時,要嚴格遵循數(shù)據(jù)脫敏流程。
新浪互聯(lián)網(wǎng)法律研究院秘書長王磊說:“數(shù)據(jù)商業(yè)化利用要有其規(guī)范,一是應充分尊重用戶,保障個人信息權益;二是數(shù)據(jù)收集和使用應當遵守現(xiàn)有商業(yè)秩序;三是充分尊重平臺在數(shù)據(jù)收集中的權益;四是建立數(shù)據(jù)追溯和共享機制;五是技術中立應當具有合理邊界。”
王磊提出:“大數(shù)據(jù)時代,數(shù)據(jù)的巨大價值逐漸為人所知,這其中尤以個人數(shù)據(jù)的價值為甚。在個人數(shù)據(jù)商業(yè)化利用的鏈條中,數(shù)據(jù)開發(fā)者都希望通過基于個人數(shù)據(jù)而占據(jù)不可替代的優(yōu)勢地位。因此,數(shù)據(jù)開發(fā)者之間關于個人數(shù)據(jù)的獲取和有效流轉,成為個人信息保護和商業(yè)化利用面臨的問題?!?/p>
北京市高級人民法院民三庭法官張玲玲表示:“在大數(shù)據(jù)時代,信息所具有的價值已日漸成為企業(yè)的核心競爭力,愈來愈多的市場主體投入巨資收集、整理和挖掘信息,如果不加節(jié)制地允許市場主體任意使用或利用他人通過巨大投入所獲取的信息,任由技術任性,將形成技術霸權,不利于產(chǎn)業(yè)創(chuàng)新和誠實經(jīng)營,最終損害健康的競爭機制。因此,市場主體在使用他人所獲取的信息時,仍然要遵循公認的商業(yè)道德,在相對合理的范圍內使用?!?/p>
張玲玲同時稱,平臺方應通過用戶協(xié)議或隱私協(xié)議等方式收集用戶信息,明確告知收集的信息內容、目的,堅持“最少必要”原則;第三方通過開放端口Open API獲取數(shù)據(jù),應尊重開發(fā)者協(xié)議,遵守Open API合作開發(fā)模式及數(shù)據(jù)共享規(guī)則。
眾所周知,數(shù)據(jù)財產(chǎn)是大數(shù)據(jù)時代的核心生產(chǎn)要素,那么大數(shù)據(jù)到底是誰的財產(chǎn)?應該受到什么樣的保護呢?對此,中國政法大學傳播法研究中心副主任朱巍認為,帶有可識別性的個人信息不可以商業(yè)化使用。但經(jīng)過分析和處理,用于分析用戶行為、判斷用戶消費能力喜好、做精準廣告的網(wǎng)絡行為信息則屬于大數(shù)據(jù),具有知識產(chǎn)權屬性,哪個公司開發(fā)就歸哪個公司所有。
中國人民大學教授孟雁北建議,在大數(shù)據(jù)權屬確定及行為規(guī)制方面,構建一個更宏觀的整體系統(tǒng)化法律框架體系,以盡可能避免法律和法律之間的沖突,在調整個人信息保護、大數(shù)據(jù)的運用及數(shù)據(jù)規(guī)制上,形成一個相對有機融合的法律體系。
近年來,與大數(shù)據(jù)、個人信息保護相關的法律相繼出臺。2017年6月1日實施的《中華人民共和國網(wǎng)絡安全法》,對個人信息保護提出專門要求;2018年5月1日,國家標準《信息安全技術個人信息安全規(guī)范》實施;個人信息保護法、數(shù)據(jù)安全法被列入人大立法計劃。
對于大數(shù)據(jù)應用的發(fā)展,相關專家建議,規(guī)范數(shù)據(jù)采集行為;規(guī)范數(shù)據(jù)流通與共享行為;落實數(shù)據(jù)安全保障的相關制度;建立網(wǎng)絡安全檢測預警體系;完善網(wǎng)絡安全事件預案,定期進行演練。
要強化法治思維,把握大數(shù)據(jù)應用的發(fā)展方向。在數(shù)據(jù)產(chǎn)業(yè)風起云涌、數(shù)據(jù)立法加快完善、執(zhí)法力度不斷加強的形勢下,守住法律底線、把握監(jiān)管規(guī)律,是落實公司戰(zhàn)略、推動數(shù)據(jù)類業(yè)務有序發(fā)展的重要保障。
在大數(shù)據(jù)法律體系中,數(shù)據(jù)安全、個人信息保護是貫穿收集、存儲、傳輸、處理、使用、銷毀等數(shù)據(jù)全生命周期的兩條紅線。以數(shù)據(jù)安全、個人信息風險防控為重點,配置相應的審核力量,依照不同業(yè)務模式,制訂合同范本和法律風險防范指引,才能保障大數(shù)據(jù)應用健康發(fā)展。
(責任編輯李秀江)