尹潔 馬曉鈺

涂子沛 1973年出生,江西吉安人。華中科技大學計算機學士、中山大學公共管理碩士、卡內基-梅隆大學信息技術科學碩士。2014年回國,出任阿里巴巴集團副總裁。2017年起先后創建涂子沛咨詢、數文明科技等公司。著有《大數據》《數據之巔》《數文明》“大數據三部曲”。
不久前,美國頂尖學術機構聯合發布了一份年度報告,指出在人工智能(AI)領域,美國依然是王者,但中國正以極快速度向前追趕:2016年,中國學者發表的AI論文被引用的次數比2000年提高了44%;2017年,清華大學AI相關專業的學生數量是2010年的16倍。生活中,新科技帶來的變化更比比皆是。數據科學正以前所未有的廣度和深度改變著世界,建立在大數據之上的各種科技產品也在潛移默化地影響我們的生活。
“很多過去由人來完成的工作,現在都交給了機器,而且做得更快、更多、更好?!笨萍甲骷摇⒗锇桶图瘓F原副總裁涂子沛說。他最近出版了新書《數文明》,意即數據革命讓人類社會進入了一個新的文明時代。“那些精細的、微妙的、隱性的,甚至曾經難以捕捉和表述的關系,在今天都可以精準地呈現出來,并為人類所用?!?h3>大數據讓僥幸無所遁形
這是涂子沛關于數據科學的第三本書,前兩本都是他在留美期間寫的,更多是從世界看中國,而開始寫這本書時,他已回國工作3年,更立足于中國的變化。
“我開始重新翻閱中文書籍,特別是古代經典,希望從傳統智慧中獲得啟發。”涂子沛說,寫到量子力學時,他想到陶淵明的詩:“人生無根蒂,飄如陌上塵。分散逐風轉,此已非常身。”這讓他想到,現代人就像城市中的微觀粒子,互相作用,也難以測量。
除了古典書籍,涂子沛也研究了很多當代案例,其中不少是刑事案件。比如2016年告破的甘肅白銀系列殺人案,嫌犯高承勇在1988年到2002年間強奸殺害11名女性,手段極其兇殘。20多年來,警方一直未能抓捕到他,直到“Y—DNA染色體檢驗”技術被應用。Y染色體是父系遺傳基因,可據此圈定一個家族的譜系。當警方獲得高承勇家族一名成員的基因數據后,發現與案犯基因高度相似,于是逐步縮小嫌疑人范圍,最終鎖定了兇手。
無獨有偶,杭州警方也在2016年破獲了一起類似案件。2003年,俞某入室搶劫,連殺三人后潛逃。十幾年后,警方的物證管理系統日趨完善,人像、DNA、指紋、掌紋、足印等數據形成了“物證云”,任何嫌疑人的數據都可以在“云”中與其他數據進行比對。2015年9月,俞某在諸暨一家面館與人爭吵、操刀砍人,當地警方因此提取了他的DNA。不久,杭州警方進行“物證云”的跨市數據比對,突然發現他就是十幾年前滅門案的兇手。
“過去受限于偵查手段,正義常常遲到,但隨著大數據技術的普及,公安領域正迎來一個變革時代。”涂子沛說。在他看來,公安工作正在演變為一項以數據收集、分析為中心的工作。
涂子沛曾經在公安邊防部門工作過8年,擔任過刑事偵查員。他告訴記者,早年沿海鄉鎮的小船只要“犯了事”,船主就會開到其他鄉鎮的海域去作業,以逃避處罰。而現在全省數據已經聯網,就算嫌犯從汕尾跑到汕頭,汕頭的管理人員一查就知道他有前科,逃不掉。
數據的力量正在規范人的行為。據統計,全國公安機關命案現案破案率已經連續5年超過95%;2016年,全國嚴重暴力犯罪案件比2012年下降了43%。研究人員發現,凡是安裝了人臉識別系統的地方,犯罪率就會大幅下降。“人是有僥幸心理的,以為做壞事不會被發現。過去我們只能看到大海波浪的方向,今天則可以看到每一滴水的軌跡。比如在高鐵上霸占座位屢禁不止,現在通過信息記錄可以禁乘高鐵。數據即證據,讓人的僥幸心理受到控制,就此而言,用好大數據,人類社會將邁入一個更加安全的時代?!蓖孔优嬲f。
正因為數據的力量如此強大,它的商業價值成為無數企業競相挖掘的“寶藏”,對于政策制定者來說,加強對大數據的監督和管理就顯得尤為重要和迫切。
2018年3月,全球最大的社交網站臉書被曝出負面新聞:一家名不見經傳的公司——劍橋分析,通過不正當手段在臉書上獲取了8700萬用戶的數據,并用于多個國家選舉中的選民分析,美國總統特朗普也雇用過這家公司,結果引來“數據操縱選舉”的批評。
這些數據看起來并不顯眼,不過是用戶名、用戶所在地、點贊內容等,在網上通常是公開的,分析人員卻可以據此判斷一個人的心理特質、性格特點、潛在需求。一旦掌握這些,利益方就知道如何包裝信息、應該推送給誰,潛移默化地影響一個人的選擇。涂子沛認為,看起來幾乎所有的互聯網服務都是免費的,但使用者其實付出了代價——他們交出了數據。
在廣告行業,大數據的作用更為直接。涂子沛舉例說:“一個電商平臺有100萬用戶,它要推送一款產品的廣告,會設計兩個版本,先給10萬用戶看版本A,假設有1萬人購買;再給另外10萬用戶看版本B,假設有2萬人購買。于是最終推送給所有人的就是版本B?!?p>
2018年8月,陜西省公安交警在一處檢查站進行抓捕演練?!霸谔尤藛T”通過時,人臉核查系統會識別其面部特征,并向指揮中心報警。

部分省份已經設立行人闖紅燈識別曝光臺,能準確抓取、曝光闖紅燈行人的面部。
在實際中,版本數量會更多:標題的長短、語氣的強弱、圖片的顏色……在測試過程中可以不斷優化。要追蹤、對比、調整成百上千個版本,對人類來說很難完成,卻恰恰是大數據技術所擅長的,它可以根據目標受眾心理特質的不同,推送最合適的版本,甚至確定最佳推送時間和推送頻次,即“精準推送”。
除了對用戶的心理入侵外,大數據還被一些商家用于“殺熟客”。比如兩個消費者使用同一款打車軟件,同樣的時間和路線,用蘋果手機的人要比用安卓手機的人多花30%的車費;甚至同一個人登錄某視頻網站,用安卓手機注冊會員,年費178元,而用蘋果手機注冊,價格就變成了218元。
“這就像商場導購看見開好車、穿名牌的客戶進來就報高價一樣?!蓖孔优嬲f,“他們的邏輯是,同一件商品如果馬云來買,當然應該更貴一些?!?/p>
另一種“欺負消費者”的做法是商家聯手拉高價格。2011年,有人在亞馬遜網站上發現,某本普通圖書的標價竟為170萬美元,而且價格還在不斷飆升,一周后達到了2369萬美元的天價。原來,這本書的兩個賣家在使用一種大數據算法定價:如果同行漲價,自己也漲價。但這個程序沒有設置價格上限,結果其中一方微小的上調導致雙方陷入了加價循環,最后攀升到天價。
顯然,這種做法破壞了競爭秩序,而大部分消費者對此一無所知。類似的現象也出現在中國,但到目前為止還沒有算法監管機構,對此類問題難以有效遏制。
新問題的出現是技術進步的副產品,但人類不可能因噎廢食。進入移動互聯網時代后,手機儼然成為人體的一部分,很多人早上第一件事是看手機,晚上最后一件事還是看手機。涂子沛認為未來將是“數據解放人類”的時代。他坦言,人的計算能力是無法與計算機相比的,正如人跑不過汽車,這是人類的自身局限。
“人在圍棋上輸給機器是必然的,但并不代表機器比人聰明。人工智能不可能擁有真正的智慧,它的邊界就是人賦予的規則。人可以不斷創造新規則,卻不可能創造出超越自身智慧的東西??苹秒娪袄锼憩F的機器人造人類的反,是不可能實現的?!?/p>
公式化的、有規律可循的工作,機器可以比人做得更好、更快、更多,但很難從事創造性的工作,比如寫《紅樓夢》那樣的小說。涂子沛認為,人工智能的價值是將人類從重復性工作中解放出來,有更多時間從事更高級的、創造性更強的勞動。
“比如看一些小病,人工智能是可以勝任的。當把癥狀、藥品的數據全部收集起來后,機器人可以進行匹配,跟醫生看病的道理一樣,準確率甚至更高。但萬一看錯了誰負責呢?就像無人駕駛汽車撞了人,是追究汽車公司的責任、軟件公司的責任,還是追究車主的責任?在沒解決這個問題之前,人工智能就沒辦法普及?!?/p>
涂子沛認為,人類未來不僅要在思想觀念上習慣機器做事,還要在法律和制度的層面進行規范。如果人工智能得以普及,人類一周休三天,甚至工作一天休息一天都是可能的。“人工智能說到底是幫我們提高效率的工具。從本質上說,機器人和挖掘機、汽車、飛機的功能差不多,但這就是人類的一種解放?!蓖孔优嬲f。