
2017年11月30日,在“2017陸家嘴新金融全球峰會”上,紅杉中國專家合伙人,阿里巴巴集團(tuán)原副總裁、首任阿里數(shù)據(jù)委員會會長車品覺于會后接受了《陸家嘴》雜志記者的專訪,講述了他與大數(shù)據(jù)之間的淵源及對于大數(shù)據(jù)行業(yè)現(xiàn)狀和未來發(fā)展的看法。
數(shù)據(jù)的本質(zhì)不在于數(shù)量
《陸家嘴》:你為什么對數(shù)據(jù)感興趣?
車品覺:說起來有些奇特,從小我就很好奇未來。長大以后我便開始探索有沒有一種方法,無論量化與否,能讓我早一點(diǎn)比別人知道這個(gè)世界的未來。
我大學(xué)的畢業(yè)項(xiàng)目是做外匯的預(yù)測,當(dāng)時(shí)連我老師都訝異我為什么要挑選難度那么大的項(xiàng)目,因?yàn)槲业膶I(yè)是計(jì)算機(jī),完全可以選一個(gè)在我能力范圍內(nèi)的項(xiàng)目去做論文,而非超出能力范圍的。但我一直有一個(gè)想法就是只有做自己喜歡的事情才能做好。所以,在大學(xué)期間,通常當(dāng)我的老師布置給我一些編碼任務(wù)的時(shí)候,我只喜歡寫兩種,一種是病毒,另一種是預(yù)測。幸運(yùn)的是,恰好因?yàn)檫@個(gè)畢業(yè)項(xiàng)目我順利拿到了很多人都夢寐以求的匯豐銀行的錄取信。
后來,我離開了匯豐去做產(chǎn)品經(jīng)理。我是一個(gè)沒有數(shù)據(jù)不知道怎么做產(chǎn)品的產(chǎn)品經(jīng)理。從香港電信到MSN到eBay,我都是一進(jìn)去就問數(shù)據(jù)在哪里,而且我在做每一個(gè)項(xiàng)目的時(shí)候都對數(shù)據(jù)布點(diǎn)是十分清楚的。其實(shí)這些都能歸于一點(diǎn),我好奇未來的初心。
《陸家嘴》:你認(rèn)為數(shù)據(jù)的本質(zhì)是什么?
車品覺:在《數(shù)據(jù)的本質(zhì)》一書中,我其實(shí)有講到,首先數(shù)據(jù)不是要大。數(shù)據(jù)更像是一個(gè)拼圖一樣,每個(gè)拼圖都有一個(gè)主題,我們需要根據(jù)場景去判斷你的數(shù)據(jù)到底夠不夠,而不是在于數(shù)量多不多。
這些數(shù)據(jù)有了以后,你就可以開始做數(shù)據(jù)引擎。什么叫做數(shù)據(jù)引擎?用簡單的話來解釋就是,你有一個(gè)任務(wù),這個(gè)任務(wù)會產(chǎn)生更多的數(shù)據(jù),這些數(shù)據(jù)又會幫助你把任務(wù)完成得更好,這樣一來就會形成一個(gè)循環(huán)。然而,不是所有的場景在這個(gè)循環(huán)里都能走得很順利。在這個(gè)循環(huán)里,很可能會有斷點(diǎn),也就是一些數(shù)據(jù)的空白,導(dǎo)致這個(gè)循環(huán)不能順利運(yùn)作。一般來說,斷點(diǎn)越少,循環(huán)越快,
算法優(yōu)化越快。
《陸家嘴》:現(xiàn)在你看到數(shù)據(jù)行業(yè)的哪些問題?
車品覺:現(xiàn)階段,人們已經(jīng)廣泛意識到了數(shù)據(jù)的價(jià)值,因?yàn)橛袃r(jià)值,數(shù)據(jù)本身的保護(hù)在現(xiàn)階段變得特別重要,包括有沒有人為了數(shù)據(jù)的“多”或者造成某種影響在數(shù)據(jù)里面灌水。我覺得整個(gè)數(shù)據(jù)行業(yè)是需要整治的,未來我們將會看到更多的治理機(jī)構(gòu)出現(xiàn)。
另外,人工智能發(fā)展到現(xiàn)在,狹義的人工智能已經(jīng)成功了,因?yàn)樗枰臄?shù)據(jù)量相對比較少,但是當(dāng)擴(kuò)大到廣義的人工智能時(shí),它所需要的數(shù)據(jù)的數(shù)量和質(zhì)量會出現(xiàn)一個(gè)非常大的跨越,這時(shí)大數(shù)據(jù)就需要不斷信息化、被治理。我們非常期待下一個(gè)新科技的出現(xiàn)。
如果你問我未來幾年會看到什么趨勢,我認(rèn)為,未來幾年機(jī)器人將會充斥在這個(gè)世界的不同角落里,只是這些機(jī)器人并非有四肢,而是有著不同的形態(tài)。所以與其說是機(jī)器人,不如說是機(jī)器智能與人之問的交互,在未來幾年一定會大量出現(xiàn)。
數(shù)據(jù)隱私問題尚待解決
《陸家嘴》:哪些行業(yè)可以從大數(shù)據(jù)挖掘中受益?如何從海量數(shù)據(jù)里找到商業(yè)活動中最有價(jià)值的數(shù)據(jù)?
車品覺:總體來說,第一個(gè)是廣告及媒體行業(yè),因?yàn)閺V告和媒體自身的特殊屬性和形態(tài)變化本身就需要更精準(zhǔn)的用戶數(shù)據(jù)群;第二個(gè)是金融行業(yè),金融行業(yè)在識別一個(gè)人的征信方面就像是放款和借貸中的中轉(zhuǎn)站,需要大量的用戶數(shù)據(jù);第三個(gè)是醫(yī)療行業(yè),醫(yī)療行業(yè)應(yīng)該在這幾類行業(yè)當(dāng)中是對人類最有意義的。這并不是說前兩者沒有意義,只是醫(yī)療行業(yè)致力于讓每個(gè)人更長壽、更健康,能讓人活得更有意義;第四個(gè)是政府事務(wù),政府為了提升和改善公共事務(wù)使用大數(shù)據(jù),本質(zhì)上和企業(yè)利用大數(shù)據(jù)提高利潤是同一個(gè)道理。比如說在鐵路修建等方面,大數(shù)據(jù)如何去賦能整個(gè)中國的經(jīng)濟(jì),這一點(diǎn)我覺得是要爆發(fā)的,但是具體在哪個(gè)時(shí)間節(jié)點(diǎn)尚不清楚?!蛾懠易臁罚耗阏J(rèn)為大數(shù)據(jù)時(shí)代下,企業(yè)應(yīng)該如何守護(hù)用戶的隱私?
車品覺:之前我在美國的時(shí)候,見到一個(gè)在隱私問題上給美國總統(tǒng)提意見的專家,當(dāng)時(shí)和他對于這個(gè)問題也進(jìn)行過深入的探討。他說,關(guān)于個(gè)人隱私會有一個(gè)顛覆性的變化,這一變化在歐洲已經(jīng)開始了,現(xiàn)在美國開始緊隨其后。比如說,當(dāng)用戶使用某一個(gè)應(yīng)用時(shí),都會和應(yīng)用方簽訂一個(gè)協(xié)議,表明白己同意將自己的數(shù)據(jù)交給應(yīng)用方來改善用戶體驗(yàn),但大部分人都不知道自己同意的是什么,而僅僅是點(diǎn)擊了“同意”。美國的法律對此準(zhǔn)備有所修改,這可能會改變大數(shù)據(jù)產(chǎn)業(yè)使用數(shù)據(jù)時(shí)的權(quán)利。
互聯(lián)網(wǎng)數(shù)據(jù)分為可識別數(shù)據(jù)和不可識別數(shù)據(jù)兩種類型。有的數(shù)據(jù)能夠識別出來使用主體,有的識別不出來。遇到不可識別數(shù)據(jù)的時(shí)候,你不能完全知道使用主體是誰,也沒有辦法告訴他你是否同意。這是一個(gè)比較頭疼的問題,現(xiàn)在美國正在對這一塊進(jìn)行討論和改善。
還有另一個(gè)問題就是,數(shù)據(jù)的擁有權(quán)在誰手里。之前大家對數(shù)據(jù)擁有權(quán)是用實(shí)物來制定法律,后來發(fā)現(xiàn)這條路行不通。數(shù)據(jù)的奇特之處就是看見就看見了,不在于你拿著還是我拿著。
涉及隱私問題,大部分用戶更多的是希望在隱私和數(shù)據(jù)間找到一個(gè)平衡點(diǎn)。你拿到我的數(shù)據(jù),是需要用一些好處來交換的,數(shù)據(jù)分享是互惠互利的。你用我的數(shù)據(jù)卻不告訴我,這樣是不行的。美國有些法案,個(gè)人數(shù)據(jù)的隱私問題不是放在單獨(dú)的方案當(dāng)中,而是放在行業(yè)里面。為什么放在行業(yè)里面?因?yàn)閭€(gè)人隱私和行業(yè)有關(guān),如果是賣藥品的,個(gè)人隱私的監(jiān)管會非常嚴(yán)格。如果是游戲類的個(gè)人數(shù)據(jù),則會相對簡單一些。而歐洲,整個(gè)法律體系是一樣的,不分行業(yè)。歐洲人認(rèn)為,隱私是一個(gè)人的底線。而美國,認(rèn)為價(jià)值和隱私之間可平衡,在中國,現(xiàn)在這個(gè)問題也越來越受重視。這些都是未來亟待解決的問題。