每每講到大數據,我的美國同行,谷歌董事長施密特經常說的一句話是:“在過去兩年,我們生產的數據,是占全部人類文明史上所有數據總和的90%。”也就是說,過去一萬年產生的數據也只占整個數據的10%。
言外之意是,現在數據已經爆炸了,我們要解決的是信息爆炸、數據太多的問題。像百度這樣的公司,在技術上有相當多年的積累,在我們看來,技術已經基本就位;但是我們真正想要的數據現在沒有,或是還沒有搜集上來,已經被搜集上來的數據基本沒有價值。
比如說最近比較火的智能硬件。戴個手環、弄個眼鏡,搜集了很多數據,但把這些數據拿回來之后總覺得用不上,覺得沒法分析。比如戴眼鏡,人平時眼睛能看到的,一天24小時除了閉著眼睡覺之外,把剩下能看到的全部搜集過來,但這些有什么用?我們想來想去,其實是沒有用的。
我覺得下一個方向其實是新數據。就是要思考,什么數據能夠真正幫助人們解決問題。今年4月1日的時候,我們講了一個概念性的產品,就是百度筷搜。很多人問你們什么時候出這個產品,我們想買。實際上,這個東西我們還沒做出來。
但是,這東西確實是代表方向的。當我們說,你有一雙筷子,在你吃飯的時候就能知道這盤菜有沒有用地溝油,或者這個蔬菜是不是重金屬超標了……那么大家就會覺得這個東西太有用了,我想要這個東西。
目前來說,這個數據還沒有,我們還沒有能力收集這些數據。但是這個的確是代表了一個方向,因為你本來天天就在吃飯、本來每天都在用筷子,不像你本來不戴手環你卻戴上了;你本來不戴眼鏡,卻戴了這個很重的東西,這是完全不一樣的。
我本來就干的事,同時幫我收集數據,這些數據可以立刻告訴我一些有價值的信息;或者這些數據也許不會立刻告訴我有哪些信息,立刻告訴我的也不一定有價值,但是,我如果堅持這樣做下去,也許就會有價值。
這樣的不是“快數據”,而是“慢數據”。“慢數據”會對消費者有很大的價值。而這種“慢數據”的收集方法,又不是來自于那些原本不需要戴的東西,一定是平時就在干的事,順便就把這些數據收集上來了。
比如說我天天都要刷牙,我在刷牙的過程中,唾液的情況都是可以接觸到、可以分析的。也許有一種癌癥,就可能會在被現代醫學檢查出來前的五年,通過檢測唾液,持續檢測半年之后就可以知道癌癥可能會發生,這樣的數據如果收集上來,就會非常有價值。
所以我覺得,新一代的數據收集,不管是收集工具也好,或者說數據本身也好,都會有很大的發展。但是這里面,難點并不在于你制造出來一個新型的硬件,而在于能夠找到那個點,找到什么數據對人們是有價值的。
其實在健康方面的大數據也講了很長時間了。比如說,人類的基因測序,過去很多國家花了納稅人很多的錢,搞了這個人類的基因圖譜。現在成本急劇下降,可能花一千美元,用幾天的時間,就能夠把整個人的基因測出來了。理論上來講,這個數據也是可以告訴你,你這個人的身體會發生什么變化、有什么特點、未來會有什么風險。
這種類型的數據,我認為是未來真正有價值的數據,過去不管產生了多少數據,其實都浪費掉了。所以從這個意義來講,現在傳統產業在數據上仍然沒有優勢,互聯網公司目前在數據上也沒有優勢。
所以,這樣的東西,是需要每一個行業以及擁有行業知識、行業經驗的人,來積極擁抱互聯網,來跟互聯網進行結合,才能夠做出來。