盧華磊

極客創造并掀起新的商業浪潮。但AI極客敲出的每一行代碼,“喚醒”的每一臺機器卻有可能改變人類未來的路徑。
AlphaGo的出現加速了人們對人工智能(Artificial Intelligence以下簡稱AI)的理解,但AI極客們的野心遠非19行的棋盤可以局囿,他們擁有酷炫的技術和非凡自信,并想以此來改變世界。
美國暢銷書作者、發明家雷.庫茲韋爾(Ray.Kurzweil)在《奇點臨近》一書中為人工智能的出現設定了三個條件:強大的計算能力、海量的知識儲備,最后還需要教會計算機擁有認知能力,通過機器學習技術讓計算機不斷的自行進化。
前兩者已經實現。第三點,如何讓機器擁有認知能力是AI極客們關注的重點。
機器學習是人工智能的核心。機器學習將教會計算機認識現實世界,知道自然界的日升日落、陰晴圓缺,并能理解人類的行為和語言。機器學習的常用領域包括數據挖掘、視覺理解、語音識別和自然語言處理等方面。我們采訪了數位科技公司高層、新銳創業者,他們有一個共同的身份—國內從事機器學習的應用和研發的專家。他們講述了中國人工智能發展的現狀,而一旦科技出現新突破,也預示著新一輪的商業變革。
坐在記者對面,臉龐消瘦的陳運文笑得有些靦腆,言語卻充滿自信,“很多事情都是可以預測的”。
陳運文是國內大數據方面的專家,曾任百度核心技術研發工程師和盛大文學首席數據官。現在他是個創業者,達觀數據創始人兼CEO。他為公司新入職的同事下發了一套題——如何預測泰坦尼克號上的幸存者。整套題通過獲取泰坦尼克號上所有乘客的真實信息,包括性別、年齡、職業、票價、艙位等,然后編寫程序來預測這2000余名乘員中哪些人最終得以生還。
在陳運文眼里,將所有信息加以綜合挖掘,就能夠推演出最終的答案—“705名生還者都可以準確預測。”
預測這樣的事件只是數據挖掘的一個案例,對于極客而言,只要給他們足夠的信息,這個世界就沒有意外和偶然。
現在,陳運文用自己的技術幫助企業進行商業決策。雖然只成立不到半年,但這個隱藏在張江天之驕子公寓里的創業公司已經獲得真格基金和盛大網絡創始人陳大年的投資。
陳運文將第一批客戶瞄準為自媒體人,通過數據分析,為自媒體提供可以引發熱議的話題,并告訴這些作者,什么人喜愛看他們的文章、會關注什么話題。
讓機器自己學會分析信息早就在商業行為中廣泛存在。在百度工作期間,陳運文負責搜索引擎的核心算法研究,主要“為用戶提供最有價值的信息”。 工作的難點不在于搜索信息,而在于讓機器認知用戶的搜索意圖。
用戶經常會在搜索框中輸入“口語詞匯或者模糊的語句”,服務器要從人們的搜索語句中判斷真正的需求。陳運文就需要設計算法讓搜索引擎理解用戶的語義,從數百億的網頁中迅速找到對用戶最有價值的結果。這種“算法”就屬于人工智能。百度每天的搜索有數十億次,每當陳運文改進了算法都能看到用戶點擊的滿意度在上升。
今天這種依靠數據挖掘技術來提高企業運作效率的方法變得更常見,業內將其稱為“商業智能”(Business Intelligence)技術。陳運文計劃將這種技術在云端運用,另一些同類公司則將這種技術直接運用在軟件上。2010年在美國納斯達克上市的Qlik公司就是商業智能軟件的代表企業。他們的QlikView軟件為用戶提供“可視化”的大數據服務。
“我們的軟件可以理解數據,挖掘數據并將其用更直觀的方式展現給客戶,以幫助管理層做出決策。” Qlik亞太區制造業和高科技市場開發總監Jeremy Sim對《財經天下》周刊表述。
這些帶有“預測”功能的軟件已經在服務并改變人們的生活,比如根據顧客的購買信息QlikView會提示便利店店長,售貨架上的麥片不應該和面包擺在一起,雖然它們都是早餐食品,但如果將麥片和酸奶擺在一起,銷售數字會更好看。此類預測還進一步提醒物流部門,盡量地在頭天晚上補足麥片和酸奶貨源。這類商業智能的應用滲入所有人的生活,以這家公司為例,他們已經在全球100多個國家招徠了3.8萬企業客戶,間接服務人群上千萬。
未來這些帶有“智力”的系統將會更多的出現在電商、醫療、教育、金融等領域。“比如隨著智能手環的增加,會有更多的健康數據被采集,那么我們會提供健康預警、治療方案推薦等服務。”陳運文說。現在只是大數據挖掘的初級階段,人工智能時代也才剛剛開啟。
2014年6月,比爾·蓋茨訪華,除了見政商要員外,他還專門造訪了一家剛成立一年的創業公司—格靈深瞳。對于這家初創公司,比爾蓋茨留下了兩句后來被廣泛引用的評語“This is very cool”和“IT界的下一個大事件是計算機視覺(computer vision)與深度學習(deep learning) 的結合”。
格靈深瞳就是這樣一個結合了計算機視覺和深度學習為一身的酷公司。創始人趙勇是致力于視覺理解的知名極客,雖然他本人并不喜歡這個稱謂。
“極客(Geek)在英文里形容書呆子,只會做技術不通世事,但我覺得我是一個懂技術的正常人。”他對《財經天下》周刊說。
趙勇專攻計算機視覺和運算影像學,2009年入職谷歌總部研究院任資深研究員,是谷歌眼鏡項目的骨干。“我們團隊負責谷歌眼鏡的場景識別技術,利用谷歌街景來判斷使用者所處的位置。”簡單地說就是將谷歌眼鏡捕獲的圖像和谷歌街景做比對,然后快速地定位用戶所處位置和周邊信息。谷歌眼鏡可以在500毫米之內將用戶的位置精確到米級別。趙勇說谷歌眼鏡并不是“進化的產品,而是從無到有的突破”。
2013年初,趙勇回國創業成立格靈深瞳,并在三個月后拿到真格基金和聯創策源的聯合天使投資,同年6月格靈深瞳又拿到紅杉資本 A 輪高達數千萬美元的投資。
業內傳播著投資人爭論其未來估值的段子,據說某次飯局上真格基金的徐小平、紅杉資本的沈南鵬和聯創策源的馮波討論格靈深瞳的未來估值,徐小平認為起碼5000億美元,而沈南鵬認為1000億美元,最后馮波折中地認為3000億美元。而現在中國電商巨頭阿里巴巴的市值還不到1900億美元。
受到比爾·蓋茨和投資人如此追捧的原因在于趙勇的研究方向—計算機視覺,這是機器學習中極為復雜的領域。
將趙勇和陳運文做一個對比就可以看出他們研究方向的不同。趙勇認為數據挖掘是讓計算機理解“結構化信息”,結構化指那些人工制作的成型的信息數據,例如一句話一段文字或者一份表格。但計算機視覺需要讓機器理解飄過鏡頭的一片樹葉,或者悄悄走過的一只貓。
陳運文對此也做了比較,他認為數據挖掘更多的是處理文本信息,而文字是具象的表達,機器看到漢字“貓”或者英文“cat”就可以理解這是一種動物,但圖片是抽象信息,給計算機看一張貓的圖片,讓它去理解貓的概念非常困難。
所以當2012年6月谷歌X實驗室宣布他們研發的“谷歌大腦”通過百萬張圖片的學習后可以識別“貓”的時候,全世界都為之震驚。這意味著谷歌培養的這個“孩子”具備視覺理解的能力可以“看圖說話”了。而參與“谷歌大腦”研發的吳恩達博士(Andrew Ng)也因為這個項目被譽為“谷歌大腦之父”,成為機器學習領域最權威的學者。
為了建造“谷歌大腦”,吳恩達使用了神經網絡系統,他們連接了1.6萬片處理器創造了一個擁有10億多條連接的神經網絡,并逐步地培訓這個系統,直到它擁有識圖的能力。
現在,趙勇做的事情與此類似。
他通過影像設備捕捉實時畫面,讓計算機識別這個真實世界,更為直接的說法或許是—趙勇正在研制“機器人之眼”。
像谷歌一樣,想讓計算機能識別圖像,趙勇也需要制作一個“深度神經網絡”系統。
在人腦中有大約1000億個神經元,神經元通過神經突出連接在一起就變成了一個神經網絡,人們思考問題的時候這些神經網絡相互激發,最終產生決策。現在極客們用計算機來模擬這個過程,用計算程序建立起龐大的計算元素,這些程序運算的結果通過網絡互為交換互相影響,最終產生結果,這就是初級的人工神經網絡。人工神經網絡層級越多規模越大,其“聰明程度”就越高,學習的能力就越強。
要培養這樣一個會“識圖的孩子”,趙勇除了要建立這樣一套龐大的神經網絡之外,還需要不停訓練這個網絡。
“可以將神經網絡當成一個黑盒子,我在里面設定了一些基本參數,隨后不停的往里面輸入數據、圖片來訓練它,通過這種大量的訓練,黑盒子里面參數的連接會越來越緊密,整個網絡也會越來越聰明,最終變成一個可以識別圖片的智能系統。”
嚴格地說,人工智能不是人類設計出來的,而是人類訓練出來的。即便是趙勇這樣的創建者也無法知道這些神經網絡到底如何相互作用相互影響,并最終形成自己的智能系統。他能做的只是“選擇輸入數據,控制訓練方向”。
依舊以老師教育孩子做比喻,雖然趙勇這個老師不知道孩子是怎么理解圖片,識別這個世界的,但他可以控制教學的內容,讓這個孩子朝某個方面學習。
趙勇花費了兩年時間才為格靈深瞳培養出自己的“孩子”,并將這些有“識圖能力”的人工智能設備應用到安防監控和汽車識別方面。
去年格靈深瞳推出了名為“晧目”的行為分析儀,這是一個包含軟硬件于一體的智能監控產品。“晧目”會實時監控場景內的情況,發覺異常就立刻報警或者提醒工作人員注意。而在另一個名為“威目”的產品中,格靈深瞳做到了車輛識別,他們訓練系統辨識超過5000種車輛,這幾乎涵蓋了地球上所有的汽車類型。這種能力為警方辦案提供了幫助,警方可以用“以圖搜圖”的方式讓“威目”提供他們需要的視頻資料。“警方提供一張汽車照片,威目在識別照片之后可以從交通錄像中找出該車的行動軌跡。”除此之外,該系統還可以搜索“結構化信息”,例如在系統中輸入2004年生產車牌中含有5這個數字的紅色奧迪A4汽車,“威目”就會在資料中截取相關的圖像或者視頻,而此前這些工作都需要人工完成。
如果計算機視覺技術以這樣的速度繼續,或許用不了幾年,當我們站在攝像頭前時,計算機會在屏幕上敲出那句讓人激動的言語—“I see you .”
“谷歌大腦之父”吳恩達在完成了“認貓”創舉兩年后離開了谷歌,加盟了百度,任職百度首席科學家并負責“百度大腦”的研發。
說服吳恩達做此決定的是他的好友,現任地平線機器人技術CEO的余凱。
余凱是國際知名的機器學習專家,他牽頭成立的百度深度學習研究院是國內第一個研究深度神經網絡的研究機構,加盟百度時被李彥宏稱為“鎮院之寶”。
“深度網絡學習大概起始于2006年,當時主要有5個機構從事這方面的研究,分別是多倫多大學、紐約大學、美國的NEC實驗室、斯坦福大學和蒙特利爾大學,而我當時在NEC實驗室工作。”余凱說。有段時間他還在斯坦福大學執教《人工智能概論》。他領導的團隊在深度學習、圖像識別、文本挖掘、多媒體檢索、視頻監控,人機交互等機器學習領域都有建樹。
去年余凱離開百度,在中關村的創富大廈租賃辦公室成立地平線機器人技術。成立僅4個月,這家公司就迎來了首輪投資,投資方包括晨興資本、高瓴資本、紅杉資本、金沙江創投等多家機構。
比起商業上的追求,余凱更想用技術改變世界—為萬物裝上人工智能的大腦,讓它們變成擁有智能思維的機器人。
在余凱看來,他在百度的工作主要是在“云端”搭建人工智能深度神經網絡,其服務主要體現在“為用戶提供更智能的互聯網服務”,他希望通過人工智能技術應用到物理世界中,讓人們的生活變得更方便和簡單。“現在很多電器都采用軟件結合互聯網操控,我希望未來都可以實現本地人工智能操控。”
他準備讓汽車、空調、冰箱、微波爐等上千種產品或設備都具有從感知到決策的能力。比如用戶進入房間時空調就可以感知人的位置和體溫自動開機送風,并追隨人的移動而改變送風方向;冰箱則會讀取存儲食物的信息,及時提醒用戶食用或補充。
余凱利用深度神經網絡算法來搭建他的人工智能框架。他將這種人工智能系統描述成“類似于安卓的智能硬件的大腦平臺”,這個系統可以安裝在不同的產品中。
他“改造萬物”的計劃先從家居產品和汽車兩個方面著手。地平線機器人技術研發了針對這兩個行業的人工智能操作系統。家居方面的基于深度神經網絡的操作系統名為“安徒生”,汽車的則稱為“雨果”。
現在 “安徒生”已經入駐家電產品,在剛剛過去的上海家博會展上,地平線機器人和某國內知名家電廠商合作的兩款智能產品面世參展。“現在業界最大的智能家居廠商都是我們的客戶,我們向他們提供算法操作系統,并告訴他們如何配置硬件設備,就像安卓向手機廠商提供參考設計一樣。”
下一步余凱準備讓“雨果”進入汽車自動駕駛領域,在安裝了傳感器、處理器和雨果大腦平臺后,汽車可以成為提供無人駕駛或智能駕駛的新型交通工具。
“定義萬物智能的大腦,這還要花很長時間,但是我覺得一步一步往那邊靠近。” 余凱知道地平線機器人的征程漫漫,但對于AlphaGo對戰李世石這樣的人機大戰新聞他卻無比篤定。“賽前幾乎所有專家都說這次機器贏不了,但我在接受網易采訪的時候就公開預測機器會贏,因為我了解AlphaGo的算法。”
陳運文也表達了相同的猜測。3月9日下午,陳運文就興奮地預測AlphaGo能夠獲勝,那時首爾的李世石剛在棋盤上落下自己的第一枚黑子。
3個小時后,對弈到186手時李世石投子推枰宣告認輸。
“機器贏了”,記者給陳運文發了一條微信。
“未來已來”,他這樣回復。