文|劉磊 采訪|劉磊 洪鵠 張卓 陳睿雅 編輯|洪鵠
人工智能先行者
文|劉磊 采訪|劉磊 洪鵠 張卓 陳睿雅 編輯|洪鵠

作為工業界頂尖的人工智能研究者,王海峰的興趣不在想象未來,而在腳踏實地地探索通往未來的路。
他和他的團隊通過互聯網產品影響著數億網民的日常生活,他們正在改變世界。
對人工智能最初的興趣,發生在王海峰先生小學的時候:他迷上了中央電視臺播放的日本動畫片《鐵臂阿童木》。天馬博士因為一場車禍痛失愛子,為了緩解傷痛,博士按照兒子生前的模樣制造了一個機器人—阿童木。這個擁有10萬匹馬力和7種武器的小家伙本領超常,它一邊同各種惡勢力作斗爭,一邊堅持在人類和機器之間搭建友好橋梁。
“我那時候不知道這是科幻故事,還以為是真的?!蓖鹾7寤貞?,他穿一件漿洗得有點舊的藍色襯衫,眼睛很大,這讓他在平靜的時候也表現出一種頗為愉悅的放松感。那年他9歲,對未來的設想是—每個人都會很快擁有一個“可以上天入地的”、屬于自己的阿童木。
很多年以后,當王海峰成為人工智能研究者,加入制造“阿童木”的隊伍時,人們仍然在為“阿童木”是否會出現、到底什么時候出現而爭論不休。王海峰經常遇到對此好奇的人,他們往往會用一種跨越式的方式來提問:“有一天機器人會比人類更強大甚至毀滅人類嗎?”
這個問題的有趣之處在于它引發的分裂。未來學家、科幻迷、對科技一知半解的文藝愛好者們提前感受到了恐懼,他們為機器將具有自由意志的假設所困擾,甚至斯蒂芬·霍金這樣非計算機領域的大科學家也在關心:弗蘭肯斯坦會出現嗎?人類會不會創造出失控于自身的邪惡智能?但當我們用這類問題(“庫茲韋爾認為30年后的2045年,人工智能可能超越人類智能,你怎么看?”)去詢問任何一位人工智能研究者,得到的都是他們好脾氣的、卻令人掃興的回答?!斑@太樂觀了”、“這是未來學”(言下之意不是科學)、“你知道嗎,飛機剛造出來時人們叫它人工鳥,但現在我們不需要擔心它會下蛋”。王海峰的答案溫和一些?!拔視f這個還是很遙遠的,”但他立即又補充了一個熟練的比喻,“現在談論機器人是否會反噬人類,就像今天開始考慮如何在火星上打地基建房子一樣多余?!?/p>
王海峰所從事的人工智能研究是這個時代最時髦的談資之一。人工智能是計算機科學的一個分支,它企圖了解人類智能的實質,并開發出一種能以與人類智能相似方式做出反應的機器智能。1956年夏季,以麥卡賽、明斯基、香農為首的幾個年輕科學家在一場探討機器模擬智能的聚會上第一次提出“人工智能”的概念,被視為這一學科的正式誕生。幾個研究組很快在美國建立起來了,同年一個叫邏輯理論家的程序問世,它能證明羅素《數學原理》中的38個定理。1962年,名為Checkers的西洋跳棋程序先是打敗了它的發明者,繼而打敗了美國一位州跳棋冠軍—Checkers具有學習能力,能在下棋的過程中自動積累經驗,這邁出了機器智能模擬人類學習過程中驚人的一步,“人工智能”這個名詞從這一年開始轟動世界。
但人工智能在接下來幾十年的發展并不如預期。Checkers無法再打敗更高一級的跳棋冠軍,而在其他領域,比如一度被人們寄予巨大期待、認為可以短期實現的機器翻譯,可行性也受到嚴重質疑,發展一度停滯不前。到了1970年代,世界范圍內的人工智能研究已走向低落,那種“強人工智能”概念,即香農他們最初想要實現的有真正推理能力、解決能力,甚至有知覺有自我意識的機器不再被看好,甚至被認為是浮夸的。
狂想曲回到了最初的7個音符之上。令人工智能重新回復生機的驅動力由實驗室里的沖動轉變為工業界的實際需求。而專家系統的出現則實現了人工智能從理論研究到實際應用、從思維規律的探索走向專門知識的巨大轉折。在今天的世界,主流的人工智能意味著它所包含的那些細分領域:自然語言處理、機器翻譯、語音技術、計算機視覺、機器學習(現在很熱的深度學習是機器學習的分支)等。有意思的是,這些領域一方面互相交叉一方面又彼此分裂—所以研究自然語言處理的王海峰會告訴我們,在一些底層的算法上他們會用到譬如機器學習的模型,但同時他也有可能和我們一樣聽不懂一場關于計算機視覺的前沿報告。
當然,大部分好奇于人工智能的人并不會真的對計算機程序里那些復雜枯燥的0、1代碼感興趣。他們談論人工智能,更多的是在談論《她》中擁有迷人聲線的薩曼莎以及《超能陸戰隊》中“萌萌的”大白。
王海峰現在是百度這家中國互聯網巨頭的技術副總裁。浪漫地想象未來,那是科幻迷們的事兒,他要做的是腳踏實地地探索通往未來的路—通過人工智能,幫助更多的人解決他們此刻或不遠的將來需要解決的問題。
這位人工智能科學家顯然對談論自己的產品有更大的熱情。2015年9月8日的百度世界大會上發布的新產品“度秘”就來自王海峰團隊。實體化的“度秘”是一個叫小度的機器人,由一條機器手臂推送到李彥宏面前。當這個白色玩偶般的家伙完成了李彥宏“訂兩杯中份拿鐵”的指令時,臺下掌聲一片。

人物:如果能回到過去改變歷史,你最想改變的是什么?
王海峰:中國歷史上曾經非常發達,但是那個發達以后,那個積累的社會財富很遺憾的是沒有用來去發展科學技術。如果比如說我回到唐朝或者回到什么朝代,我能影響這件事的話我會希望那些社會財富更多是(用來)發展科學技術。
2011年蘋果推出Siri,語音助手從此進入大眾視野。隨后微軟小冰、Google Now也紛紛問世。在互聯網自媒體人羅超看來,“由于智能手機天然具備聽和說的硬件基礎,再加上移動互聯網帶來的語音場景,人們都認為語音助手是時候爆發了”。
但大部分語音助手仍然只是“玩具”。“人們許多時候都在調戲Siri,它的笨拙甚至會激怒用戶惡語相向—不信去看下東北司機怒罵車載語音助手的視頻。語音助手是剛需,但大家都沒有完善的解決方案。”羅超認為。
相對于各類語音助手,“度秘”起碼有兩個新的嘗試。王海峰告訴《人物》,一方面“度秘”可以相對流暢地完成多輪對話,即基于上下文理解用戶意圖—這一點的背后自然是強大的技術支撐。從功能上說,Google Now主要做信息推送,Cortana是用戶手機中的日常事務助理,Facebook M正在小范圍測試預訂餐廳服務,而主打服務的Magic包括國內的“神豬”其實是通過人工處理用戶的語音指令—唯有“度秘”試圖以自動化為主的方式連接人與服務。
面向用戶的“度秘”如今是手機百度里的一個功能,王海峰告訴《人物》,獨立應用也將很快上線—百度的目標是讓這個功能最終嵌進整個移動互聯網。李彥宏也用手機演示了使用“度秘”的過程:他對著麥克風說話,“度秘”先后幫他預約了一家可以帶狗的餐廳,買了三張電影票,找到一家可以看僧帽猴的動物園。
作為中國互聯網用戶長時間以來最習慣的搜索入口,“度秘”的發布,意味著百度將“連接人與服務”作為它新的追求之一。王海峰說,今天的人們差不多忘了我們還曾生活在一個沒有搜索引擎的世界,“3w網址靠手打進地址欄,有人甚至會把網址抄在小本子上”。未來我們回想起今天的手機也會和此時回想沒有搜索引擎的史前世界心情一樣:一個人居然會裝80個應用,3種打車、4種買電影票、6個負責吃飯團購。
這顯然是一種贅余。王海峰認為,人們的生活需要簡化,我們寶貴的時間不應該浪費在“尋找、比較、下單、支付”這些事務性的環節上,“而‘度秘’將會是你的服務引擎”,“不但能幫你找到服務,還能完成它,最終一杯咖啡或兩張電影票直接送到你手中”。2015年上半年,李彥宏提出了百度要做連接3600行的平臺。可以理解為“度秘”和這句話有相同的抱負。
在正式上線之前,“度秘”曾經有過各種各樣的命名,王海峰說,最終確定叫“度秘”是希望它能提供一種“聰明、貼心、定制化的服務”。“好比我告訴我的秘書,明天我要去上海出差了,我只說這么一句,因為他知道我一直以來的喜好,就會幫我訂我喜歡的酒店、習慣的航班,查好天氣,提醒衣著。‘度秘’最終要提供的就是這樣一種個性化的服務,它是有學習能力的,你的使用習慣就是它的學習材料。它會因為你不斷的使用而越來越聰明,越來越了解你。”
8月底王海峰回了一趟哈爾濱老家,和小學同學聚了一場。大家聊起讀書時候的事兒。同學們都說,小時候個個都說要成為科學家,現在只有你真的成了科學家。
王海峰嘿嘿一笑。保持不變對他來說從來不是難事—無論是習慣還是目標。他從小學起每天如鐵律般6點起床,至今如此。“他基本都是第一個到公司的人,每天7點多就來了?!蓖鹾7宓陌俣韧?、自然語言處理部總監吳甜告訴《人物》,以至于保潔阿姨都不得不每天首先打掃他的辦公室。

王海峰出生于一個知識分子家庭,學核物理的父親畢業于清華。他的成長適逢改革開放后70年代末和80年代,重啟科學、信奉科學成為時代精神,以至于王海峰“頭腦中最高大的形象全是科學家”。牛頓、愛迪生到陳景潤、華羅庚,他們的照片掛在中國所有教學樓的走廊里,配以“天才就是1%的靈感加上99%的汗水”這樣耳熟能詳的名言。每天走過這條走廊的王海峰是一個成績好、樸素、正派的小男生,對蘋果樹和發明電燈的故事倒背如流,幻想著自己有一天也可以成為“他們那樣的人”,發明出“對全世界有用的東西”。
王海峰就讀的哈爾濱三中是黑龍江省最好的中學。1984年,鄧小平在上海親昵地摸了一個正在操作電腦的13歲中學生的頭,宣布計算機的普及要從娃娃抓起。這讓王海峰和他精英中學的同學們成了他這代人中罕有的、在1980年代中期就開始接觸電腦的年輕人。那是1986年,他高一,學校有一個機房,班上50個同學每人一臺電腦,但所有的電腦都是沒有硬盤的?!懊看握n上,寫幾段程序,復雜一些的數字運算或者小游戲,運行一下,成功了就很開心。”最大的遺憾是下課關機后,“寫的程序全部消失”,下堂課想用的話,就要重新敲。
王海峰回憶接觸計算機時最初的魅力:“(原來)計算機是這樣的,不是那種小計算器。我們可以寫一些程序,寫一些思想進去,而不是說(只是)算一個數。那個其實印象是很深的?!碑敃r,王海峰的愿望極其簡單,他希望自己寫的程序不要下課關機就全沒了。
1989年他如愿進入哈爾濱工業大學計算機系。其時市場經濟大潮正在到來,國際交流越來越多,而“大家學外語又學得很辛苦”,王海峰想到,機器翻譯會是一個“很多人需要”的研究方向。
事實上1950年代后期,美國和蘇聯出于冷戰需要,一度對機器翻譯大量投入。然而到了1966年,一次英譯俄再譯回英文的機器翻譯鬧了笑話—“心有余而力不足”譯回后變成了“酒是好的肉是壞的”,機器翻譯的“不夠智能”引發了公眾的巨大失望,而美國科學院公布的一份名為《語言與機器》的報告也否定了機器翻譯的可行性,該領域從此一落千丈,之后很長一段時間里發展緩慢。
王海峰從大學四年級進入機器翻譯領域,“一做就是18年”。2010年他離開東芝加入百度,次年6月30日,他主持下的百度翻譯上線,運行一周后,一切穩定?;ヂ摼W上的大數據大大提升了機器翻譯的準確率,而百度作為入口自帶大量用戶的使用和反饋則可以使其進一步完善。王海峰帶團隊去吃了頓慶功宴,席間他忍不住感嘆,“過去一周所獲得的用戶,所服務的用戶,比過去18年的總和還多”。
本科畢業20周年聚會時,王海峰發現,他是全系100多人里唯一一個從事本專業研究工作的人。其他的同學要么轉了行,要么換了研究方向。只有他,讀本科時在研究自然語言處理,如今自然語言處理仍然是他主要的工作領域。
“我做這個領域能取得一些成果也許就是因為我比別人堅持得更久。”王海峰說。他的業務助理趙世奇則告訴我們,他從王海峰身上同時看到了堅持和順勢而為帶來的結果。好比一個人行船,無論風向如何他都沒有停下來的意思,但當順風到來時,他本能地加大馬力,終于抵達了他從出發時就預定好的目的地。
人物:你認為你或者你的團隊能給未來帶來怎樣的變化?
王海峰:人工智能本身未來會涉及到人們生活的方方面面,就像剛才我講起互聯網+、講起3600行。整個人工智能的技術我們會把它應用在互聯網的很多產品,比如說我們現在百度在做的度秘啊、搜索啊這樣的產品,而這些產品本身會影響人們生活的方方面面,每一個人都可能會用到這些產品。所以人工智能通過這些產品其實是會影響每個人的生活,改變每一個人的生活。
人物:你覺得30年后你所在的領域會發生怎樣重大的變化?
王海峰:那個時候肯定會機器變得越來越聰明,但是我倒不認為到那時候機器會取代人了,而是機器會更好地幫助人,跟人協同,機器更擅長的事情機器都幫人完成了,人可以干他更喜歡干的事情。
王海峰解釋自己的經歷時常以“我有一個很樸素的想法”開頭。“我一直說,希望我做的東西能給最多人用?!苯衲甑氖澜缛斯ぶ悄艽髸飨?、香港科技大學計算機系教授楊強很欣賞王海峰這一點:“他是很早就看出來,就是說要創新,不能僅僅寫文章,一定要做出一個真實的系統?!?/p>
這也使得王海峰成為為數不多的同時在工業界和學術界有影響力的人工智能研究者。2013年,王海峰成為國際計算語言學協會(ACL)的第一位華人主席,同時也是ACL 50多年歷史上僅有的兩位來自工業界的主席。研究機器學習的南京大學教授周志華向《人物》評價王海峰:“一位溫和的學者,同時也是一位有前瞻力的高效的管理者,很善于在工業界領導技術團隊取得突破。”
王海峰的職業生涯起點是微軟中國研究院。那是1999年,李開復和張亞勤作為研究院創始人,來到中國到處尋找“最聰明的人”。李開復當時問王海峰,你學了這么多年的自然語言,最想做什么?王海峰的答案是“希望我做的東西讓最多的人用”。“那你來微軟就對了,我們有windows、office這么多的產品,遍及全球?!崩铋_復說。
在微軟干了15年,去年剛剛來到百度擔任總裁的張亞勤對王海峰印象深刻。“他很安靜,但又很有主意。”有的研究員會比較急,“急于證明自己的聰明,急著發論文什么的”,但王海峰很淡定,“十分十分扎實?!?/p>
2010年,王海峰從東芝離職加盟百度,他說后者吸引他的地方在于它所擁有的巨大平臺——海量的數據以及更多的用戶?!案嗟脑牧?,可以讓我的算法發揮到極限。同樣一個算法,原來我只用一臺機器,現在我用幾百幾千甚至上萬臺機器在跑,跑更多的數據,得到的結果是完全不一樣的。”他在講述這些的時候語調平靜卻掩不住當時面臨極大誘惑的興奮感。
王海峰每一個人生節點的選擇都充分理性,遵循的也是一貫的邏輯。這讓他講的故事多少有些過于平實—不像人們對一名人工智能專家期待的那樣酷。但如果我們換一種方式稱呼這些人工智能領域的從業者:工程師、程序員甚至“碼農”,也許就能理解落差因何產生。
王海峰追求影響力,但他從不愿讓自己出面,“有用”的產品是他的武器。世易時移,改變世界的主角已經從浪漫的革命家、深邃的知識分子變成了務實低調的程序員們—這也許是這個時代最為顯著的變化之一。
離開微軟后他在香港曾有過一段短暫的創業經歷,結束后他面臨去海外還是留在香港的選擇。那是2002年,互聯網當然還沒有像今天一樣全方位冒著熱氣,但王海峰預感到了“一種趨勢”—“真正有活力的、發展更快的(地方),是大陸”。
中國大陸越來越確證了他當初的判斷。如今,全球十大互聯網公司只剩中美對峙,而中國占據了四席(阿里、騰訊、百度、京東)。O2O在中國的火熱更是遠超美國——得益于中國的人口密度和城市結構。是這些令“連接人與服務”的“度秘”可以率先在中國誕生。
“我們以前是跟在美國后面的,我們做什么東西也都沒什么自信,基本就是模仿、山寨。但現在不同了,中國社會發展衍生出的很多需要,在美國完全找不到范本。我們早已開始自己創造,并且做得很好?!睆垇喦谡f,“接下來我們就要——其實我們已經開始輸出了?!?/p>
“中國社會比美國發展變化更快,變化會帶來很多不同的東西,這個不同的東西就會導致需要的互聯網技術不同。因為這些(技術)美國并不需要,(因此)百度就會做得比美國更領先?!蓖鹾7逭f。如果說整個中國是世界上最具活力的地方之一,那么他每天方圓10公里的活動區域又是其中的中心:他家住北京中關村一帶,公司所在的西二旗是互聯網公司聚集地,他每天所見的都是正在改變世界的年輕程序員們。王海峰感到自己身處時代的浪潮中心。他喜歡這種感覺—盡管在這家平均年齡只有26歲的互聯網公司里,44歲的他已經成了一個“老人”了。
奧迪說
奧迪A6L:他是全球頂級的人工智能科學家,他的興趣不在想象未來,而在腳踏實地地探討通往未來的路。