
朱勝收藏了庫布里克執(zhí)導(dǎo)的全套電影。其中一部《2001:A Space Odssey》(中文譯名《2001太空漫游》),講述了探索太空奧秘的故事。太空飛船上的超級智能計算機“Hal”讓所有人印象深刻,它可以聽懂人類的語言,有自主行動的能力,而且還有類似于人類的感情,會憤怒也會耍詭計。朱勝認為,Hal象征著人類對“人工智能”(Artificial Intelligence)最早的憧憬。
他創(chuàng)業(yè)七年,一直圍繞著人工智能轉(zhuǎn)。中國科技大學(xué)畢業(yè),又于1997年碩士畢業(yè)于斯坦福大學(xué)計算機系的朱勝,留在硅谷工作期間,就看到了美國人對人工智能的追求。2004年他回國創(chuàng)業(yè),上海智問軟件技術(shù)有限公司(下簡稱“智問”)是他的第二家公司,剛剛獲得了蘇創(chuàng)投等機構(gòu)的1000萬元投資。
2011年底,蘋果iPhone 4S上的語音功能軟件Siri出現(xiàn),此時他正在埋頭攻克“語音識別”這一關(guān)。“人工智能世界研究了60年,一直沒有爆發(fā)行業(yè)。Siri喚起了人們的激情:朝著人工智能這個最終方向,還是有可行性的。”
Siri只是引路者
Siri是蘋果在iPhone 4S上加入的一項語音控制功能,可以提供對話式的應(yīng)答,通過手機讀短信、介紹餐廳、詢問天氣,或調(diào)用系統(tǒng)自帶的天氣預(yù)報、日程安排等應(yīng)用。為此,朱勝仔細分析過:Siri是第一個全球大范圍商業(yè)化實施的人工智能應(yīng)用,也是一個巧妙的切入點——它只做手機上的應(yīng)用控制,如打電話、發(fā)短信、找周邊餐館和旅店,本身并不復(fù)雜,很容易實現(xiàn)。
不過,他并不想成為又一個Siri。2005年他第一次創(chuàng)業(yè),項目是企業(yè)智能管理,利用文字識別技術(shù)建立內(nèi)部知識庫,軟件面向美國企業(yè);2008年金融危機,他把市場轉(zhuǎn)向國內(nèi),開始為國內(nèi)公司做語義分析服務(wù)。他的客戶是當時正在茁壯成長的一批中國公司:電商類如淘寶、當當,服務(wù)類有如家、攜程、7天。智問為它們提供客服機器人,例如淘寶的“淘小二”,當當?shù)摹靶‘敭敗保瑓f(xié)助內(nèi)部客服與坐席人員處理客服問題。
坐在后臺,看著智問出品的客服機器人一個個上線,他得到了另一個啟發(fā):在中國,很多人的生活都很空閑,“簡直是花大量時間‘泡’淘小二”!
直到2011年,客戶建議,現(xiàn)在移動互聯(lián)網(wǎng)這么火爆,能不能出一些手機版本?其中有人還提到了對語音的識別。
他馬上著手研發(fā)。Siri雖然有劃時代的意義,但是被罵得很兇,因為回答無法臻于完美,老百姓的胃口被吊起來了,期望值又出奇地高。沿著這個邏輯,朱勝找到了兩個出路:走“高精尖”路線,把語義識別做到更好;另一條路,將“擬人化”與“個性化”結(jié)合,把它變成平臺或工具,開放給所有人,給每個人定制一個Siri。
實際上,Siri會將一些知識性問題推給語義搜索引擎Wolfram Alpha,它是朱勝心中語義識別技術(shù)的頂級高手,但都難以做到完美。所以他選擇了第二條路——讓每個人擁有適合自己的Siri。他在網(wǎng)站宣傳頁上寫道:“定制太貴,編輯太難。”智問已有的技術(shù)、系統(tǒng)以及知識庫可以支撐這種開發(fā)。
新產(chǎn)品即將以移動端App的形式上線。它首先會滿足蘋果帶起來的各種基礎(chǔ)功能,然后通過機主的配置以及日積月累的問答行為來推斷機主的提問方式、使用習(xí)慣,甚至識別音調(diào)并感知情緒。頁面打開,機主可以看到自己感興趣的10件事情,例如炒股的主人對手機喊聲“看股票”,就可以看到自己手里的那幾只股票。為了避免隱私問題,智問堅持不抓取信息,只做被動接收。
產(chǎn)品的很多特征脫離了人工智能最忠實的追隨者——美國人的風(fēng)格,而是完全中國化。外國人喜歡簡潔頁面,提問嚴肅,就事論事;中國人酷愛逗貧,喜歡鮮明對比的顏色。智問的機器人取名“笨笨”,是個小孩的聲音,不是Siri的“成熟女性”。它除了幫忙還會為機主找流行歌,如果你無聊時和笨笨打趣“有沒有打醬油的歌”,它會直接回答你“慢走”。
一系列部署還沒有結(jié)束。智問會與垂直內(nèi)容提供商,例如論壇版主等進行合作,做成具有語音識別功能的推廣App。智問的技術(shù)可以用于眾多領(lǐng)域,而這本身也在幫助智問積累知識庫。
“我們離Siri越來越遠了。我希望做全方位服務(wù),Siri來開頭,我們來結(jié)尾。”
堅持做“技術(shù)提供商”
目前智問擁有三塊業(yè)務(wù):智能客服,手機助理和語義開放平臺。智能客服是盈利重點,客戶可以“領(lǐng)養(yǎng)”一個自己的機器人,其中嵌入一部分同行業(yè)積累的通用信息;下一步相當于“二次開發(fā)”,智問將其稱作“培訓(xùn)”,即讓客服人員不停地在上面自問自答,或者提問給系統(tǒng),有錯誤再更正,組成一系列問答形式的知識條。朱勝記得,當當網(wǎng)在兩周時間內(nèi)就把“小當當”快速培訓(xùn)完畢上線,里面囊括了上萬個問題。
除智能客服之外,與一些定制產(chǎn)品合作方如電信的分成、平臺軟件服務(wù)方等都可以提供收入,面向大眾的App只要擁有流量,還可以通過廣告來變現(xiàn)。
不過,此時Siri的追隨者已經(jīng)跟過來了。在2012年創(chuàng)新中國上海分賽上,共有三家語音識別類企業(yè)同場角逐。
大家各自戰(zhàn)略不同,但現(xiàn)階段都在做技術(shù)儲備。“長久來看,我們是個技術(shù)提供商,有自己的收入,短期內(nèi)利潤不太高,”朱勝對自己在行業(yè)中的角色很重視,“如果只是做某個應(yīng)用,會發(fā)現(xiàn)騰訊懸在上面,一旦微信模仿Siri,大家的技術(shù)即使再超越Siri也無處可用;用戶體驗看似是門檻,但這東西又是沒有壁壘的。”
蘋果的確給了大家最好的時機。“我不會花1億美元做推廣,而蘋果花了幾億。”朱勝看過一個美國脫口秀欄目,主持人手持蘋果手機,問Siri“今天天氣怎樣”,Siri回答“你這個蠢貨,看看窗外就知道了”。
“其實Siri不會這么回答,明顯是蘋果請節(jié)目來炒作的,你知道蘋果公司有多聰明了吧?我越發(fā)堅信我們的運氣不錯,方向找對了。”
在攻克文字與語音識別的同時,他也完成了對“語義識別”的過渡。這不僅是抽取“關(guān)鍵詞”,而是判斷出對方的問法,例如省略、倒裝等,舉一反三地解答、追問或聯(lián)想。它就像各類識別的地基:懂得語義后,所有服務(wù)將跨越一層臺階。
“它的原理很符合一個詞——知識。‘知’是Knowing,知道答案;‘識’是Recognition,不知道答案,但知道你問的是什么。這很重要。為了達到語義識別,我們需要用‘識’來把‘知’整理好。”他認為這個過程很難,需要反復(fù)去粗取精,“我把它稱為‘雞尾酒技術(shù)’。”
“語義識別”技術(shù)繼續(xù)往前延伸將達到“語義搜索”,谷歌正在研發(fā)中。通過這項技術(shù),谷歌將向用戶提供“猜測的”搜索結(jié)果,如果搜索一個城市,會將城市形態(tài)、特征、發(fā)展歷史直接顯示出來。“那將需要建立更大的、非結(jié)構(gòu)化的庫,打復(fù)雜的標簽,花很多時間去整理,這就是所謂的Web3.0。有一天它會融入日常生活中。”朱勝說。