鄭茂典


很多人出國都用過手機版谷歌離線翻譯,大家不知道的是,當年獨立做出這個系統的工程師,后來從硅谷回國創立了一家人工智能科技公司,而這家公司還被稱為“美國名校收集器”,哈佛、斯坦福、MIT的畢業生紛紛回國投奔。這家公司就是“出門問問”品牌的擁有企業——上海羽扇智信息科技有限公司。
你可以說它出道即巔峰,也可以說它沒有存在感。可越來越多人的生活因它而變。在中國,新車占比四分之一的大眾汽車集團,搭載著它的車載語音交互系統;在新浪新聞App中,AI虛擬主播每天為用戶語音播報當日時訊,背后的技術也是來自于它;疫情期間,你接到的防控登記電話可能是它的語音機器人打來的……
作為科技獨角獸企業的“出門問問”做的不是一種簡單的工具,而是通過技術與應用去構建全新一代人機交互。
2011年iPhone4s搭載Siri語音助手剛剛推向市場,引發了全球移動互聯網尤其是智能語音的創業浪潮。2012年,“出門問問”品牌推出,那時起,“出門問問”就堅信從PC時代到移動互聯網時代,會帶來人機交互方式巨大變化的理念,并致力于開發基于自然語言處理的下一代移動搜索引擎,也就是語音搜索。
在“出門問問”創始人李志飛的理想中,他希望運用前沿技術,能在中國創造一家像谷歌一樣的公司,用技術改變人們的生活方式。
2013年,中文移動語音搜索引擎出門問問App問世,打造出了中國版的GoogleNow。2015年,“出門問問”第一款軟硬結合的中國智能手表TicWatch發布。2016年,問問魔鏡Ticmirror和問問魔眼Ticeye發布。2017年,“出門問問”發布Tichome問問音箱,進軍智能音箱領域。2018年,“出門問問”發布TicPodsFree小問智能耳機。至此,“出門問問”作為一家以語音交互和智能硬件為核心的人工智能公司的產品,在“可穿戴、車載、智能家居”三大領域全面布局。一時間,這家公司成為創投圈競相追捧的閃耀明星。
用前沿科技推動新時代的到來,往往潤物細無聲。對于“出門問問”而言,它在消費端保有一定的知名度,卻被誤以為是智能可穿戴公司。實際上,大眾鮮少看到的企業端市場,才是這家技術型公司“技術實力”的真面貌。
“硬技術”為汽車行業賦能
備受巨頭青睞
智能車載被公認為是語音交互重要的落地場景之一。“我們認為汽車朝智能化的方向發展,語音交互肯定是構建車輛智能閉環的重要一部分。‘出門問問一直是把技術置于場景之中,因為只有在大場景下推動新交互從初生走向成熟,我們才能在其中成為下一代交互的主要推動者。”“出門問問”首席技術官雷欣說。
車載是“出門問問”在企業端領域開辟的第一個落地場景。看到了智慧出行的趨勢后,“出門問問”在2016年開始探索的新業務線,起始于一款帶有語音交互功能的智能車載后視鏡——問問魔鏡。彼時,大眾汽車集團正好也在謀求從傳統的車輛制造商,向車聯網和自動駕駛方面轉型。當他們看到問問魔鏡背后的語音交互技術,最終向“出門問問”出資1.8億美元,并促成了更深度的戰略合作——車載語音合資企業大眾問問的成立。至此,“出門問問”估值超過了10億美金,躋身中國的科技獨角獸企業。
車載交互,冷啟動是最難的。車載系統不能按照消費端思路去做,因為消費端產品很容易做到標準化,但車載系統需要跟車企緊密合作,具體的車型對應到技術參數都有不同的要求,所以這給“出門問問”的技術和落地的復雜性帶來了巨大考驗。“出門問問”團隊投入100多人花了近三年的時間,打磨出一套車載語音解決方案,通過離線+在線的結合保證了最佳交互體驗。離線方案包括全棧式語音交互模塊,特點為CPU及內存占用低,整體小于500MB,并支持可定制喚醒詞、多命令詞監聽、全場景打斷和免熱詞(Always On)等新的交互方式,能夠讓車載語音交互更加自由高效。達到了車規級的語音交互標準和安全要求。
目前,“出門問問”的車載語音交互系統在大眾體系的滲透率達20%,包括奧迪A4L、探岳X、ID系列等20多款車型。預計到2023年,前裝量將達到1500萬輛。
如今,“出門問問”在智慧出行的趨勢下,在嵌入式語音交互領域,已經建立了行業領先的技術優勢和壁壘。
“造釘子”讓研發依附實體
推動技術迭代
科技公司最容易出現的問題是拿著錘子找釘子,在做技術創新時,不能純粹只是造錘子,釘子在哪都不管,需要的是“以終為始”的思考。
在消費端用戶眼中,“出門問問”跟智能可穿戴可以畫等號。因為它做過手表、音箱、耳機在內的一系列消費級產品。但實際上,AI語音技術才是其核心命脈。當然,技術必須要依附于實體產品,才能推動下一代人機交互的到來。
這也就很好解釋,“出門問問”在語音APP后,為何把自研的操作系統TicWear刷到Moto360智能手表里面,又為何會一口氣推出多款產品,因為技術是離不開產品的。“出門問問”做手表及其它硬件,都是為了更好更快地通向下一代人機交互這個終極目標。
同時,“出門問問”也在越來越聚焦。如果把技術看作錘子,落地場景當成釘子,“出門問問”需要聚焦幾個關鍵賽道,強有力地把“釘子”錘進去。例如在智能可穿戴的場景中,“出門問問”圍繞語音交互推出了幫用戶代接電話的小問秘書,讓語音機器人對所有未接電話進行智能接聽并分析來電意圖,解決大量騷擾、重復性電話的問題。
升級后的小問秘書,上線了個性化聲音制作功能,根據“出門問問”的個性化TTS,支持多層級的定制,用戶最少錄入15句人聲音頻內容,即可生成頗像真人的專屬合成效果。這樣一來,用戶就可以用自己的聲音代接來電,避免因AI助理產生的熟人社交隔閡。
在改變人機交互的體驗上,“出門問問”還基于第四代語音合成系統MeetVoice技術,上線了專業AI音頻內容生產一站式解決方案——魔音工坊。用戶能夠高效便捷地以AI語音技術模擬具有清晰性格特征的真人語音,進行AI音頻內容創作,讓文字隨聲音躍出紙面。
目前,用戶可通過點擊新浪新聞App頻道內的音頻圖標,就能收聽海內外各領域的新聞。為了解決配音的專業性問題,“出門問問”對多音字模型進行了升級,多音字整體準確率達到99.52%以上。針對新聞、官方文件、法律條文等,對準確率有著更高要求的文章類型,魔音工坊設計了創新的交互形態,成為AI音頻時代的word編輯器。同時“出門問問”在AI配音、公眾號音頻化、歌唱合成、情感合成等方面也在引領著業界步伐。
“軟實力”支撐技術創新
引領業界步伐
“軟硬結合”是支撐“出門問問”讓創新成果落地的根本。企業創新是需要企業擁有完整的軟件算法團隊和技術積累,同時還要擁有出色的硬件設計、研發團隊,并對供應鏈具備穩定的把控能力。“出門問問”的技術研發團隊現有近300人,以3人為一個開發單位,保持敏捷的開發流程。工程技術方面,也以谷歌規范為標準,保持自由的硅谷工程師氛圍。
基于技術硬實力和人才軟實力,“出門問問”多年來在已有的成果上堅持迭代優化AI語音技術,不斷地提升核心技術壁壘。在不同硬件及不同的場景里參與進去,其實反而讓成果在面對企業端的需求的時候,具備了多方面的能力,能夠快速地去解決問題,提升生產力。
在雷欣看來,技術人員應該把手插進土里去,推動和促進產業向人機交互的方向發展,所以“敢干、愿意干”是“出門問問”培養人才的重要的條件。
“雖然過去10年道阻且長,但我們收獲很多成果。我覺得做技術公司最幸福的,不是拿一個技術直接變現,而是看著我們的技術越來越強,越來越普世化,技術在更多場景和領域得到應用,這是一個滿足感不斷提升的過程。”雷欣說。