
博士下海
改革開放之后,國門打開,國人重啟世界視角。了解世界的主要工具是語言,一時間翻譯行業成為熱門,即便當年有開出單字收費的翻譯天價,依然人才難尋,于是機器翻譯來到前臺。
早在1973年,姚天順教授和王寶庫教授就成立了東北大學自然語言處理實驗室。起步初期,在機器翻譯領域的研究成果十分有限。1992年,師從姚天順教授的朱靖波,開始接觸基于規則的機器翻譯方法研究。經過12年的研究、挖掘,朱靖波從恩師手中接過實驗室掌門人的衣缽。姚教授對他說:“我做了一輩子機器翻譯,你做什么都行,千萬別把它給扔了。”帶著這份囑托,他開始了碩士畢業后與機器翻譯相關的第二次創業。他還記得碩士畢業一年后,從沈陽市三好街狹小的出租屋內自己搬著桌子離開的那一天。也是那一天,他決定回到東北大學攻讀博士。
距離那一天轉眼已過8年,拿到接力棒的朱靖波希望能得到一些不同的結果。但事與愿違,技術和市場之間的矛盾依然存在,他無力改變市場,第二次仍以失敗收場。
“浙江人都是天生的商人,在實驗室里,我也一直堅持技術的可用性研究,希望讓科研成果落地,實現全球語言無障礙交流,真正做到頂天立地。”朱靖波坦言,哪怕前兩次創業都失敗了,他仍堅持自己的理念,仍記得老師的囑托。于他而言,下一次的創業一直都在眼前,只差一個全新的契機。當他帶的第一個博士生肖桐從日本學成歸來后,他意識到,契機就是現在。
這次創業與多年前一腔熱血帶來的沖動不同,經歷過失敗的朱靖波不再追求快速落地的結果,他知道,一切都需要時間的沉淀與考驗。在2009年的機器翻譯比賽——CWMT評測上,朱靖波帶領團隊取得了漢英新聞翻譯系統第二名的成績,僅以微小的差距落后于微軟亞洲研究院。
在這次評測大會上,朱靖波注意到,絕大多數參賽單位都在使用英國愛丁堡大學的Moses開源統計機器翻譯系統做優化,但是系統并沒有針對以中文為核心的翻譯任務進行調優,造成許多參賽單位的比賽結果并不理想。據此,他正式宣布,要開發自己的開源機器翻譯系統。他將這個暫未出世的系統命名為NiuTrans,Niu代表東北大學(NEU)、新(new)和老黃牛精神(牛)三重含義,Trans則是translation的縮寫,兩個部分合起來,代表他的實驗室團隊要發揚老黃牛的精神,努力耕耘,打造出最牛的機器翻譯軟件。NiuTrans就是如今廣為人知的小牛翻譯的前身。
2011年,一個個日夜交替后,NiuTrans正式發布第一個開源版本,團隊把包括短語、層次短語、樹到串、串到樹、樹到樹的五個模型都集成到NiuTrans系統中,形成了一個屬于中國人自己的統計機器翻譯系統,前景一片大好。但朱靖波知道,NiuTrans的發展絕對不止于此,這個成果必須找到新的載體落地。
沒錯,朱靖波決定正式開始第三次創業。成本是首先要考慮的問題,人員的選擇也很重要,只有他自己肯定不行,還有選址、購置設備……帶著許許多多的煩惱和對重新創業的擔憂,他在春節回到了浙江老家。飯桌上,他想對3個老同學傾訴多年的憂愁。沒等朱靖波開口,3人搶先發言,詢問朱靖波有沒有什么投資方向。朱靖波的抱怨停在嘴邊,不停拍著他們的背,激動得說不出話,只覺是上天眷顧了苦苦堅持的自己。拿到200萬元投資款,一掃陰霾的朱靖波找到學生肖桐,找到實驗室的同事張春良,又找到前兩次一同創業的伙伴。4位高精尖人才,組成了最初的小牛翻譯。
斗室雄心
沒人能想到,在沈陽信息產業大廈一個小小的會議室內,曾有4位教授為不可知的明天而傾盡全力。小牛翻譯剛剛起步時,4個人擠在20平方米的房間里,對著一塊白板討論尋找市場的辦法。
作為常常泡在實驗室的學者,與人交往并不是他們的強項,甚至可以說是劣勢。執迷于技術的4人,談及理論可以說上一整天,一旦面對客戶或投資商,卻常常集體失語。再加上機器翻譯譯文質量和準確性尚未達到產業化需求,因此小牛翻譯只能成為市場的備選,對于逐利的資本市場來說并不是一個理想的選擇。無論是教授自身的原因,還是技術應用的效果,都無力推動小牛翻譯向前。第一年,公司顆粒無收;第二年,也僅有10萬元營收。
對于一個普通人來說,攢下200萬元,或許需要超過30年時間。但對于一個剛剛起步的技術開發公司,支撐不過兩年。“不甘心,我們都很不甘心。”無法接受如此結果的4人,爭搶著向公司投入自己的工資。工資不夠了,就貸款支撐公司運行。盡管進程艱難,小牛翻譯也堅持對自己的第一個客戶保持原價提供機器翻譯服務。“他們放棄了眾多大廠選擇了我們,此時漲價,反而脫離了本心。”肖桐說。
業績上的實際進展雖然不明顯,但小牛翻譯與東北大學自然語言處理實驗室的機器翻譯技術水平有口皆碑,許多公司仍在觀望其發展,科大訊飛就是其中之一。或許是這份孤勇般的堅持感動上天,或許是技術的優勢在市場占一席之地,2015年底,幾乎已無力支撐的小牛翻譯迎來了一筆來自科大訊飛的注資,重獲生機。
朱靖波還記得,時任科大訊飛研究院副院長胡國平和輪值總裁胡郁在微信上問候他:“缺錢不?”看到消息時,他懸著的心放下了。其實在創辦小牛翻譯的這幾年,他總是問自己:這一次是不是又沖動了?是不是又做錯了?老同事、學生,大家的努力他都看在眼里,但結果總是令他心生愧疚。可他內心的那份執著讓他無法回頭,老師的囑托讓他無法止步。這條消息,仿佛給他堅持的答卷上寫了分數,盡管不是滿分,但他知道自己合格了。
很快,科大訊飛的500萬元注資讓朱靖波和團隊得以解困,投委會的評估令他哭笑不得:“這家公司沒有商業投資價值,但具有戰略技術儲備價值,如果倒閉了比較可惜。”這番話讓朱靖波和團隊意識到轉型的重要性。時代的飛速發展,讓跨境電商、跨境金融等產業進入主流,快速處理多語種語言信息成為這條路上必須跨越的障礙。想要繼續生存,基于統計的機器翻譯二代技術遠遠不夠,被認為是自然語言處理領域“皇冠上的明珠”的機器翻譯必須找到新的落腳點。
其實早在2013年,就有學者提出第三代神經網絡機器翻譯技術。肖桐介紹:“業界普遍認為這一技術到產業化還有8到10年的路要走,我們知道谷歌、微軟都在研究,必須破釜沉舟拼一把。”短短幾周,小牛翻譯把所有內部研發項目砍掉,專注做神經網絡機器翻譯技術研究。次年10月,小牛翻譯成功推出依托神經網絡的機器翻譯服務,成為業內最早推出此類產品的公司,市場也迎來大爆發。
歷經潮起潮落的小牛翻譯嫻熟地馳騁在競爭激烈的市場,一舉拿下科技部科技冬奧項目,為2022年北京冬奧會提供多語種機器翻譯技術支撐。如今,曾經20平方米的會議室變成了兩層現代化辦公樓,肖桐則成為東北大學自然語言處理實驗室第三代掌門人。接力仍在繼續。談起下一段跑道,肖桐說:“我們的終點始終清晰而明確,就是要實現全球語言無障礙交流。和老師一樣,堅持是因為情懷和夢想,不管怎么跑,我們都在一條線上。”