劉鐵巖
微軟亞洲研究院是跨界產(chǎn)學(xué)研結(jié)合的特殊性組織,在基礎(chǔ)研究方面,微軟讓人工智能在語音識別、圖像識別、機器翻譯和閱讀理解等方面的能力都實現(xiàn)了質(zhì)的提升。2017年我們成立了微軟亞洲研究院創(chuàng)新會,希望通過微軟的智庫幫助亞太地區(qū)的所有傳統(tǒng)企業(yè)實現(xiàn)數(shù)字化和智能化轉(zhuǎn)型。
實際上人工智能基礎(chǔ)研究和產(chǎn)業(yè)需求之間是有著巨大鴻溝的,我們只有完成最后一公里創(chuàng)新,才能夠把這個鴻溝彌補起來。下面我要和大家展示四個方面的研究工作。
第一個方面是對偶學(xué)習(xí)。對偶學(xué)習(xí)要解決的問題是什么?就是在沒有足夠數(shù)據(jù)、沒有標識數(shù)據(jù)的情況下,人工智能還能不能完成學(xué)習(xí)過程,這是一個非常重要的問題,因為近幾年來,無論是在語音識別、圖像識別、閱讀理解,還是在機器翻譯方面人工智能算法成功的背后必然是大量數(shù)據(jù)的支撐。任何人工智能應(yīng)用領(lǐng)域都要實現(xiàn)雙向交流,比如說在語音領(lǐng)域里,我們既關(guān)心從語音到文字識別的過程,也關(guān)心從語音到文字生成的過程,這樣才能形成一個閉環(huán)的人機交流。依據(jù)這樣的閉環(huán)模式,我們提出了一個對偶學(xué)習(xí)框架,利用信息交流的閉環(huán),即便沒有人工干預(yù),沒有人工標識數(shù)據(jù),也可以獲得有效信息。
以機器翻譯為例,假設(shè)我們有兩個初始模型,可以完成從英文到中文的簡單翻譯,再將翻譯出來的中文轉(zhuǎn)譯成英文,形成閉環(huán)后就可以做兩個比較。第一個比較過程是將翻譯出的中文句子與正確的中文句式的比較,如果不相符的話就說明所使用的翻譯模型是無效的,或者有待提高。……