周明
人工智能最重要的分支就是自然語言的理解與處理,即語言智能,通過對詞、句子、篇章進行分析,對內容里面的人物、時間、地點等進行理解,然后在此基礎上,去支持一系列核心技術,比如跨語言的翻譯、問答系統、閱讀理解、知識圖譜等技術,基于這些技術,又可以把它應用到其它應用領域,比如說搜索引擎、客服、金融、新聞等等領域。
總之,就是通過對語言的理解,實現人跟電腦的直接交流,從而實現人跟人更加有效的交流。自然語言技術不是一個獨立的技術,其受云計算、大數據、機器學習、知識圖譜等等各個方面的支撐。
接下來,我將從四個方面介紹自然語言的進展,即神經機器翻譯、聊天機器人、閱讀理解及機器創作。
神經機器翻譯
神經機器翻譯就是模擬人腦的翻譯過程,人在翻譯的時候,首先是理解這句話,然后在腦海里形成對這句話的語義表示,最后再把這個語義表示轉化到另一種語言。
神經機器翻譯有兩個模塊,一個是編碼模塊,把輸入的源語言變成一個中間的語義表示,用一系列的機器的內部狀態來代表,另一個模塊是解碼模塊,根據語義分析的結果,逐詞生成目標語言。
神經機器翻譯在這幾年發展非常迅速,2017 年的研究熱度更是一發不可收拾,現在神經機器翻譯已經取代了統計機器翻譯,成為機器翻譯的主流技術。目前有統計數據表明,在一些傳統的統計機器翻譯難以完成的任務上,神經機器翻譯的性能遠遠超過了統計機器翻譯,而且跟人的標準答案非常接近,甚至說是相仿的水平。……