鄧曉蕾
近幾年,人工智能的發展和應用日新月異,智能汽車、智能家居、智能機器人,人們對人工智能的潛力和應用有了越來越高的期待。
人工智能的一個重要部分是認知智能,包括理解、運用語言的能力,掌握知識、運用知識的能力,以及在語言和知識基礎上的推理能力。認識智能又主要集中體現為語言智能(即自然語言處理)。業界把自然語言理解稱為人工智能這頂皇冠上的一顆明珠。因為,只有通過自然語言理解,才能實現機器智能與人類智能的無縫對接,實現真正意義上的人工智能。
7月23日,由中國計算機學會和中國中文信息學會共同主辦的第二屆語言與智能高峰論壇在北京召開,本屆論壇主題為“語言理解與人工智能”。論壇共吸引了來自國內外學術界、產業界從事自然語言處理與人工智能技術研究的570余人參加,共同探討語言與智能技術的新進展和新趨勢。
中國計算機學會理事長、中國工程院院士、ACM/IEEE Fellow、北京大學高文教授以《視覺圖靈測試》為主題的報告,提出了新穎的基于圖像理解的視覺圖靈測試問題,該問題將自然語言處理和計算機視覺相結合,是人工智能未來發展的一個重要方向和前沿問題。他表示:“圖靈測試的本質是考察機器對人的智能模仿程度是否達到完美,因此將問題僅僅局限在自然語言范疇顯然不全面。我們試圖把圖靈測試的問題內容從純自然語言交互,拓展到視覺內容交互問答。”高文的報告還具體介紹了融入場景信息的圖片內容描述,基于組合物體上下文信息的指示表達,面向視覺問答場景的視覺—語言跨模態特征對齊等多個前沿方向的相關工作。
《今日頭條》副總裁馬維英在《信息流的未來與人工智能的機會》的報告中表示,人工智能在信息流這一領域里有著巨大的創新機會。我們基于信息流的應用場景,持續積累大量的訓練樣本和數據,讓機器學習系統形成閉環,不斷地改善和進化。
馬維英結合《今日頭條》,介紹了基于文本和多媒體新聞內容設計和應用智能推薦算法,這一成果使信息與人更加緊密高效地連接。圍繞“信息連接”,馬維英還介紹了如何通過對偶學習,將《今日頭條》所擁有的包括文檔、圖像、視頻、用戶行為等多種數據有機地結合起來,從而訓練出更好的模型。
“‘我丟了一塊石頭到水里,針對這句話,人可以想象很多東西,有漣漪、有濺起的浪花、水什么顏色、池塘的風貌、有沒有魚在水中跳等,而計算機的回答只有這一句話。當前,自然語言對機器而言就是硬猜,所以,自然語言要突破,需要在范式上進行改變。”芝加哥伊利諾斯大學(UIC)劉兵教授圍繞目前大多數機器學習方法只能處理固定的任務集合,而無法有效擴展到相關任務的這一局限性,系統介紹了終身學習(Lifelong Learning)這一前沿的機器學習范式,并指出了其可以有效地利用學習相關任務獲得知識這一優越性,以及相關的多個工業應用場景。
騰訊AI Lab主任張潼從企業的視角,介紹了如何在企業中在做好科研的同時為企業創造價值,并具體介紹了騰訊的AI Lab在近一年里在情感分析、文本分類、機器翻譯、對話系統等自然語言處理重要領域中的最新研究成果,以及其在業務場景中的應用。
華為諾亞方舟實驗室主任李航通過分析神經網絡方法和符號邏輯方法各自的優缺點,指出二者存在很強的互補性,因而可以結合雙方的優勢,構建更強的模型。隨后,李航博士進一步分析了結合神經網絡方法和符號邏輯方法的關鍵點和難點,并介紹了具體的前沿研究進展,令人耳目一新。
微軟亞洲研究院主任研究員劉鐵巖圍繞神經機器翻譯需要依賴大量雙語語料、解碼只考慮短期效用、訓練指標和評價指標不一致等三個問題,討論了對偶學習和強化學習方法解決這三個問題的可行性,并系統介紹了相關模型的核心思想以及微軟研究組的顯著進展。
除了以上知名學者的演講,大會還剖析樣例企業的自然語言和人工智能應用場景、進展、挑戰,以及前沿研究和應用方向。京東商城智能通訊部總監劉丹介紹了京東無人客服的技術架構,并就無人客服的商業價值和發展前景做了深入的討論。
本屆高峰論壇還設置了企業論壇環節,邀請中科院、百度、出門問問、奇點機智等創新公司的科學家就人機對話、數據智能等業界在人工智能、自然語言處理技術方面的探索、應用、挑戰等環節各抒己見。