蔡立英/編譯
谷歌人工智能顯露廣泛技能
蔡立英/編譯

●谷歌的多任務模型擅長多種技能,很難將其歸類到任何一個專門的深度學習系統。
深度學習系統往往在單個技能方面創造奇跡:很擅長受訓要完成的任務,而做其他事情則相當糟糕?,F在,搜索引擎巨頭谷歌公司研發的神經網絡則表明,人工智能還是能多才多藝的。
大多數深度學習系統被設計出來都是解決特定問題的,比如識別坦桑尼亞的塞倫蓋蒂平原圖片中的動物,或是從事不同語種之間的翻譯。但是,如果你給某個深度學習系統設計的是圖像識別的算法,卻重新訓練它去完成另一個截然不同的任務,比如識別語音,那么通常它對原本設計的圖像識別任務會變得不擅長。
人類不存在這樣的問題。我們會利用解決某個問題的知識去完成新的任務,并且當我們開始學習一項新技能時,通常不會忘記如何運用已學會的技能。谷歌研發的神經網絡朝著這個方向前進了一小步,它同時學習解決各種不同的問題,而不僅僅是專長于某個領域。
谷歌的大腦團隊是深度學習研發團隊之一,其研發的神經網絡能完成8個任務,包括圖像和語音識別、翻譯和句子分析。這個深度學習系統被稱為“多任務模型(MultiModel)”,由一個中樞神經網絡及其周圍的多個分網絡組成,這些分網絡專長于理解音頻、圖像或文本相關的任務。
盡管MultiModel并沒有打破其所嘗試的各個任務的紀錄,它的成績卻全面地得到一貫的高分。例如,它的圖像識別能力準確度達到86%,只比最好的專業算法差9個百分點,能和5年前使用的最好算法相媲美。
MultiModel還顯示出了其他優點。深度學習系統通常需要經過大量數據的訓練,才能很好地完成一項任務。但是,MultiModel似乎完全繞開了過去的這種訓練套路,而是直接從另一個完全不同的任務的相關數據中學習。
比如,谷歌神經網絡分析句子語法的能力,在它接受圖像數據庫的訓練時得到了提升,盡管這個圖像數據庫與句子分析八竿子打不著。
對于神經網絡已經積累了大量數據的問題,當它從其他任務中學習時,其表現大致上是相同的。
愛爾蘭都柏林數據分析中心的塞巴斯蒂安·路德(Sebastian Ruder)對谷歌的方法印象深刻。如果一個神經網絡能運用某個任務的知識去幫助解決另一個截然不同的問題,那么,它將更擅長那些因為缺乏有用數據而很難學會的任務。路德說:“這讓我們更接近強人工智能的目標了。”
路德認為,谷歌的這種方法對于制造高端的人工智能機器人同樣有用,這種人工智能機器人能在游歷世界的過程中學習。世界上充滿了無條理的音頻、圖像和文本,一個從很多不同類型的數據中學習的深度學習系統,可能比高度專業化的機器人更容易理解這些東西。
谷歌發布了MultiModel的代碼,作為其開源項目TensorFlow的一部分,為其他工程師提供了體驗這一神經網絡和進行測試的機會。不過,路德指出,這一神經網絡非常復雜,可能令研究者們難以弄明白它是如何習得多任務技能的。
[資料來源:New Scientist][責任編輯:田 心]