1月15日,阿里巴巴開發的人工智能(AI)模型,在斯坦福大學閱讀理解測試中的得分超出了人類。
阿里巴巴上周讓其深度神經網絡模型接受了測試,要求AI給出超過10萬個問題的確切答案,而這些問題所構成的試卷被認為是當前世界檢測機器閱讀水平的最權威的標準之一。由阿里巴巴數據科學技術研究院開發的這一AI模型在測試中得了82.44分,相比人類對手82.304的得分稍勝一籌。
阿里巴巴說,這是機器首次在此類測試中戰勝真人。微軟開發的機器也取得了同樣的戰績,在同一測試中得到了82.650的高分,只是成績的最終確認比阿里巴巴的AI模型晚了一天。
所謂的自然語言處理是模仿人類對語言詞句的理解。斯坦福大學的測試題基于500多篇維基百科文章編制而成,旨在通過這套試題梳理出線索,看機器學習模型是否能夠在經過大量信息處理后給出問題的確切答案。
阿里巴巴研究院自然語言處理首席科學家司羅在一份公告中說,對于像“天為什么會下雨”這樣的客觀問題,機器給出的答案準確率會很高。公告稱,其中的技術可以逐步應用于諸如客服、博物館指南、在線解答患者醫療問題等廣泛的實際應用領域,從而以一種前所未有的方式減少人力投入的需求。
(彭博新聞社)endprint