999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

谷歌開發語言模型 在數學考試中可達到人類平均水準

2022-09-22 09:45:42
海外星云 2022年17期
關鍵詞:數學模型研究

近日,谷歌開發了一個名為“麥內瓦”的自然語言處理(NLP)模型,能夠回答微分方程、化學、狹義相對論等高難度學科問題。

據了解,現在已有的NLP模型(如Open AI的GPT-3、Deep Mind的Gopher等)可以較好地執行總結、翻譯、寫作等各類文本處理任務。但目前,這類神經網絡模型在解決所謂的定量推理問題(如數學問題)方面的能力還有不足。

“定量推理是語言模型仍然遠遠低于人類水平表現的一個領域,”研究人員在谷歌官方博文中解釋說,“通常認為,用機器學習解決定量推理問題需要模型架構和訓練技術的重大進步。”

其中還提到,數學等復雜學科問題的解決需要使用自然語言和數學公式解析問題,以及生成數值計算的分步解決方法等多種技能的組合。

由于這些挑戰,谷歌打造了“麥內瓦”這種可以解決定量推理問題的人工智能模型。

2022年6月29日,相關論文以《用語言模型解決定量推理問題》為題提交在arXiv上。

據了解,麥內瓦建立在PaLM(5400億參數模型,谷歌2022年4月發布)基礎之上,并在一個118GB數據集(包括科學論文和含有數學表達式的網頁)上進行訓練。

研究人員還提到,他們沒有刪除這些數據中對數學表達式的語義意義至關重要的符號和格式。因此,麥內瓦學會了如何使用標準數學符號來表達它生成的答案。并在博文中補充道:“為實現STEM(Science、Technology、Engineering、Mathematics)推理任務的最先進性能,麥內瓦結合了小樣本提示、思維鏈或暫存器提示以及多數投票等提示和評估技術。”

比如通過思維鏈提示,研究人員不僅可以讓麥內瓦回答問題,還可以嘗試讓它解釋是如何計算答案的。在某些情況下,這種方法使神經網絡能夠解決過于復雜的問題。

“麥內瓦”對兩個數學問題的輸出解答

另外,在解答數學問題時,該模型可以找到多種計算相同結果的方法,然后,對生成的不同解決方案進行比較,根據多數投票原則選擇最有可能成為正確答案的解決方案。

值得一提的是,用戶還可以使用谷歌推出的交互式網頁試用麥內瓦的輸出效果。

為了測試“麥內瓦”的準確性,研究人員讓其回答跨越多個領域的問題,難度從小學水平到研究生水平,涵蓋小學和高中數學競賽、大規模多任務語言理解基準子集MMLU-STEM、麻省理工學院開放課件等中的各種問題。620億參數的麥內瓦在波蘭國家數學考試(每年參加人數約有27萬名)中達到了57%的分數,這恰好是2021年該國的平均水平,而5400億參數版本實現了65%的分數。

麥內瓦示例瀏覽網站

研究人員表示,在所有情況中,相較之下,麥內瓦都能獲得最先進的結果。但值得注意的是,麥內瓦還是會犯不少錯誤,其中計算錯誤和推理錯誤約各占50%,這些錯誤大都比較容易解釋。而結果正確,推理過程錯誤的情況被研究者稱為“誤報”,誤報率相對較低,620億參數的麥內瓦在數學上產生的誤報率低于8%。

谷歌對這些錯誤樣本進行了分析,以確定模型后續需要改進的地方。以下是模型犯的兩個示例錯誤。

計算錯誤

由于麥內瓦并沒有使用底層數學結構來回答問題,這使其無法自動驗證答案,因而檢測不到“誤報”情況。該模型還無法利用計算器或Python解釋器等外部工具。因此,它進行需要復雜數值計算的定量推理任務的能力有限。麥內瓦模型的性能目前與人類的表現還有不小差距。

總的來說,通過在大量定量推理數據上訓練大模型,并采用一流的人工智能技術,從而讓麥內瓦在多類定量推理任務上實現較高的提升。

最后,機器學習模型已在許多科學學科中發揮重要作用,但它們通常局限于解決特定范圍的任務。像麥內瓦這類能夠進行定量推理的模型有許多潛在的應用,包括作為研究人員的輔助工具、為學生提供新的學習機會等。“我們希望解決定量推理問題的通用模型能夠有助于推動科學和教育的進一步發展。麥內瓦已經朝這個方向邁出一步。”研究人員表示。

猜你喜歡
數學模型研究
一半模型
FMS與YBT相關性的實證研究
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
3D打印中的模型分割與打包
我為什么怕數學
新民周刊(2016年15期)2016-04-19 18:12:04
數學到底有什么用?
新民周刊(2016年15期)2016-04-19 15:47:52
主站蜘蛛池模板: 无码国产偷倩在线播放老年人| 免费jjzz在在线播放国产| 国产导航在线| 黄色成年视频| 国产免费怡红院视频| 亚洲Aⅴ无码专区在线观看q| 青青网在线国产| 欧美国产日韩在线观看| 国产毛片久久国产| 亚洲第一综合天堂另类专| 亚洲天堂视频在线免费观看| 一本久道热中字伊人| 999国产精品永久免费视频精品久久| 国产成人精品男人的天堂下载 | 亚洲国产精品人久久电影| 久久久久无码精品| 国产成人凹凸视频在线| 不卡午夜视频| 一级片一区| 一级香蕉人体视频| 国产毛片基地| 国产a网站| 久久精品国产在热久久2019| 国产精品欧美激情| 亚洲中文字幕国产av| 亚洲天堂久久新| 美女被操91视频| 日韩成人午夜| 97在线观看视频免费| 国产在线观看第二页| 亚洲一级毛片免费观看| 香港一级毛片免费看| 亚洲国产精品无码AV| 无码免费的亚洲视频| 亚洲精品国产自在现线最新| 亚洲成人高清无码| 鲁鲁鲁爽爽爽在线视频观看| 欧美激情视频一区二区三区免费| 日韩免费视频播播| 欧美日本视频在线观看| 午夜福利在线观看成人| 91丨九色丨首页在线播放| 免费观看男人免费桶女人视频| 国产亚洲精品91| 一边摸一边做爽的视频17国产| 国产三级a| 亚洲精品午夜无码电影网| 亚洲一区精品视频在线| 精品国产黑色丝袜高跟鞋| 亚洲三级a| 国产交换配偶在线视频| 国产欧美日韩精品综合在线| 九九视频在线免费观看| 久久久久亚洲AV成人人电影软件| 日韩美一区二区| 欧美区日韩区| 亚洲人在线| 特级精品毛片免费观看| 国产一级在线播放| 中文无码影院| 最新亚洲av女人的天堂| 一级毛片免费播放视频| 亚洲精品不卡午夜精品| 亚洲人人视频| 国产无码网站在线观看| 人妖无码第一页| 日本不卡在线播放| 中文字幕中文字字幕码一二区| 日韩一级二级三级| 国内黄色精品| 久久精品最新免费国产成人| 亚洲高清免费在线观看| 91免费国产在线观看尤物| 国产色爱av资源综合区| 国产区在线看| 全裸无码专区| 国产在线观看一区精品| 亚洲欧美日韩另类| 欧洲一区二区三区无码| 三级毛片在线播放| 亚洲高清无码久久久| 一本一道波多野结衣一区二区|