999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

谷歌開發語言模型 在數學考試中可達到人類平均水準

2022-09-22 09:45:42
海外星云 2022年17期
關鍵詞:數學模型研究

近日,谷歌開發了一個名為“麥內瓦”的自然語言處理(NLP)模型,能夠回答微分方程、化學、狹義相對論等高難度學科問題。

據了解,現在已有的NLP模型(如Open AI的GPT-3、Deep Mind的Gopher等)可以較好地執行總結、翻譯、寫作等各類文本處理任務。但目前,這類神經網絡模型在解決所謂的定量推理問題(如數學問題)方面的能力還有不足。

“定量推理是語言模型仍然遠遠低于人類水平表現的一個領域,”研究人員在谷歌官方博文中解釋說,“通常認為,用機器學習解決定量推理問題需要模型架構和訓練技術的重大進步。”

其中還提到,數學等復雜學科問題的解決需要使用自然語言和數學公式解析問題,以及生成數值計算的分步解決方法等多種技能的組合。

由于這些挑戰,谷歌打造了“麥內瓦”這種可以解決定量推理問題的人工智能模型。

2022年6月29日,相關論文以《用語言模型解決定量推理問題》為題提交在arXiv上。

據了解,麥內瓦建立在PaLM(5400億參數模型,谷歌2022年4月發布)基礎之上,并在一個118GB數據集(包括科學論文和含有數學表達式的網頁)上進行訓練。

研究人員還提到,他們沒有刪除這些數據中對數學表達式的語義意義至關重要的符號和格式。因此,麥內瓦學會了如何使用標準數學符號來表達它生成的答案。并在博文中補充道:“為實現STEM(Science、Technology、Engineering、Mathematics)推理任務的最先進性能,麥內瓦結合了小樣本提示、思維鏈或暫存器提示以及多數投票等提示和評估技術。”

比如通過思維鏈提示,研究人員不僅可以讓麥內瓦回答問題,還可以嘗試讓它解釋是如何計算答案的。在某些情況下,這種方法使神經網絡能夠解決過于復雜的問題。

“麥內瓦”對兩個數學問題的輸出解答

另外,在解答數學問題時,該模型可以找到多種計算相同結果的方法,然后,對生成的不同解決方案進行比較,根據多數投票原則選擇最有可能成為正確答案的解決方案。

值得一提的是,用戶還可以使用谷歌推出的交互式網頁試用麥內瓦的輸出效果。

為了測試“麥內瓦”的準確性,研究人員讓其回答跨越多個領域的問題,難度從小學水平到研究生水平,涵蓋小學和高中數學競賽、大規模多任務語言理解基準子集MMLU-STEM、麻省理工學院開放課件等中的各種問題。620億參數的麥內瓦在波蘭國家數學考試(每年參加人數約有27萬名)中達到了57%的分數,這恰好是2021年該國的平均水平,而5400億參數版本實現了65%的分數。

麥內瓦示例瀏覽網站

研究人員表示,在所有情況中,相較之下,麥內瓦都能獲得最先進的結果。但值得注意的是,麥內瓦還是會犯不少錯誤,其中計算錯誤和推理錯誤約各占50%,這些錯誤大都比較容易解釋。而結果正確,推理過程錯誤的情況被研究者稱為“誤報”,誤報率相對較低,620億參數的麥內瓦在數學上產生的誤報率低于8%。

谷歌對這些錯誤樣本進行了分析,以確定模型后續需要改進的地方。以下是模型犯的兩個示例錯誤。

計算錯誤

由于麥內瓦并沒有使用底層數學結構來回答問題,這使其無法自動驗證答案,因而檢測不到“誤報”情況。該模型還無法利用計算器或Python解釋器等外部工具。因此,它進行需要復雜數值計算的定量推理任務的能力有限。麥內瓦模型的性能目前與人類的表現還有不小差距。

總的來說,通過在大量定量推理數據上訓練大模型,并采用一流的人工智能技術,從而讓麥內瓦在多類定量推理任務上實現較高的提升。

最后,機器學習模型已在許多科學學科中發揮重要作用,但它們通常局限于解決特定范圍的任務。像麥內瓦這類能夠進行定量推理的模型有許多潛在的應用,包括作為研究人員的輔助工具、為學生提供新的學習機會等。“我們希望解決定量推理問題的通用模型能夠有助于推動科學和教育的進一步發展。麥內瓦已經朝這個方向邁出一步。”研究人員表示。

猜你喜歡
數學模型研究
一半模型
FMS與YBT相關性的實證研究
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
3D打印中的模型分割與打包
我為什么怕數學
新民周刊(2016年15期)2016-04-19 18:12:04
數學到底有什么用?
新民周刊(2016年15期)2016-04-19 15:47:52
主站蜘蛛池模板: 青青久视频| 亚洲天堂久久| 欧美日韩一区二区在线免费观看 | 九九热视频在线免费观看| 亚洲欧美日韩久久精品| 日韩123欧美字幕| 亚洲一区二区三区麻豆| 曰韩免费无码AV一区二区| 亚洲欧美在线综合一区二区三区| 麻豆精品在线播放| 国产成人精品午夜视频'| 欧美成人综合在线| 爱爱影院18禁免费| 国产传媒一区二区三区四区五区| 亚洲人成电影在线播放| 在线观看无码a∨| 激情六月丁香婷婷| 99这里只有精品6| 乱系列中文字幕在线视频| 国产综合精品一区二区| 欧美三级不卡在线观看视频| 久久综合色播五月男人的天堂| 久久香蕉国产线看观| 四虎影视8848永久精品| 欧美黄网在线| 国产欧美日韩综合在线第一| 国产香蕉一区二区在线网站| 国产精品v欧美| 国产人妖视频一区在线观看| 精品一区二区三区自慰喷水| 国产免费网址| 国产精品第一区| 国产亚洲精品va在线| 国产精品xxx| 视频在线观看一区二区| 欧美午夜在线视频| 国产精品成人一区二区不卡| 老色鬼久久亚洲AV综合| 97久久超碰极品视觉盛宴| 国产成年女人特黄特色毛片免| 91亚洲视频下载| 国产打屁股免费区网站| 成人另类稀缺在线观看| 欧美一级一级做性视频| 亚洲水蜜桃久久综合网站 | 午夜国产理论| 国产一二三区视频| 欧洲免费精品视频在线| 亚洲精品中文字幕午夜| 无码在线激情片| 四虎亚洲国产成人久久精品| 亚洲综合色区在线播放2019| 欧美精品一区在线看| 99久久精品免费看国产免费软件| aaa国产一级毛片| 亚洲人在线| 成年人久久黄色网站| 欧美日韩中文字幕二区三区| 免费看a毛片| 国产一区二区三区在线观看视频 | 波多野结衣的av一区二区三区| 伊人成人在线| 亚洲人成网站色7799在线播放 | 久久性视频| 四虎影视永久在线精品| 亚洲欧洲日产无码AV| 在线a网站| 国产亚洲精| 国产女人在线| 色网在线视频| 在线国产91| 亚洲国产精品一区二区第一页免| 精品福利网| 国产小视频在线高清播放| 一级毛片在线直接观看| 91在线日韩在线播放| 久久人搡人人玩人妻精品| 一区二区三区毛片无码| 国产午夜小视频| 性色一区| 精品国产成人a在线观看| 中日韩欧亚无码视频|