999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

谷歌聯(lián)合發(fā)布SayCan模型讓機器人做出合理回答,還能“說到做到”

2022-03-16 12:52:12美《深科技》
海外星云 2022年20期
關鍵詞:指令物理技能

在人工智能中,近幾年來大型語言模型領域的發(fā)展尤為突飛猛進,經(jīng)過訓練的大型語言模型已經(jīng)可以做到按照提示要求生成復雜的文本、回答較難理解的問題,甚至可以就某個主題展開對話。

大型語言模型的能力之所以如此優(yōu)異,正是在于這些模型在訓練的過程中,從由網(wǎng)絡提取的大型文本語料庫中吸取了數(shù)據(jù)量龐大的信息。

既然大型語言模型的理解能力如此強大,是否就意味一個機器人如果直接以此為基礎進行語言類的各種處理工作,就可以同樣出色地與人類交流、并進一步出色地完成任務了呢?

答案是否定的,原因就在于大型語言模型并不是以物理世界為基礎的,它的工作過程中也并沒有對周圍物理環(huán)境的觀察與影響這一步。這就導致大型語言模型給出的有些答案有時與周圍環(huán)境格格不入、顯得不切實際。

例如在上圖所示的這一實例中,在人類向一個只能進行“拿起廚具”“移動到某位置”等基本操作的廚房機器人給出“我的飲料灑了,可以幫忙嗎?”

這一請求之后,著名的三種大型語言模型給出的答案都不那么符合當時的場景:GPT 3的回復是“你需要一個吸塵器”,LaMDA的回復是“需要我?guī)湍乙粋€吸塵器嗎?”FLAN則回復了“抱歉,我并不是故意讓飲料灑了的”。

可以看出,由于在回答時沒有結合周圍的環(huán)境以及上下文,大型語言模型無法直接為機器人提供最合適的回答。

用戶提出同一請求時,不同的大型語言模型(左側)和新SayCan模型(右側)給出的不同的反饋

為了讓機器人的語言系統(tǒng)更符合周圍的物理環(huán)境,從而使其更加有效地幫助人類,谷歌機器人聯(lián)合Everyday機器人開發(fā)了一種新的語言處理模型,即SayCan。

這一模型在訓練的過程中,不僅學習如何很好地理解語言指令并給出回答,更要評估在當前物理環(huán)境中每個回答真正實現(xiàn)的可能性,從而讓機器人實現(xiàn)“說到做到”。

近日,相關論文也以《盡我所能,而非盡我所說:機器人供能的基礎語言》為題發(fā)表。

簡單來說,SayCan模型在基于物理環(huán)境的任務中會將大型語言模型中的結果進行提取,它主要由兩部分構成。

首先,Say部分中由大型語言模型來完成理解語言含義,并給出相應的有助于解決問題答案的任務。

然后,Can部分則會對這些答案進行評估,即“可供行功能”,從而結合當時的物理環(huán)境來確定此時什么行為是可以執(zhí)行的。

在這里,研究人員采用了強化學習方式來進行以語言為條件的價值函數(shù)的學習和訓練,而這些價值函數(shù)將確定某一行為在當前環(huán)境的可行性。

具體來說,SayCan模型將問題抽象為如下:系統(tǒng)首先會接收用戶所提供的自然語言指令i,這一指令也給出了機器人所需執(zhí)行的任務,該指令可以很長、很抽象甚至模棱兩可。

系統(tǒng)還事先設定機器人所擁有的一組技能Π,其中的每個技能π∈Π都是一個被分解后的很簡短的任務,例如撿起某個特定的物體。每個技能都有自己的簡短的語言描述 lπ,如“找刀叉”等,還有自己的可供性函數(shù)p(cπ |s,lπ ),它表示從狀態(tài)s成功實現(xiàn)描述為lπ的技能的概率。

通俗地說,可供行函數(shù)p(cπ |s,lπ)就是在狀態(tài)s下,有著描述標簽為lπ的技能π成功完成的概率,其中cπ是伯努利隨機變量。在強化學習中,p(cπ |s,lπ)也是技能的價值函數(shù),例如如果可以成功完成就將獎勵設為1,否則為0。

而SayCan模型解決問題的算法和思路,如下圖所示。

為了驗證SayCan模型性能,研究人員提出的兩個主要指標進行評估。第一個指標是計劃成功率,它用于衡量模型給出的回答是否符合指令,這里并不考慮該技能在當前環(huán)境的可行性。

SayCan模型的算法

評估結果

第二個指標是執(zhí)行成功率,它衡量系統(tǒng)是否真正能夠成功地執(zhí)行并完成指令要求的任務。

研究人員讓該模型執(zhí)行了101個任務,結果顯示,在模擬廚房的任務中,SayCan模型的規(guī)劃成功率為 84%,執(zhí)行成功率為74%。而在真實廚房環(huán)境中進行的評估中,SayCan的規(guī)劃成功率相比模擬廚房降低了3%,執(zhí)行成功率降低了14%。

SayCan執(zhí)行其他任務的例子

回到上文中提到的例子,在面對用戶的“我的飲料灑了,可以幫忙嗎?”這一指令時,與其他大型語言模型不同,SayCan的反應則是,將會“1.找到一塊抹布,2.拿起抹布,3.將其帶給用戶,4.完成”。可以說相比其他模型,可以讓機器人更好地幫助用戶。

猜你喜歡
指令物理技能
高級技能
聽我指令:大催眠術
只因是物理
井岡教育(2022年2期)2022-10-14 03:11:44
處處留心皆物理
ARINC661顯控指令快速驗證方法
測控技術(2018年5期)2018-12-09 09:04:26
LED照明產(chǎn)品歐盟ErP指令要求解讀
電子測試(2018年18期)2018-11-14 02:30:34
秣馬厲兵強技能
中國公路(2017年19期)2018-01-23 03:06:33
拼技能,享豐收
三腳插頭上的物理知識
畫唇技能輕松
Coco薇(2015年11期)2015-11-09 13:03:51
主站蜘蛛池模板: 欧美一级大片在线观看| 国产综合色在线视频播放线视| 久久激情影院| 婷婷五月在线视频| 国产午夜一级淫片| 日本成人一区| 亚洲A∨无码精品午夜在线观看| 精品国产欧美精品v| 天堂岛国av无码免费无禁网站| 2020精品极品国产色在线观看| 一级做a爰片久久免费| 亚洲人成网线在线播放va| 久久久久国产精品嫩草影院| 欧美在线黄| 3D动漫精品啪啪一区二区下载| 久久性妇女精品免费| 好吊妞欧美视频免费| 欧美色综合网站| 激情午夜婷婷| 久久99精品久久久久纯品| 欧美a级在线| 在线精品视频成人网| 四虎国产精品永久在线网址| 九色在线观看视频| 日韩精品一区二区三区swag| 日韩欧美国产区| 国产女人水多毛片18| 色综合久久久久8天国| 三上悠亚一区二区| 国产免费人成视频网| 亚洲无码日韩一区| 爱爱影院18禁免费| 亚洲综合色区在线播放2019| 国产在线视频导航| 欧美亚洲另类在线观看| 国产丝袜无码精品| av午夜福利一片免费看| 毛片一级在线| 伊人激情综合| 久久香蕉国产线看观看精品蕉| 在线毛片免费| 老司机精品99在线播放| 亚洲无码电影| 亚洲精品人成网线在线| 久久国语对白| 久久午夜夜伦鲁鲁片不卡| 欧美激情伊人| 人人91人人澡人人妻人人爽 | 国产欧美中文字幕| 欧美精品色视频| 666精品国产精品亚洲| 国产幂在线无码精品| 青青青视频蜜桃一区二区| 五月婷婷伊人网| 国产精品任我爽爆在线播放6080 | 中文字幕丝袜一区二区| 噜噜噜久久| 为你提供最新久久精品久久综合| a级高清毛片| 一边摸一边做爽的视频17国产| 热九九精品| 无码不卡的中文字幕视频| 国产成人综合亚洲欧美在| 91偷拍一区| 欧美v在线| 激情無極限的亚洲一区免费| 久久精品亚洲热综合一区二区| lhav亚洲精品| 人人澡人人爽欧美一区| 在线亚洲小视频| 福利在线不卡一区| 天堂网国产| 九一九色国产| 精品一区二区三区水蜜桃| 国精品91人妻无码一区二区三区| 日本午夜精品一本在线观看| www精品久久| 国产成人综合亚洲网址| 亚洲国产综合自在线另类| 国产69精品久久久久妇女| 人妻中文久热无码丝袜| 亚洲成a人片在线观看88|