999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

RobuCup 2D結合神經網絡算法的跑位與決策研究

2020-04-16 12:44:48耿志文
科學大眾 2020年2期
關鍵詞:機器學習計算機人工智能

耿志文

摘? ?要:國際信息科技領域新興一項前沿機器人學習方面大型學術活動—機器人足球世界杯。機器人足球世界杯涉及領域廣泛,研究方法多樣,集合了多領域合作,涉及計算機、通信、自動化、機電一體、機器學習等多項前沿技術的開拓和綜合集成;對其的研究已經成為各個領域的重點。在教育方面,機器人足球已經成為21世紀計算機科技與信息科技頂尖人才的重要方向。甚至在歐美很多國家已將其設定為核心課程。概括來說,機器人足球世界杯是以仿真體育賽事為載體的前沿科技競爭和高科技對抗賽事,機器人賽事的蓬勃發展極大地促進了計算機科學等學科前沿技術的發展,在某種程度來說,機器人賽事的發展也是自動化、機器人、計算機等科技的重要窗口。

關鍵詞:機器學習;計算機; RobuCup;人工智能

1? ? RobuCup簡介

RoboCup聯盟是一個國際性研究和教育組織,提供一個標準問題來應對機器人運動方面的研究。這個領域可以檢驗許多提出的設想性方案的實際呈現,也可以檢驗許多新技術在應用方面存在的問題,同時也可以用作教育領域,促進許多學科基礎教育的進步與前沿科技發展。

足球比賽被RoboCup選作一個基本領域,組織了世界上級別最高、規模最大、影響最廣泛的機器人足球賽事和學術會議—機器人足球世界杯及其學術會議。機器人球隊的正常運作,涉及多方面的技術,而文章所研究的RobuCup 2D則是為軟件及策略方面研究,以用于實際操作。

2? ? RobuCup研究重點

RobuCup 2D挑戰為智能主體提供了一系列挑戰,同時還提供了一個動態、實時多主體的平臺對戰展現效果,通過足球場上仿真設定各種影響因素來模擬真實賽場環境,例如通過“噪音”干擾智能主體之間的通信,提高其信息傳遞的失敗率;通過“視野”限制降低智能主體對場上信息的獲取;通過場上球員的相互阻礙來提高策略的重要性。因此,為了在重重限制下贏得比賽,如何讓智能主體有目的地學習進攻策略就變得極其重要,因此在研究這個方面課題的時候要學會對智能主體的訓練。

如上所述,學習成為智能主體非常重要的一個環節,所以在RobuCup學習挑戰中,為一組智能主體創建有效的學習方法成為主要挑戰,這個挑戰分為以下幾個部分:

(1)單個智能主體的離線學習技術(對球的攔截與踢球)。

(2)智能主體之間配合的離線學習(傳接球)。

(3)在線技術和合作學習(如適應性跑位)。

(4)在線對抗學習(如預測對手行為并采取有效策略)。

足球這種復雜、動態的多主體分布式人工智能的訓練需要各種考慮多種因素,需要靈活的協調和通信來克服場上的不確定性,所以必須建立一個讓智能主體之間聯系更加緊密的神經網絡來加強團隊之間的聯系和實現更加完善的攻防策略,要建立一個完整的體系結構來讓分布的智能主體即使在視野、信息受限的情況下也能將戰術與隊形調整到最佳狀態。

3? ? 多智能體的學習

在分布式多主體的人工智能中,一個多智能主體的系統在結構上和系統功能上都比較復雜,智能體之間信息傳遞的不穩定性以及場上干擾都會給整個系統的功能發揮帶來干擾,而無法實現給定所有可能發生的情況,因此需要讓多智能主體擁有一定的學習能力和自適應性,讓多智能主體的系統可以通過學習和分析來更好的實現功能。而采用神經網絡來加強團隊之間的學習和配合是文章的重點。

4? ? 反應式Agent結構

反應式Agent指簡單地對外部刺激產生響應,沒有里面的任何狀態,每個Agent可以是用戶也可以是服務端。

5? ? Monitor

Monitor是可視化工具,提供平臺讓人們觀看比賽時候的場景,利用可視化平臺讓人們更直觀地看見智能主體的表現和團隊策略的實施,可以直接看見智能主體和球在場上的運動坐標,RobuCup 2D為二維球場,需要考慮的球員因素例如人形關節、轉頭等比較少,但對于團隊策略更為注重。

6? ? 球場上的動態規劃

球場上的每個周期都需要準確的判斷,由于踢球力量到加速度轉換率(Kick Power Rate,KPR)提高到0.027以后,把球高速踢出比以前容易多了,在4個周期內都可以把球加速到2.5左右。

使用搜索和強化算法來設計踢球模塊,讓智能主體擁有快速踢球的能力是非常重要的一個環節,但是智能主體對場上的時機判斷并不準確,球的運動會干擾所有智能主體的判斷,當運動狀態改變時,智能主體的決策也會相應改變,所以要離散化球隊球員的位置空間,用來表示過度踢球的中間狀態。所以這里使用動態規劃來準確的確定球隊球員之間策略的決定。以10×10離散球員魏忠賢,邊長2x kickable area的正方形。首先需要得出兩個點的球運動狀態,如果確定了第二個點,那智能主體就可以擁有對第二個點球的實際控制能力。

智能主體給球的加速度和智能主體的力量之比為kick rate,其只與KPR、球到智能主體的距離以及球和智能主體的角度有關。

7? ? 動作訓練

在對智能主體策略的規劃中,還需要考慮到對智能主體離線和在線的訓練,將Q學習和UCT結合,保證探索和盡量保證選取最優動作獲得一個比較科學的估值機制。

8? ? 結語

設計了一個簡單的場上教練實現改變球員的類型,詳細的球員類型應用非常復雜,本設計演示了如何使用場上教練來改變球員類型,這些改變不是策略的一部分,球員類型的改變目前還影響不到策略實施的效果。

猜你喜歡
機器學習計算機人工智能
計算機操作系統
基于計算機自然語言處理的機器翻譯技術應用與簡介
科技傳播(2019年22期)2020-01-14 03:06:34
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
信息系統審計中計算機審計的應用
消費導刊(2017年20期)2018-01-03 06:26:40
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
基于支持向量機的金融數據分析研究
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
主站蜘蛛池模板: 毛片免费在线视频| 99re在线免费视频| 亚洲欧美成人网| 国产一区自拍视频| 久久精品丝袜高跟鞋| 成人亚洲国产| 中文字幕人成乱码熟女免费| 欧美成人日韩| 亚洲视频a| 99在线小视频| 亚洲最猛黑人xxxx黑人猛交| 日本欧美视频在线观看| 国产福利小视频高清在线观看| 午夜日b视频| 日韩最新中文字幕| 欧美成人综合视频| 日韩精品一区二区三区视频免费看| 成人福利在线视频| 国产人前露出系列视频| 粉嫩国产白浆在线观看| 久久人人97超碰人人澡爱香蕉 | 亚亚洲乱码一二三四区| 99久久无色码中文字幕| 精品超清无码视频在线观看| 久久 午夜福利 张柏芝| 五月天福利视频| 国产精品视频第一专区| 亚洲伊人天堂| 日韩精品中文字幕一区三区| 亚洲天堂视频在线观看免费| 一区二区无码在线视频| 成人综合在线观看| 亚洲精品卡2卡3卡4卡5卡区| 久久久久亚洲AV成人网站软件| 国产高清在线观看| 免费在线色| 九色视频线上播放| 波多野结衣视频一区二区| 91免费国产高清观看| 91国内外精品自在线播放| 欧美在线三级| 4虎影视国产在线观看精品| 国产成年女人特黄特色毛片免| 欧美成人午夜影院| 自慰高潮喷白浆在线观看| 播五月综合| 婷婷午夜影院| 国产真实乱子伦视频播放| 国产极品嫩模在线观看91| 天天操天天噜| 欧美精品综合视频一区二区| 亚洲成aⅴ人片在线影院八| 欧美高清三区| 欧美亚洲综合免费精品高清在线观看 | 综合网久久| 91区国产福利在线观看午夜| 热久久这里是精品6免费观看| 国产精品无码AV片在线观看播放| 久久精品嫩草研究院| 久精品色妇丰满人妻| 三上悠亚精品二区在线观看| 香蕉网久久| 国产在线八区| 中文字幕永久在线看| 欧美va亚洲va香蕉在线| 免费一级全黄少妇性色生活片| 999精品在线视频| 无码精品一区二区久久久| 久久精品无码一区二区国产区| 亚洲三级色| 午夜福利视频一区| 日韩区欧美国产区在线观看| 亚洲成人一区二区| 色综合成人| 亚洲男女在线| 日本在线欧美在线| 伊人成色综合网| 久久成人免费| 中美日韩在线网免费毛片视频 | 三级毛片在线播放| 在线无码av一区二区三区| 久久精品这里只有国产中文精品|