姚千燕(國家知識產權局專利局專利審查協作廣東中心, 廣州 510530)
Robocup3D仿真機器人截球技術的研究
姚千燕
(國家知識產權局專利局專利審查協作廣東中心, 廣州 510530)
摘 要:在Robocup3D仿真機器人世界杯足球比賽中,仿真機器人球員技術動作設計的優劣在很大程度上決定了球隊的強與弱,本文研究了Robocup3D仿真機器人截球技術,將BP神經網絡技術應用到截球動作中,通過實驗發現,采用該方法使得截球成功率大大提高。
關鍵詞:Robocup3D;機器人;截球;BP神經網絡
機器人世界杯足球比賽簡稱Robocup,Robocup3D仿真比賽近似于人類足球比賽,克服了機器人硬件的多方面限制,解決了很多現階段硬件無法實現的功能,所以對多智能體系統(MΑS)和分布式人工智能(DΑI)的理論研究具有深遠的影響。在Robocup3D仿真比賽系統中,每個機器人體系結構包括世界模型、通信、高層決策、動作模型等模塊。其中動作模型中截球技術的優劣對整個Robocup3D仿真比賽的結果具有重要的影響。本文將仿真機器人截球技術分為兩種情況,一種為遠距離截球,另一種為近距離截球,將BP神經網絡應用到遠距離截球技術中,采用該方法縮短了截球時間,提高了截球成功率。
1.1 Robocup3D仿真系統結構
采用Client/Server方式設計RoboCup3D仿真機器人足球比賽系統,由監視器和客戶端、服務器端組成該系統。對真實的物理三維世界的模擬可以由Robocup3D仿真環境實現,該系統主要對服務器的通信、基本動作及其決策、對球員的感知等基本功能模塊進行了研究。圖1為仿真系統結構示意圖。

圖1 RoboCup3D仿真比賽系統結構
1.2 機器人截球技術
Robocup3D截球技術的研究目標是要確定球員最佳截球點,無論球距離自身距離為多遠,球員都可以攔截到球。最佳截球點由仿真足球的當前位置信息以及速度信息確定,接下來使球員以最快的速度運動到該最佳截球點,從而在比賽中獲得對球的掌控權。通過一些基本動作指令,例如轉身指令、加速指令等,在實時分析球場信息之后,使得球員以最快的速度到達改最佳截球點。因為預測時間對于預測足球位置的精確度影響很大,如果能一兩個周期內完成預測則相對精確,如果足球距離自身位置越遠,那么球員到達截球點的時間就越長,越不能精確預測足球的位置,下面將機器人截球技術分為兩種情況研究,一種為遠距離截球技術,另一種為近距離截球技術。
近距離截球就是要在一兩個周期內攔截到距離自身位置較近的球,通常將踢球距離的六分之一之內定義為距離自身較近。首先判斷對足球在比賽過程中一兩個時間周期之后的位置信息,接著預測球員在一兩個周期之后與球的距離。如果在兩個周期內該距離不能小于踢球距離d的六分之一,則說明不能實現近距離截球。具體過程為,首先對球員下個周期所處的位置進行預測,判斷能否在一個時間周期之內截到,該判斷根據的是球員當前的位置信息和速度信息,將球員下個周期自身位置沿視覺方向在水平面上的射影長度簡稱為射影長,以下個周期球的預測位置為中心,以足球半徑r+d/6為半徑。如果射影長與圓交點個數為1,那么該點為截球點;如果射影長與圓的交點個數為2,距離球員自身預測位置最近的點就是最佳截球點;如果射影長與圓的交點個數為0,則說明不能實現在一個周期內截到球。在一個周期內不能截到球的情況下,接著對兩個周期之內能否截到球進程判斷。第一步判斷能否通過運行turn、dash動作指令截到球,先對兩個周期之后的足球所處的位置信息p進行預測;第二步執行turnBodyΤoPoint指令,啟用預測函數predictΑfterΤurn,通過第二步使球員朝向設定的目標位置轉身,并且對球員自身的位置信息進行預測; playerSpeed_max表示球員最大球員速度,如果球員的預測位置與足球位置p的距離小于r+d+playerSpeed_max,表明可以在兩個周期內截到球,反之判定在兩個時間周期之內截不到球。
3.1 判斷截球點
采用解析法進行遠距離截球,預測出第i個周期后足球的位置信息p,然后設計出截球分析函數,對球員到達該位置p所需要的周期數進行計算,如果該周期數小于i,則表示能夠截到球,函數輸出截球所需周期數i以及截球點。
該方法的算法流程圖如圖2。
3.2 采用BP神經網絡訓練截球
截球點確定之后,一般情況下采用嘗試的方法來確定采取dash 和turn這兩個動作指令中的哪一個,這樣就導致截球效率低,也就是說即便得到了截球點也可能截不到球。為了避免出現這種情況,在截球技術中使用人工智能技術,其中神經網絡技術計算簡單,適用于連續空間,采用神經網絡訓練截球動作能夠滿足Robocup比賽的實時性要求。BP神經網絡是現在比較成熟并且應用較多的神經網絡模型,該模型的基本思想是通過對輸入信號Xi進行非線形變換得到輸出信號Yk,并且是通過隱層點使得輸入信號作用于輸出信號,由期望輸出量t、輸入向量X、以及期望輸出值t與網絡輸出值Y之間的差值組成每個網絡訓練樣本,對輸出節點與隱層節點之間的聯接強度以及閾值、還有隱層節點與輸入節點之間的聯接強度值進行調節,經過不斷的調節使得誤差能夠沿著梯度方向不斷降低,在不斷的訓練學習之后,得到與最小誤差相關的閾值和權值。采用該訓練好的神經網絡對同類的樣本輸入信息進行訓練,自動得到輸出誤差最小的信息。訓練截球技術選取的是三層BP神經網絡,其結構模型如圖3所示。

圖2 解析法截球算法流程圖

圖3 BP神經網絡截球模型
圖3中,將球速方向、球的方向、球距自身距離、球員速度方向和大小、球速大小作為截球BP神經網絡的輸入量。成功截球采取的動作為輸出量,可采取的動作為dash和36個方向turn。網絡傳遞函數:對上述樣本數據進行訓練,得到訓練好的神經網絡,用來進行截球。
4.1 實驗環境與條件
4.2 結果分析
設定最小均方誤差為0.005,BP神經網絡的樣本數據為30場Robocup3D足球仿真比賽中的500個截球動作序列。學習訓練之后網絡逼近均方誤差約為0.00532。訓練后得到的誤差曲線如圖4所示:

圖4 誤差曲線
訓練好神經網絡之后,將該基于BP神經網絡的截球算法在RoboCup3D仿真比賽中采用該基于BP神經網絡的截球算法。通過編寫代碼在到仿真機器人截球程序中加入BP神經網絡,對100次截球情況進行分析,進行多次仿真比賽后,得到截球效果對比表。

表1 截球效果對比表
實驗結果表明,在截球技術中采用BP神經網絡技術,縮短了截球時間,提高了截球成功率。
參考文獻:
[1]曹成才.機器人足球仿真系統的研究[D].成都:四川大學,2005:10-15.
[2]時長娥.Robocup機器人足球賽3D仿真組程序設計研究[D].南京:東南大學,2005:1-5.
[3]Jan Lubbers.Rogier R.Spaans.The Priority/Confidence Model as a Framework for Soccer Agents[C].RoboCup-98:Robot Soccer World Cup II,Springer. 1998.pages 52-60.
[4]許元.RoboCup類人仿真足球機器人研究--SEU-RedSun仿真足球機器人隊伍設計與實現[D].南京:東南大學,2008:1-5.
[5]胡翠娜.Robocup3D仿真比賽關鍵技術的研究[D].贛州:江西理工大學,2007:1-7.
作者簡介:姚千燕 (1987-),女,河南陜縣人,碩士,研究實習員,研究方向:模式識別與智能系統。