王超 楊景照 谷學強
摘要智能規劃與決策課程對于培養學生運用科學方法和模型解決運動規劃、任務規劃和方案決策問題具有重要意義。本文在對課程定位與學情進行分析的基礎上,梳理智能規劃與決策課程的知識結構與實驗設置,并提出了課程教學的建議和方法。
關鍵詞 智能規劃與決策 知識體系 教學方法
中圖分類號:G424文獻標識碼:ADOI:10.16400/j.cnki.kjdk.2021.13.036
Thoughts on the Instructional Design of the Intelligent Planning and Decision-making Curriculum
WANG Chao, YANG Jingzhao, GU Xueqiang
(Department of Intelligent Science and Technology, College of Intelligence Science and Technology, National University of Defense Technology, Changsha, Hunan 410073)
AbstractThe Intelligent Planning and Decision-making Curriculum plays an important role in cultivating the students to manipulate scientific methods and models to solve motion planning, task planning and decision-making problems. Based on the analysis of the course orientation and learning situation, this paper combs the knowledge structure and experiment setting of intelligent planning and decision-making course,and puts forward some suggestions and methods of course teaching.
Keywordsintelligent planning and decision-making; knowledge architecture; teaching methods
0概述
智能規劃與決策是人工智能的核心關鍵研究領域之一,其研究如何運用人工智能技術來輔助人類解決復雜的規劃和決策問題,是機器人、無人機、無人車、智能彈藥、無人艇等自主系統,以及模擬仿真系統、作戰任務規劃系統等軟件智能體所需的核心關鍵技術。
近年來,針對相關專業人才培養要求,我校教師開展相關教學設計與實踐研究。[1-4]劉鴻福等以建構主義學習理論為指導,提出了智能規劃研究生課程的教學目標和知識體系;李杰等在分析無人機系統專業課程體系在智能決策問題教學設計和實踐中的不足,提出了相應的對策;牛軼峰等就無人機系統專業人才培養,以智能為核心開展課程體系、課程模塊設計及其實施建議。
隨著無人系統和軍事智能化的發展,在本科階段開設智能規劃與決策課程,系統性開展相關基礎理論教學和方法實踐,能夠使學生學會運用科學的理論和模型來表達有關智能體規劃與決策方面的問題,并通過求解數學模型尋求優化的運動與行為的規劃與決策方案,建立運用智能體模型解決實際規劃與決策問題的觀念,并具備一定的實際問題分析、建模、求解和應用能力,奠定進一步學習相關課程以及從事無人系統、各類智能系統等相關實際工作的基礎。
1課程定位與學情分析
智能規劃與決策課程是我校人工智能系列課程群的核心課程之一,是人工智能本科專業的學科基礎課程。該課程主要圍繞智能體在環境中如何利用感知的信息,自主地做出運動與行為的規劃與決策,達到某個給定的任務目標,同時使得效能最優等目標開展教學,是學習和研究機器人、無人車、無人機等無人系統和任務規劃、任務調度、指揮控制系統等智能系統所必需的基礎課程。
該課程設置在本科三年級,在軟件技術基礎、自動控制原理和人工智能基礎等課程之后開課,學生通過前期課程的學習已經掌握了人工智能的搜索算法、知識表示、機器學習、智能Agent等基礎理論和算法,迫切需要一門課程將其所具備的基礎知識理論和其實際所在的無人機、機器人、人工智能等專業課程進行銜接,架起理論算法與實際應用之間的橋梁。
2智能規劃與決策課程體系
針對大三年級本科生已掌握的基礎知識,該課程突出基礎性和實踐性的原則,通過學習該課程,能夠使學生了解智能規劃與決策的基本概念、不同類型平臺的運動規劃、行動方案的自動規劃和行動方案分析技術和不確定性環境下的規劃和決策技術,能夠針對典型的規劃決策問題,熟悉基本的解決思路和思維方式,掌握智能規劃決策方法在軍事問題和民用問題上的應用過程。對此,目前智能規劃與決策課程設計的總學時為32學時,2學分,其中理論教學26個學時,實驗教學與實施環節6個學時。
2.1知識體系設計
本課程的知識目標主要包括以下主要的知識單元,即智能規劃與決策緒論、運動規劃、行動方案自動規劃、行動方案決策分析、不確定性規劃與決策,學員應熟悉、了解或掌握不同知識單元的具體內容,達成課程標準的相應要求。
2.1.1智能規劃與決策緒論
該部分內容主要包括:①智能規劃與決策的概念;②無人裝備的規劃決策實例分析;③作戰過程中的規劃決策問題概述;④作戰規劃決策技術的發展歷史;⑤課程內容及要求等。該部分的學習目標是使學生理解智能規劃與決策的基本概念、發展歷程及趨勢和典型應用,了解課程整體架構和學習要求。
2.1.2運動規劃
該部分內容主要對運動規劃的基本概念和典型運動體的運動規劃方法進行介紹,主要包括運動規劃概述、智能導彈的運動規劃和智能車的運動規劃。
運動規劃概述包括:①基本概念,含運動規劃、路徑規劃和軌跡規劃的概念與對比,典型應用場景,基本思路和運動規劃系統;②典型運動體綜述;③運動規劃問題的數學描述,含環境模型、運動模型、規劃指標、約束條件和任務需求等。
智能導彈運動規劃包括:①智能導彈運動規劃問題描述;②智能導彈任務路徑規劃方法,含單元分解法、人工勢場法、遺傳算法等;③智能導彈彈道軌跡規劃方法,含基于標準剖面、基于動力學逆和基于優化算法的規劃方法。
智能車運動規劃包括:①智能車運動規劃問題描述;②智能車運動規劃方法流程;③基于(Probabilistic Roadmap Method, PRM)的智能車運動規劃方法。
2.1.3行動方案自動規劃
該部分主要介紹行動方案自動規劃的基本概念、規劃語言、基本的規劃算法和典型規劃器等內容。[5]
經典自動規劃部分包括:①基本概念,含規劃的定義、研究范疇、概念模型等;②規劃問題描述模型,含形式化定義方法、規劃問題描述語言等;③發展歷程,含國際規劃大賽綜述和典型規劃器等。
主要的規劃方法包括:①狀態空間規劃,含前向搜索方法、后向搜索方法和搜索啟發式構建方法;②偏序規劃;③圖規劃技術;④分層任務網絡規劃等。
2.1.4行動方案決策分析
該部分主要介紹行動方案決策分析的基本概念和典型決策分析方法進行介紹,主要包括行動方案決策分析概述、風險型決策分析方法和多目標決策分析方法。
行動方案決策分析概述部分包括:①決策問題及基本概念;②決策分析的分類;③決策分析的實施。
風險型決策分析方法部分包括:①概述;②期望益損值準則;③決策樹分析方法等。
多目標決策分析方法部分包括:①準則體系;②層次分析法,含基本概念、分析模型和判斷矩陣構建、層次結構權重排序等。
2.1.5不確定性規劃與決策
該部分內容主要介紹不確定環境下的規劃與決策基本概念和典型方法,主要包括概述、馬爾科夫方法和貝葉斯網絡方法。
不確定性規劃與決策概述部分包括:①基本概念、內涵與意義;②不確定性規劃與決策研究現狀;③效用理論。
馬爾科夫方法部分包括:①馬爾科夫方法基本概念;②策略迭代、價值迭代;③部分可觀馬爾科夫決策。
貝葉斯網絡方法部分包括:①貝葉斯網絡方法基本概念與原理;②貝葉斯網絡構建基本方法,貝葉斯網絡決策方法及其應用。
2.2課程實驗設置
智能規劃與決策是一門理論聯系應用的課程,本課程的實驗以智能規劃與決策方法的應用能力培養為總體考慮,設計三個實驗,通過三個實驗的實施,在技術目標上,一是讓學生使用自己熟悉的編程語言實現運動規劃算法的程序,達成流程清晰、結果較優的目標;二是讓學生完成Jshop2規劃器的部署運用,達到領域和問題建模合理、求解結果正確、可應用的目標;三是讓學生完成不確定條件下的機器人自主規劃決策應用,使用自己熟悉的編程語言實現馬爾科夫決策過程建模和模型求解的計算機程序,學會實際問題的求解方法,提高解決實際問題的能力。
在能力目標培養方面,主要培養學員分析和解決現實問題的能力,包括三個方面:一是對實際問題進行分析抽象的能力;二是自己動手編程求解的能力;三是應用求解結果反饋和解決問題的能力。
2.2.1基于智能優化算法的運動規劃實驗
實驗的目的是通過本實驗的開展,使學生進一步熟悉通用智能優化算法的特性和運動規劃流程。
實驗內容包括:①運動規劃問題建模,即建立運動規劃問題的環境模型和任務模型;②運動規劃智能優化算法的設計和實現,即根據提供的實驗問題模型,掌握智能優化算法的基本使用方法、執行流程和求解過程。
實驗結果包括程序代碼、測試結果及實驗報告,要求程序的正確性,并通過測試驗證。
2.2.2 Jshop2規劃器的實現和應用實驗
實驗目的是通過本實驗的開展,能夠使學員進一步熟悉分層任務網絡規劃的概念和過程,了解Jshop2規劃算法的工作原理和規劃器的使用方法,使學員透徹理解分層任務網絡規劃領域和問題建模,培養學員根據需要構建并解決問題的能力。
實驗要求學生在給定的規劃問題想定場景下,利用規劃領域描述語言(PDDL)構建規劃任務的領域文件和問題文件,通過Jshop2規劃器對問題進行分解和規劃,要求規劃問題描述正確完備,結果序列可解釋,具備復現和檢驗的功能。
實驗內容包括:任務規劃領域和問題建模,含面向規劃的智能體動作集和任務分解方法建模、不同目的要求下目標狀態的建模。
2.2.3不確定條件下的機器人自主規劃決策實驗
實驗目的是通過本實驗的開展,使學員進一步熟悉馬爾科夫決策過程建模,透徹理解馬爾科夫決策過程建模和模型求解的工作原理,達到培養學員自己動手、分析解決實際問題的能力。
實驗任務包括利用馬爾科夫決策過程求解算法完整實現不確定條件下的機器人自主規劃決策的馬爾科夫決策過程建模和編程,并通過聯調測試,能夠就機器人自主規劃決策問題進行建模、求解,要求計算結果正確,程序適用性較強,具備路徑復現和檢驗的功能。
實驗內容包括:不確定條件下的機器人自主規劃決策的馬爾科夫決策過程建模,含馬爾科夫決策過程模型要素的抽象表示和機器人自主規劃決策目標函數的設計;②馬爾科夫決策過程模型的求解,含采用策略迭代、價值迭代求解決策問題,在對比其性能的基礎上,選擇合適的學習策略,完成機器人自主規劃決策的程序實現。
3教學方法
開展探究式課堂教學改革,實行小班化教學,引入翻轉課堂、研討式教學、實際系統演示教學、案例教學等教學方法。通過課堂教學,組織討論,案例講解,課后作業,作業講解與討論,課外實踐一系列的環節使學員達到預期學習目標,具體包括理論講授,互動研討,問題講解,答疑解惑等環節。
本課程推薦主講教員采用兩類教學方法,一是主動學習(Active learning),通過提出預設問題、啟發分析思路、引導主動閱讀與思考、討論求解方法、反思問題求解成果等手段方法,充分調動激發學員主動學習知識、研究思考,加強學員對理論方法的理解與應用;二是研討式教學,以學生主動學習為基礎,在課堂上結合講授內容、相關案例、實際問題開展研討,充分激發學習興趣,鍛煉學生的創新思維與口頭表達能力。
課堂教學中可將案例式教學貫穿始終。針對規劃和決策算法比較抽象,不易理解的問題,對于課程中每個知識點,都結合實際的應用場景設計典型案例。例如在運動規劃部分,可借助掃地機器人、無人系統及典型運動體的運動規劃問題展開;在行動規劃部分,針對不同的規劃方法,可借助航空貨物運輸、汽車換胎、聯合作戰任務規劃等問題展開;在決策問題部分,可借助裝備維修決策、作戰方案優選、目標識別的問題展開。圍繞實際案例開展啟發式、討論式和互動式授課,激發學生參與互動和交流的興趣,培養學生發現問題根源、建立問題模型、探究問題解決思路和方法的能力,形成勤于思考、善于鉆研的科學精神。
4結語
智能規劃與決策課程組立足于人才培養目標,在分析課程定位和學情的基礎上,對課程內容、實驗設置和教學方法等內容進行了研究和探索。后續,隨著課程教學的實施,課程組將結合教學效果和反饋,在課程內容完善、課程思政元素設計、課程教材建設等方面不斷完善,并依托實驗平臺和雨課堂等新型教學手段上不斷提升教學水平,努力做好相關專業人才培養工作。
基金項目:本文得到2017年國防科技大學國家自然科學基金項目“災難環境中大規模人與智能體協作任務規劃(編號:61702528)”支持
參考文獻
[1]劉鴻福,張萬鵬,陳璟.基于建構主義理論的智能規劃課程教學研究[J].課程教育研究,2016(4):17-18.
[2]李杰,王菖,牛軼峰等.無人機系統智能決策課程教學設計與實踐[J].計算機教育,2016(10):11-14.
[3]牛軼峰,賈圣德,李杰等.以智能為核心的無人機系統課程體系設計[J].計算機教育,2016(10):37-41.
[4]王祥科,李杰,祝建成.面向本科生教育的無人機系統設計與綜合實踐教學探索[J].科技資訊,2020(14):120,122.
[5]Malik Ghallab,Dana Na等著.姜云飛,楊強等譯.自動規劃:理論和實踐(Automated Planning:Theory and Practice)[M].北京:清華大學出版社,2008.