吳迪
【摘要】? 在充分考慮人工智能專業特點的基礎上,本文對人工智能專業數學基礎課的教學進行了研究和探討,特別是高等數學、線性代數、最優化方法和數理統計四門數學基礎課.
【關鍵詞】人工智能專業;高等數學;線性代數;最優化方法;數理統計
【基金項目】國家自然科學基金,2021年1月(62006149);陜西省自然科學基金,2020年1月(2020JQ-403)
一、引言
近年來,全國百所高校新增了人工智能本科專業,該專業對數學基礎的要求較高.因此,該專業的數學基礎課教學受到廣泛的關注,是一個重要研究課題.
“機器學習”是學生選修最多的信息類專業課之一,被認為人工智能專業最核心的課程,是人工智能專業對數學基礎要求最高的課程之一.“最優化方法”(以下簡稱“優化”)和“數理統計”是機器學習課重要的先修數學課;“高等數學”(以下簡稱“高數”) 和“線性代數”(以下簡稱“線代”)是優化課和數理統計課重要的先修數學課.
對于人工智能本科專業的二年級學生,筆者已經講授優化課.筆者在教學過程中發現數學課和機器學習課的銜接存在問題.為了改善此情況,教師應根據機器學習課的要求對數學課的教學內容進行調整,并根據優化課和數理統計課的要求對高數課和線代課的教學內容進行調整.
為了更加深刻地理解機器學習的本質,多數選修機器學習課的學生希望教師補充與機器學習有關的數學基礎知識.由于人工智能專業數學課的設置充分考慮到機器學習課的要求,本文的內容可為這些學生提供參考.
全國高校新增了大量與人工智能相關的本科專業,如智能感知工程、智能交互設計和智慧交通.這些專業的部分課程與人工智能本科專業相近,因此,本文對這些專業的教師和學生有參考價值.
二、人工智能專業數學課的設置
在筆者所在學院,人工智能本科專業是在計算機科學與技術本科專業的基礎上發展而來的,繼承了計算機科學與技術本科專業的相關課程,包括四門數學課(高數、線代、概率論和離散數學).
針對人工智能本科專業,筆者所在學院新開設了機器學習、數據挖掘、計算機視覺、深度學習等課程.機器學習是數據挖掘、計算機視覺、深度學習等新開設課程的重要先修課程.機器學習課程被認為這些新開設課程中最核心的課程,是這些新開設課程中對數學基礎要求最高的課程之一.因此,筆者所在學院建議教師根據機器學習課程的要求對數學課的設置進行調整.
除了從計算機科學與技術本科專業繼承的四門數學課外,還有多門數學課與機器學習高度相關.這些數學課可粗略分為兩類:“數值類”和“統計類”.數值類課程有數值優化、數值計算方法和統計計算;統計類課程有數理統計、多元統計、隨機過程、貝葉斯統計和統計計算.需要注意的是,統計計算既在數值類課程中,又在統計類課程中.另外,為了方便討論,本文將隨機過程課歸入統計類.
筆者建議在計算機科學與技術本科專業繼承的四門數學課的基礎上,進一步開設與機器學習相關性較高的兩門數學課,即一門為數值類課程,一門為統計類課程,具體有如下兩個原因:第一,由于考慮到學時的限制,筆者建議新開設的數學課不超過兩門.第二,由于機器學習課中既用到大量數值類課程的思想,又用到大量統計類課程的思想,數值類課程和統計類課程盡可能都開設.
筆者建議開設的數值類課程為優化課,而開設的統計類課程為數理統計課,具體有如下三個原因:第一,在數值類課程中,教師一般認為優化對機器學習課最重要.第二,在統計類課程中,教師一般認為數理統計和多元統計對機器學習課最重要.第三,數理統計是多元統計、貝葉斯統計和統計計算的先修課程,因此,在這四門課程中,教師一般優先考慮開設數理統計課.
為了保證機器學習課的教學,教師在優化課和數理統計課中可適當補充其他與機器學習相關的數學知識.另外,數學課和機器學習課講授的內容之間相關性高,因此,數學課和機器學習課的授課教師之間應充分溝通,避免課程講授內容的不協調.
下面分別介紹人工智能專業高數課、線代課、優化課和數理統計課的教學安排.
三、人工智能專業高數課的教學
在人工智能專業的課程中,優化課被認為對高數要求最高的課程,因此,高數課的開設應充分考慮優化課的要求.優化課和機器學習課中常用到多元函數微分和向量值函數微分.因此,筆者認為在高數課中可適當加強對這部分內容的講授.
多元函數微分是優化課的重要基礎.多元函數的方向導數與梯度是最速下降法、共軛梯度法等的基礎;多元函數的泰勒公式是牛頓法、擬牛頓法等的基礎.因此,在高數課的教學過程中,教師應更重視對這部分內容的講授.
高數教材通常將向量值函數微分作為選修內容,而且教師一般不對其進行講授.然而,優化課和機器學習課常用到向量值函數微分,如神經網絡的算法推導用到向量值函數微分.因此,教師應在高數的教學過程中講授向量值函數微分的內容.
如果課時允許,那么教師還可以在高數課中補充范數和泛函數的基本內容,這些知識與機器學習課和優化課的相關性較高,如KL散度和變分推斷法就用到泛函數的思想.
四、人工智能專業線代課的教學
數理統計課、優化課和機器學習課中常用到矩陣、二次型和線性變換的相關內容.因此,筆者認為在線代課中可適當加強對這部分內容的講授.
矩陣是人工智能專業課程中的重要概念,也是二次型和線性變換的基礎.在數理統計課中,協方差矩陣是教學的重點和難點.在優化課中,黑塞矩陣是最優性條件、牛頓法和擬牛頓法的基礎.
二次型是數理統計課和優化課的重要基礎.在數理統計課中,正態分布的概率密度函數用到二次型.在優化課中,共軛梯度法、牛頓法和擬牛頓法用到二次型.
線性變換是數理統計課和機器學習課的核心之一.在數理統計課中,教師常用線性變換將一般正態分布變為標準正態分布.在多層神經網絡中,相鄰隱含層關系的構建用到線性變換.
五、人工智能專業優化課的教學
在充分考慮機器學習課要求的基礎上,本文具體介紹了人工智能專業優化課的教學安排.優化課中通常包括以下三個方面的內容.
(一)教材選擇
在人工智能專業中,為了保證先修課程和后續課程的開設,機器學習課常在本科三年級第一學期開設.優化課的開設一般早于機器學習課且晚于高數課,因此,優化課一般在本科二年級開設.教材選擇對優化課教學的開展至關重要,下面將分別討論三類常見的優化課教材.
第一類優化課(常稱作“運籌學”)教材主要針對經濟和管理專業的學生,其中的大部分內容與機器學習課的相關性較低,因此,筆者認為這類教材不太適合人工智能專業.
第二類優化課教材主要針對工科專業研究生和數學專業本科生,其對數學基礎要求較高且難度較高.在人工智能專業中,低年級學生的數學基礎一般且理解程度有待提高,因此,筆者認為這類教材不太適合人工智能專業.
第三類優化課教材主要針對工科專業本科生,其與機器學習課的相關性較高,對數學基礎要求適中且難度適中,因此,筆者認為這類教材適合人工智能專業.
(二)理論內容的教學
筆者在教學過程中發現優化課理論內容的難度高,對數學基礎的要求高,在開設過程中遇到的問題一般多于同期開設的數學課.因此,教師應在講授時放慢節奏且多提問題,讓學生有充足的思考時間.
大量機器學習模型的訓練要用到優化方法,如神經網絡的訓練一般用到最速下降法,而支持向量機的訓練用到對偶問題的知識.因此,優化課的教學應充分考慮機器學習的要求.
教師可以先重點講授無約束非線性規劃,再重點講授約束非線性規劃.為了幫助學生理解約束非線性規劃,教師可以在講授約束非線性規劃前適當講授線性規劃的內容.如果課時有限,那么教師可以不講授多目標規劃問題、離散型優化問題等.
對于線性規劃,教師可以講授幾何特征、標準型和對偶問題;對于無約束非線性規劃,教師可以講授教材里的全部內容;對于約束非線性規劃,教師可以講授KT條件、泛函數法和可行方向法.如果課時不夠,那么教師可以不講授泛函數法或可行方向法.
數值計算方法是多門人工智能專業課程的基礎.神經網絡等很多機器學習模型本質上是在解決函數逼近問題.在優化課、數理統計課和機器學習課中,黑塞矩陣、協方差矩陣等的計算常用到矩陣計算的知識.在數理統計課和機器學習課中,期望等的求解常用到數值積分.在優化課和機器學習課中,梯度等的求解常用到數值微分.因此,教師可以在優化課中補充數值計算方法的相關內容,如函數逼近、矩陣計算、數值積分和數值微分.
智能計算是優化課的重要后續課程,與優化課關系密切,主要講授一類求解函數極值的方法.如果開設智能計算課,教師就可以不在優化課里補充智能計算的部分內容;如果不開設智能計算課,教師就可以在優化課里補充智能計算的部分內容.
(三)實踐內容的教學
大部分人工智能專業的學生將來不是在高校和研究所從事人工智能科學研究,而是在百度、阿里巴巴等公司解決人工智能技術問題,這些公司對學生算法設計和算法實現能力的要求較高.因此,在優化課上,教師應重視算法設計和算法實現內容的教學.
上機實踐能訓練學生的算法設計能力和算法實現能力,因此,教師有必要在學校機房開設實踐課.如果沒有條件開設實踐課,教師就可以布置實踐作業,并讓學生在課下完成這些作業.
一些學校要求期末考試成績的占比不得低于70%,而且一般情況下,期末考試主要考查理論內容.鑒于實踐內容難以考查的現狀,這些學校實踐內容的課時應略少于理論內容.
優化教材通常以Matlab作為編程語言,但對人工智能專業應以Python作為優化課的編程語言,具體有如下兩個原因:第一,Matlab軟件的購買價格過高.第二,Python是人工智能領域應用最廣泛的編程語言,是人工智能專業課程使用最多的編程語言.為了保證教學效果,筆者建議在優化課前開設Python課.
六、人工智能專業數理統計課的教學
在數理統計課中,教師可以補充多元統計、隨機過程和貝葉斯統計的相關內容,如多元回歸分析、判別分析、聚類分析、主成分分析、馬爾可夫鏈和貝葉斯推斷.在優化課或數理統計課中,教師可以補充統計計算的相關內容,如蒙特卡洛方法和期望最大化算法.
統計計算的內容是在優化課中補充還是在數理統計課中補充,要視具體情況而定.如果優化課在數理統計課后開設,那么教師應在優化課里補充統計計算的內容;如果優化課不在數理統計課后開設,那么教師應在數理統計課里補充統計計算的內容.以上安排可保證,在教師講授統計計算的內容時,這兩門課與統計計算相關性高的內容基本講授完成.
多元統計課、統計計算課和機器學習課研究的對象一般都是多維數據,并且三門課共同關注一些問題,如多元回歸分析、判別分析、聚類分析和特征提取(降維).由于三門課的高度相關性,筆者認為在機器學習課前,教師適當講授多元統計和統計計算的內容是有必要的.
【參考文獻】
[1]南京大學人工智能學院.南京大學人工智能本科專業教育培養體系[M].北京:機械工業出版社,2019.
[2]陳愛斌,張釗源.人工智能專業數值分析課程教學研究與探討[J].計算機教育,2019(10):71-73.
[3]李航.統計學習方法(第2版)[M].北京:清華大學出版社,2019.
[4]施光燕,錢偉懿,龐麗萍.最優化方法(第二版)[M].北京:高等教育出版社,2007.
[5]馬昌鳳.最優化方法及其Matlab程序設計[M].北京:科學出版社,2010.
[6]盛驟,謝式千,潘承毅.概率論與數理統計(第四版)[M].北京:高等教育出版社,2010.
[7]華東師范大學數學系.數學分析:下冊(第四版)[M].北京:高等教育出版社,2010.
[8]北京大學數學系幾何與代數教研室前代數小組.高等代數(第三版)[M].北京:高等教育出版社,2007.