周思博


人工智能是通過(guò)智能機(jī)器延伸、增強(qiáng)人類改造自然和治理社會(huì)能力的新興技術(shù)。近年來(lái),伴隨著大數(shù)據(jù)和高性能計(jì)算技術(shù)的發(fā)展,人工智能在機(jī)器學(xué)習(xí)領(lǐng)域取得了一系列重大技術(shù)突破,推動(dòng)了社會(huì)各領(lǐng)域從數(shù)字化、網(wǎng)絡(luò)化向智能化的躍升,深刻改變著人們的生活方式和思維模式。2017年7月,國(guó)務(wù)院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,明確“在中小學(xué)階段設(shè)置人工智能相關(guān)課程,逐步推廣編程教育”。在此大背景下,高中信息技術(shù)課程理應(yīng)肩負(fù)起踐行人工智能國(guó)家發(fā)展規(guī)劃、普及人工智能知識(shí)和培養(yǎng)學(xué)生信息技術(shù)核心素養(yǎng)的重任。
單元內(nèi)容與目標(biāo)分析
高中信息技術(shù)教材必修一“數(shù)據(jù)與計(jì)算”的第四章“走進(jìn)智能時(shí)代”向?qū)W生介紹了什么是人工智能和人工智能的關(guān)鍵技術(shù)及應(yīng)用。本章通過(guò)人工智能典型案例剖析,讓學(xué)生了解人工智能技術(shù)和智能信息處理的巨大進(jìn)步和應(yīng)用潛力,認(rèn)識(shí)人工智能在信息社會(huì)中的重要作用。本章的主要知識(shí)與概念的關(guān)系可以用圖1來(lái)概括。
理解人工智能及其關(guān)鍵技術(shù),感受人工智能的魅力是本章的教學(xué)重點(diǎn)之一,能編程調(diào)用平臺(tái)中的智能工具解決一般問(wèn)題既是本章的教學(xué)重點(diǎn)也是教學(xué)難點(diǎn)?;谡鹿?jié)教學(xué)的內(nèi)容和目標(biāo),同時(shí)對(duì)學(xué)生的興趣愛(ài)好、知識(shí)儲(chǔ)備和思維水平等方面進(jìn)行學(xué)情分析,我們?cè)O(shè)計(jì)了人工智能基礎(chǔ)知識(shí)、機(jī)器學(xué)習(xí)、語(yǔ)音技術(shù)(語(yǔ)音識(shí)別和語(yǔ)音合成)、自然語(yǔ)言處理、機(jī)器視覺(jué)(人臉識(shí)別、文字識(shí)別)等教學(xué)內(nèi)容,盡可能在有限的課時(shí)內(nèi)涵蓋生活中常見(jiàn)的人工智能技術(shù)及應(yīng)用場(chǎng)景,通過(guò)剖析實(shí)例、原理歸納、問(wèn)題解決等環(huán)節(jié)力求解決教學(xué)重點(diǎn),突破教學(xué)難點(diǎn)。本文以機(jī)器學(xué)習(xí)一課為例,對(duì)高中人工智能的課堂教學(xué)做簡(jiǎn)要介紹。
機(jī)器學(xué)習(xí)課的教學(xué)內(nèi)容與目標(biāo)分析
“機(jī)器學(xué)習(xí)”最早于1956年由亞瑟·塞繆爾在達(dá)特茅斯會(huì)議上提出:機(jī)器學(xué)習(xí)是能讓計(jì)算機(jī)不依賴確定的編碼指令而自主地學(xué)習(xí)工作。機(jī)器學(xué)習(xí)經(jīng)典的例子就是房屋價(jià)格預(yù)測(cè)的問(wèn)題。假設(shè)我們要預(yù)測(cè)某間房屋的價(jià)格,首先需要若干數(shù)據(jù),這些數(shù)據(jù)包含了可能的房?jī)r(jià)影響因素,如房屋面積、地理位置、房間數(shù)量等。假如有500組數(shù)據(jù),每組數(shù)據(jù)都包含了上述的影響因素和對(duì)應(yīng)的房屋價(jià)格,而機(jī)器學(xué)習(xí)的目標(biāo)就是從這樣的多組數(shù)據(jù)中尋找出一種內(nèi)在關(guān)系來(lái)產(chǎn)生預(yù)期的房屋價(jià)格。
在機(jī)器學(xué)習(xí)領(lǐng)域眾多模型當(dāng)中,回歸模型是最為簡(jiǎn)單的一種?;貧w的核心思想是把規(guī)律沒(méi)有外顯的一組數(shù)據(jù),借助于誤差衡量手段,發(fā)掘其潛在規(guī)律,形成不同變量間的定量關(guān)系。回歸分析一般適用于求解因變量是連續(xù)值的情況,如氣溫變化、銷售額、股票走勢(shì)等。因變量和自變量之間的關(guān)系如果類似于一次函數(shù),則屬于線性回歸問(wèn)題;如果類似于指數(shù)函數(shù)或?qū)?shù)函數(shù),則屬于非線性回歸問(wèn)題。線性回歸在數(shù)理統(tǒng)計(jì)中的應(yīng)用已經(jīng)有超過(guò)200年的歷史,是人工智能技術(shù)中最為直接和明了的算法。
“機(jī)器學(xué)習(xí)初探—— 基于Python的線性回歸問(wèn)題解決”一課的內(nèi)容來(lái)源于教材必修一第四章的第一節(jié)和第二節(jié),是對(duì)教材內(nèi)容的重組和補(bǔ)充。本課旨在通過(guò)剖析案例,讓學(xué)生了解機(jī)器學(xué)習(xí)中回歸算法的基本原理、能舉例說(shuō)明回歸算法的應(yīng)用場(chǎng)景、掌握線性回歸的求解方法,經(jīng)歷使用智能工具解決問(wèn)題的過(guò)程,掌握利用回歸算法和智能工具解決問(wèn)題的一般方法。
教學(xué)環(huán)節(jié)一:?jiǎn)栴}引入與實(shí)例剖析
“回歸”一詞聽(tīng)起來(lái)仿佛比較陌生,但其實(shí)在學(xué)生的日常學(xué)習(xí)中經(jīng)常會(huì)運(yùn)用到回歸的思想。如高一物理實(shí)驗(yàn)“探究事物運(yùn)動(dòng)的特點(diǎn)和規(guī)律”。在實(shí)驗(yàn)中,我們通常會(huì)借助打點(diǎn)計(jì)時(shí)器和紙帶,通過(guò)記錄小車速度和時(shí)間的多組數(shù)據(jù),推測(cè)出運(yùn)動(dòng)速度隨時(shí)間變化的規(guī)律。因此,在本課中以學(xué)生熟悉的物理實(shí)驗(yàn)數(shù)據(jù)作為引入,引導(dǎo)學(xué)生體會(huì)機(jī)器學(xué)習(xí)中線性回歸的思想。在“探究小車的運(yùn)動(dòng)速度隨時(shí)間變化的規(guī)律”的實(shí)驗(yàn)中,學(xué)生會(huì)獲得一組時(shí)間與速度的實(shí)驗(yàn)數(shù)據(jù)。學(xué)生根據(jù)現(xiàn)有知識(shí),利用紙、筆或Excel軟件繪制一幅散點(diǎn)圖并添加一條趨勢(shì)線,盡量讓更多的點(diǎn)擬合直線并以此觀察這些點(diǎn)的分布特點(diǎn)。然后學(xué)生根據(jù)數(shù)學(xué)知識(shí)計(jì)算出速度和時(shí)間的關(guān)系表達(dá)式,同時(shí)可以在Excel中選擇在圖表中顯示R平方值(即擬合程度,越接近1代表擬合圖像越趨近于真實(shí)情況)。
通過(guò)對(duì)多組實(shí)驗(yàn)數(shù)據(jù)進(jìn)行處理和分析,學(xué)生可以發(fā)現(xiàn)速度和時(shí)間兩個(gè)變量呈線性關(guān)系,并且通過(guò)建立兩者之間的關(guān)系模型可以推測(cè)出任意時(shí)刻小車的速度。這一實(shí)驗(yàn)的具體步驟可以歸結(jié)為:收集樣本數(shù)據(jù)—繪制散點(diǎn)圖—生成線性方程和擬合線—根據(jù)數(shù)學(xué)模型預(yù)測(cè)時(shí)間為某一數(shù)值時(shí)的速度大小。至此,我們通過(guò)學(xué)生已知的實(shí)例感性體驗(yàn)了線性回歸預(yù)測(cè)方法及過(guò)程。
教學(xué)環(huán)節(jié)二:原理歸納與模擬實(shí)戰(zhàn)
在引入實(shí)例中,學(xué)生在教師的引導(dǎo)下體驗(yàn)并理解了線性回歸的過(guò)程和原理,那么如何讓計(jì)算機(jī)完成這一過(guò)程并實(shí)現(xiàn)數(shù)據(jù)計(jì)算和分析是理解機(jī)器學(xué)習(xí)的關(guān)鍵,也是本課的重要知識(shí)點(diǎn)。學(xué)生通過(guò)剖析上一個(gè)實(shí)例可以得出結(jié)論,即計(jì)算機(jī)解決這類問(wèn)題也需要經(jīng)過(guò)“收集樣本數(shù)據(jù)—計(jì)算生成數(shù)學(xué)模型—根據(jù)數(shù)學(xué)模型輸出結(jié)果”等基本步驟。由此教師可以根據(jù)學(xué)生的思考結(jié)果進(jìn)一步講解機(jī)器學(xué)習(xí)的一般過(guò)程:收集數(shù)據(jù)—訓(xùn)練模型—測(cè)試模型—使用模型,完成這一原理概念的講授。
明確機(jī)器學(xué)習(xí)和線性回歸的原理之后,利用原理編寫程序調(diào)用平臺(tái)中的智能工具解決實(shí)際問(wèn)題就是本課最核心的任務(wù)。利用Python語(yǔ)言開(kāi)發(fā)人工智能,一方面結(jié)合了當(dāng)前人工智能技術(shù)的發(fā)展及Python語(yǔ)言在人工智能開(kāi)發(fā)上的優(yōu)勢(shì),另一方面利用Python語(yǔ)言編程解決問(wèn)題貫穿在必修一的各章內(nèi)容之中,學(xué)生能夠更加熟練地理解和運(yùn)用。在本課中,學(xué)生需要學(xué)習(xí)利用Python中的sklearn及matplotlib模塊實(shí)現(xiàn)線性回歸算法并解決實(shí)際問(wèn)題。
學(xué)生根據(jù)“探究小車的運(yùn)動(dòng)速度隨時(shí)間變化的規(guī)律”的實(shí)驗(yàn)數(shù)據(jù),編程求得速度與時(shí)間之間的定量關(guān)系;再借助Python編程語(yǔ)言中的sklearn模塊來(lái)探索兩個(gè)變量之間的線性關(guān)系,并以時(shí)間為x軸,速度為y軸,通過(guò)matplotlib模塊繪制出擬合圖像。
對(duì)照機(jī)器學(xué)習(xí)的一般過(guò)程解析程序代碼,學(xué)生可以明確和理解運(yùn)用fit、predict和score來(lái)訓(xùn)練數(shù)據(jù),得出模型、使用模型預(yù)測(cè)結(jié)果和評(píng)估模型的sklearn基本函數(shù)的使用方法。而對(duì)于LinearRegression最小二乘線性回歸需要稍作說(shuō)明:最小二乘法是一種機(jī)器學(xué)習(xí)的優(yōu)化技術(shù),將殘差平方值和最小化作為目標(biāo),找到最優(yōu)模型來(lái)擬合已知的數(shù)據(jù),從而使預(yù)測(cè)數(shù)據(jù)與實(shí)際數(shù)據(jù)的誤差平方和最小,即預(yù)測(cè)數(shù)據(jù)最接近實(shí)際數(shù)據(jù)。
通過(guò)程序運(yùn)行,學(xué)生們得到了速度與時(shí)間的關(guān)系式和R的平方值,繪制出了散點(diǎn)圖和擬合曲線。如果算法訓(xùn)練完成后,得到的R的平方值非常接近1,說(shuō)明訓(xùn)練得出的模型效果較好,計(jì)算所得的擬合直線非常符合數(shù)據(jù)點(diǎn)的變化趨勢(shì)。由此可見(jiàn)給定一組數(shù)據(jù),在假設(shè)數(shù)據(jù)中存在一元線性關(guān)系的前提下,就可以通過(guò)機(jī)器學(xué)習(xí)中的線性回歸算法來(lái)擬合數(shù)據(jù),然后進(jìn)行預(yù)測(cè)。
教學(xué)環(huán)節(jié)三:?jiǎn)栴}解決與拓展思考
學(xué)生在高一政治課中學(xué)習(xí)過(guò)市場(chǎng)經(jīng)濟(jì)的相關(guān)內(nèi)容,其中分析居民消費(fèi)價(jià)格指數(shù)和商品零售價(jià)格指數(shù)之間的關(guān)系并研究其對(duì)市場(chǎng)經(jīng)濟(jì)規(guī)律的影響這一實(shí)例是非常典型的線性回歸問(wèn)題。因此,教師可以讓學(xué)生獨(dú)立嘗試運(yùn)用線性回歸的原理和Python編寫程序分析解決這一問(wèn)題。
教師給出自2007年至2017年全國(guó)居民消費(fèi)價(jià)格指數(shù)和商品零售價(jià)格指數(shù)之間的若干關(guān)系。請(qǐng)學(xué)生試判斷居民消費(fèi)價(jià)格指數(shù)與商品零售價(jià)格指數(shù)之間是否符合線性關(guān)系。如符合,請(qǐng)通過(guò)回歸分析計(jì)算出兩者之間的關(guān)系模型。
學(xué)生將教師提供的數(shù)據(jù)整理后導(dǎo)入Python程序,通過(guò)LinearRegression、fit、predict和score等函數(shù)對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練和測(cè)試,得到居民消費(fèi)價(jià)格指數(shù)和商品零售價(jià)格指數(shù)之間的關(guān)系式和R的平方值,并繪制出散點(diǎn)圖和擬合曲線(圖2)。最終學(xué)生得出結(jié)論:居民消費(fèi)價(jià)格指數(shù)和商品零售價(jià)格指數(shù)符合線性關(guān)系,居民消費(fèi)價(jià)格指數(shù)和商品零售價(jià)格指數(shù)是同時(shí)變化的。
得出上述結(jié)論的同時(shí),會(huì)有學(xué)生發(fā)現(xiàn)問(wèn)題:隨著探究數(shù)據(jù)范圍的擴(kuò)大,就會(huì)有一些點(diǎn)嚴(yán)重偏離擬合線,這樣是否會(huì)對(duì)預(yù)測(cè)結(jié)果產(chǎn)生影響呢?借著學(xué)生們提出的問(wèn)題,教師可以引導(dǎo)學(xué)生們討論如何讓預(yù)測(cè)更加準(zhǔn)確,如去除異常值、擴(kuò)大數(shù)據(jù)范圍等,以此對(duì)于線性回歸問(wèn)題做更深入的探究和思考。
總結(jié)與反思
線性回歸模型是一種最基礎(chǔ)的機(jī)器學(xué)習(xí)算法。在本課中,我們通過(guò)對(duì)學(xué)生熟悉的物理實(shí)驗(yàn)數(shù)據(jù)以及政治課中學(xué)到的社會(huì)經(jīng)濟(jì)指標(biāo)數(shù)據(jù)進(jìn)行分析,實(shí)現(xiàn)讓學(xué)生理解機(jī)器學(xué)習(xí)中線性回歸算法的原理,并能運(yùn)用Python程序設(shè)計(jì)機(jī)器學(xué)習(xí)的一般過(guò)程,判斷兩個(gè)變量之間的關(guān)系,生成數(shù)學(xué)模型并測(cè)試評(píng)估,最終實(shí)現(xiàn)問(wèn)題的解決。通過(guò)本節(jié)課的學(xué)習(xí),學(xué)生能夠剖析具體案例,了解人工智能的核心算法;描述典型人工智能算法(線性回歸)的實(shí)現(xiàn)過(guò)程,親歷設(shè)計(jì)與實(shí)現(xiàn)簡(jiǎn)單智能系統(tǒng)的基本過(guò)程與方法。可以說(shuō)本節(jié)課實(shí)現(xiàn)了對(duì)學(xué)生信息技術(shù)學(xué)科核心素養(yǎng)培養(yǎng)的目的。
隨著智能時(shí)代的發(fā)展,人工智能越來(lái)越多地應(yīng)用在我們生活的方方面面。了解人工智能相關(guān)知識(shí)不僅是信息技術(shù)學(xué)科教學(xué)的要求,也是作為信息時(shí)代公民需要具備的基本素養(yǎng)。在高中階段依托信息技術(shù)必修模塊進(jìn)行人工智能內(nèi)容的教學(xué)如何實(shí)施?如何選擇難易適度又貼合學(xué)生生活實(shí)際的案例?如何將原理與實(shí)踐相結(jié)合?本文略作嘗試,不足之處,仍需繼續(xù)研究改進(jìn)。
參考文獻(xiàn)
中華人民共和國(guó)教育部. 普通信息技術(shù)課程標(biāo)準(zhǔn):2017年版[M]. 北京:人民教育出版社,2018.
劉曉杰. 人工智能課程中基本算法與模型的案例研究[J]. 中國(guó)教育信息化,2019(9): 32-35.
韓萌. 居民消費(fèi)價(jià)格指數(shù)和商品零售價(jià)格指數(shù)的分析——基于一元線性回歸分析[J]. 現(xiàn)代商業(yè),2020,(17): 12-13.
王立友. 基于Python的線性回歸最小二乘算法的設(shè)計(jì)與實(shí)現(xiàn)[J]. 電腦知識(shí)與技術(shù),2021,17(35): 123-124+133.