

摘要:結合大數據應用的時代背景,高校教學科研的重心也隨之發生變化。機器學習課程作為數據科學與大數據技術專業的專業核心課,依托于現階段計算機技術的更新迭代,涉及多學科的交叉學科課程,兼顧理論與實踐應用。正因為學科的復雜性和時效性,本科生學習該課程面臨較大難度和挑戰,基于這一現狀,教師更應從理論出發,不斷探索大數據環境下機器學習課程教學的新模式。
關鍵詞:機器學習;大數據;教學研究
引言
大數據時代的到來依托于信息技術的不斷革新和發展,但是僅靠信息技術的發展,還是不能完全促使大數據時代的最終來臨。大數據時代的來臨必須依托于數據量的爆炸式增長和完善,而這在很大程度上取決于數據產生方式的變革。而在高校教學層面,隨著大數據應用的大量普及,機器學習的重要性也愈漸凸顯。機器學習是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科,專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能[1]。目前,機器學習技術已經成功應用于自動駕駛、自然語言處理、時間序列預測、生物醫學信息處理等領域,也因此喚醒了各個行業[2]。在此背景下,大數據專業方向的教學應高度重視對機器學習人才的培養,本文重點討論《機器學習》課程的教學改革方案與具體實踐。
1. 課程簡介
《機器學習》課程是一門介紹大數據基礎理論并與實踐相結合的課程,在注重大數據時代應用環境前提下,從初學者角度出發,以輕量級理論、豐富實例對比性地介紹大數據常用的各種基礎工具,主要講述機器學習的基本概念、方法分類、實際應用、常用工具及模型原理等。該課程考慮大數據集成需求多樣復雜的基本情況,將理論與實例結合,對比性地介紹機器學習原理和工具。
1.1 目標
考慮到當前大數據發展處于起步并逐步趕超先進的階段,應用領域豐富廣泛,在教學過程中應注重掌握大數據分析的實踐操作。課程旨在引導學生掌握扎實的機器學習基礎知識和相關應用方法、工具和環境。通過《機器學習》講授模型解決生活實際中可能遇到的數學問題,具備一定的大數據分析技術開發能力,培養獨立思考和判斷、分析問題和解決問題以及較強的實踐動手能力。
通過本課程的學習,學生可以了解機器學習中的算法模型原理,掌握機器學習的基本概念、決策樹等基本概念、降維、回歸、分類、聚類等模型及原理等。通過相關原理和設計方法的學習,為學生達到“對本領域復雜工程問題具有分析、設計和實現等能力”的專業培養目標奠定基礎,并培養學生適應大數據行業快速發展的素質,具備良好的大數據處理技術職業道德。
1.2 前置課程
作為數據科學與大數據技術專業本科生必修課,《機器學習基礎》的主要任務是講授包括監督學習、非監督學習、半監督學習等分支下的不同數學模型原理,同時通過大量實驗,培養學生的動手能力及對代碼的理解,從而達到靈活解決生產生活中具體實際問題的能力要求。選修課程是《python語言程序設計》《概率論》《數據分析與可視化》。
2. 課程教學面臨的挑戰
筆者認為,理想情況下的機器學習課程授課結果本應是理論知識、代碼實踐、實際應用的統一,這三者環環相扣,如圖1所示。然而在具體的教學過程中,情況往往不盡如人意。
在編訂教學大綱之時,大數據專業的培養目標是在課堂上首先傳授理論知識。在透徹理解機器學習每一章所需要的模型原理后,引出經典代碼示例,并在此基礎上輔以相關題目引導學生練習,在豐富了多種模型之后開始實際運用。
2.1 數學基礎與理論講解分離
根據實際講課情況來看,許多學生缺乏一定的數學基礎,無法較好地對之前學習過的數學模型進行靈活運用,導致課堂上還需要勻出一部分時間來完成對先前知識的復習,降低了學習效率?!稒C器學習》課程講授應以數據處理模型為主線,將本課程所涉及的各項知識點學習貫穿起來,方便學生理解和記憶。
在大數據專業的核心課程中,《機器學習》作為數學與計算機編程相結合的課程,需要對高等數學、線性代數、概率論等數學知識擁有較扎實的基礎,比如樸素貝葉斯章節時用到的貝葉斯公式、全概率公式,以及回歸時用到的偏導數概念。然而在大學三年級開設此門課程時,大部分學生表示對大學一年級時學過的數學模型與公式有所遺忘,導致課上不得不花費額外時間回顧以往內容。
2.2 代碼實踐與模型轉換分離
本門課程設置配套課程設計,期間所有項目均要求學生提供項目設計報告以及對應的項目代碼,杜絕任何抄襲及過度借鑒行為,鼓勵學生相互交流學習,并根據自己個人的興趣、愛好和能力,自主設計數據庫應用系統的功能。
在實際過程中,大部分學生僅能完成教師布置的指定題目。例如在學習決策樹模型時,學生會很容易理解剪枝與預剪枝的數學模型,基本都可以對決策樹的每一個剪枝步驟畫出相應圖形。但在將圖形化理論知識點轉換成代碼時卻不盡如人意。更有甚者,對著給出的參考代碼有樣學樣,直接對著屏幕一行行機械化打字,完全沒有任何思考,甚至在做完練習題后還是沒有對理論模型有較好的理解。
2.3 實際應用與課堂演練分離
在實踐過程中,學生要學會把實際問題抽象為軟件模型的思維方法,提高獨立分析和解決實際問題的能力,深化對大數據設計的理解,掌握必要的大數據技術分析、設計和開發方法。主要內容設置應遵循“兼顧課堂與實踐”的原則,引導學生學好課本知識的同時,利用課余時間動手實踐所學內容,真正做到學以致用。
實際上,學生在學會基本數據建模后,往往倦于思考更大數據集的應用,更難將課堂所學應用于生產實際。比如,在醫學方面可以使用機器學習中的邏輯回歸模型等來分析臨床參數用于疾病預測,還有助于治療計劃的改進。而在這一方面,大數據專業的學生在就業時也往往疏于思維拓展,只局限于互聯網行業的應用,甚至更多地偏向于純計算機方面的工作崗位,如軟件工程師等。
3. 課程教學探索思路
教學應重視教學方法的改革,根據教學內容適時靈活采用不同教學方法,例如啟發式、討論式、翻轉式、案例式等,并進行合理的教學設計,激發學生的學習興趣,訓練學生的分析判斷能力、表達能力、思維反應能力以及團隊合作能力。
3.1 線上學習和線下推演的融合
課堂教學采取在機房上課的模式。教師首先進行理論講解和實例演示,然后由學生進行練習案例,學生機需要安裝相關的軟件。而正因為《機器學習》課程需要在理論教學的基礎上輔以大量實踐,光靠課堂上的時間是遠遠不夠的,因而對其中的重點課程,應加以線上教學作為輔助,具體章節內容和教學方式如表1所示。
筆者認為,線下機房的授課仍然是教學的重中之重,然而教師還可以創新選擇“第二課堂”如學習通、網易云課堂等,通過直播課、錄播課、云端作業、測試、測評等方式,敦促學生合理利用課后時間訓練,教師可以在線上平臺規定時間點發布任務,通過線上方式檢查學生的課業進展并在課上統一糾錯輔導,進一步提高線下授課效率。
3.2 學生主導的課堂翻轉
翻轉課堂是指重新調整課堂內外的時間,將學習的決定權從教師轉移給學生。本課程作為專業主干必修課程,重點在于向學生介紹機器學習的基本模型及算法應用,其主要內容設置應遵循“兼顧課堂與實踐”的原則,引導學生在學好課本知識的同時,利用課余時間動手實踐所學內容,做到學以致用。尤其在課堂上,應主張“采用教師啟發和學生反饋的雙向模式,提高學生對理論知識的認知。[3]”
在教學探索中,筆者嘗試在課堂上提高學生的自主能動性,開展“算法+應用教學”的結合,引導學生主動學習機器學習知識,教師在課堂快速演示和總結。例如,在每節課后布置2~3個下節課的知識點,引導學生每節課課前通過提前查閱資料準備相關資料,鼓勵學生主動上前回答課堂演示,結合PPT與板書來獨立講解《機器學習》相關模型,從而有利于學生對各種分析方法的掌握和理解。
除組織課堂研討外,授課教師還應向學生及時提供答疑服務;要布置課外作業,課外作業應結合課程進度布置課后練習題,避免直接從教材上抄到答案的簡答題;作業應盡量全部批改,并及時進行作業講評。真正做到以學生為學習主體,從教師主導的灌輸式教學轉變為以學生為主體的自主式學習[4],充分發揮學生的學習興趣,調動學生的積極性與能動性。
3.3 課程考核辦法創新
本課程的授課模式為“課堂授課+上機”,其中,課堂主要采用多媒體方式進行授課,并通過測試題檢驗學生的掌握程度??己吮壤磳嶒灪屠碚摽荚?∶7的比例開展,期末考核方法為閉卷考試。期末考試成績為50分以下時,不允許加平時成績。其中,平時成績參考實驗課的學習情況,需要遵循一定的指導原則,并設計合理的考核方案,綜合、全面地評估學生對理論知識的掌握和實踐操作能力。
上機實驗主要是通過編寫程序來考查學生的動手能力,要求學生自主完成指定的程序設計或算法驗證,使學生增加對機器學習與實際生活應用的認識,提升理論聯系實際的工作能力。在上機實踐題目設計過程中,循序漸進采用“分單元—小綜合—實踐項目”的思路展開[5]。
結語
結合大數據應用的時代背景,高校教學科研的重心也隨之發生變化。《機器學習》課程作為數據科學與大數據技術專業的專業核心課,依托于現階段計算機技術的更新迭代,涉及多學科的交叉學科課程,兼顧理論與實踐應用。因其特殊的專業性和應用性,結合現階段本科學生的專業知識掌握情況,對于教師的教學要求較高。既不能難度過高,又不能將知識模型流于表面;既不能貪圖理論知識灌輸,又要結合當今大數據發展現狀,還需要學生熟練掌握并應用數學知識和python編程能力。
目前,高校本科生機器學習課程的創新實踐仍然處于起步摸索階段。在實際教學過程中,教師會遇到很多挑戰,但這也是對大數據專業教師的一次考驗。筆者認為,大數據環境下《機器學習》課程的教學探索更應該與時俱進,摒棄傳統的課堂教學模式,避免造成理論、代碼、實踐割離的結果,使得學生進一步提高學習興趣,從而對《機器學習》課程有更好的理解和應用,更好地為大數據行業培養專業人才。
參考文獻:
[1]李昊朋.基于機器學習方法的智能機器人探究[J].通訊世界,2019,26(4):241-242.
[2]曲衍鵬,鄧安生,王春立,等.面向機器學習課程的教學改革實踐[J].計算機教育,2014,(19):88-91.
[3]葉明全,黃道斌,盧小杰,等大數據時代下數據挖掘課程實踐教學探索[J].池州學院學報,2016,30(6):128-130.
[4]覃海煥,蘆立華,呂品,等.大數據技術課程混合式教學探索與實踐[J].福建電腦,2022,38(3):110-113.
[5]李潔,魏宇軒,武妍,等.機器學習課程中遞進式實驗案例設計[J].計算機教育,2022,(1):134-138.
作者簡介:杜科君,碩士研究生,助教,研究方向:數據科學。