
[摘" " 要] 隨著學科交叉趨勢的發展,對于財經類高校部分本科非計算機專業,如會計學、經濟學等,機器學習課程也成為專業課程。對這些專業而言,機器學習課程的建設面臨著一些挑戰。本文從財經類高校的角度,對非計算機專業機器學習課程教學進行研究。本研究在分析機器學習課程目前在理論教學、實踐教學和課程考核等方面面臨的挑戰基礎上,從理論知識、實踐應用和考核方式三個方面面向財經類高校本科生進行機器學習課程設計,將課程主要分為三個模塊:基礎模塊、進階模塊和綜合實踐模塊,最后對本課程教學效果進行了總結。
[關鍵詞] 機器學習;教學改革;課程設計;財經類高校;教學探索
doi : 10 . 3969 / j . issn . 1673 - 0194. 2023. 03. 058
[中圖分類號] G642" " [文獻標識碼]" A" " " [文章編號]" 1673 - 0194(2023)03- 0212- 04
0" " " 引" " 言
全球信息化背景下大數據已成為國家重要的基礎性戰略資源,引領新一輪科技創新,推動我國經濟轉型發展。對大數據的管理和價值挖掘日益引起社會各界的高度重視,隨著大數據時代的到來,大數據技術技能日益成為人才的必備技能,大數據技術包含范圍很廣,其中機器學習是其核心理論和關鍵能力。
隨著學科交叉趨勢的發展,對于財經類高校部分非計算機本科專業,如會計學、經濟學等專業,機器學習課程也成為專業課程[1]。對這些專業而言,機器學習課程的建設面臨著一些挑戰,因此本文從財經類高校的角度,對財經類高校非計算機專業機器學習課程教學進行研究。
機器學習致力于研究如何通過計算的手段,利用經驗來改善系統自身的性能,從而在計算機數據中產生“模型”,用于對新的情況給出判斷[2]。機器學習融合了數學、統計學和計算機科學的知識,是一門綜合交叉學科[3]。在過去一段時間里,機器學習技術逐漸應用到語音識別、圖像識別、機器翻譯等諸多領域,對人們的工作和生活產生了越來越大的影響。
1" " " 機器學習課程教學面臨挑戰
大部分高校針對本科生的機器學習課程,近幾年才開始開設,因此,可借鑒的成熟經驗較少。機器學習課程有自己的特點,因此在課程設計、課程實施和課程考核等各環節,都面臨著一些問題。目前機器學習課程教學主要在以下方面面臨挑戰。
1.1" "理論教學
機器學習是多領域交叉的學科,涉及相關知識多,本身內容復雜。對于財經類高校經管類專業而言,由于屬于非計算機專業,缺乏理應必備的相關基礎知識,如編程、數據結構、凸優化等,機器學習課程內容較多,因此如何選擇適合的課程內容,進而把握理論教學的深度,是一個挑戰。
1.2" "實踐教學
改變傳統的以機器學習理論知識為主的教學方式,以解決機器學習實際問題為目標,增強學生數據思維,提高學生綜合運用所學知識解決實際問題能力,是當前背景下大數據技術人才的培養要求[4]。因此如何結合財經類高校專業特點,設計與專業培養相匹配的實踐內容很重要。同時,對實踐課程考核時,經常會出現抄襲等現象,無法真實檢驗同學們解決問題的能力,無法實現對學生實踐創新能力培養的目標[5]。
1.3" "課程考核
本科生機器學習課程除了學習機器學習基礎理論和算法外,還應該著重培養學生解決實際問題的能力,在對課程學習效果進行考核時,傳統的閉卷考試形式可以檢測學生對機器學習理論的掌握程度,但是無法體現學生解決實際問題的水平,期末案例作業可以衡量學生的綜合實踐能力,但無法衡量學生對理論知識的掌握情況,也無法對學生的學習進行過程性監督[6]。
2" " " 面向本科生的機器學習課程設計和教學模式
2.1" "課程設計原則
面向財經類院校本科生開設機器學習課程要面臨專業知識異質性問題。機器學習課程覆蓋財經類院校非計算機專業,學生們專業具有差異,學生專業知識具有異質性問題,因此要求課程內容能夠滿足不同專業背景學生的學習要求。課程除了讓學生掌握基本的機器學習理論外,重點讓學生掌握機器學習相關工具的使用并能夠獨立完成機器學習建模任務,學會調整參數、優化模型和評估模型等方法,通過課程學習培養學生的數據分析思維和數據挖掘建模能力。
2.2" "理論知識
為了優化教學內容,需要從人才培養的目標整體出發,一方面,教學內容要適量并且不重復,另一方面,教學內容的選擇要適合學生專業基礎和特點。課題內容合理安排和組合,才能夠充分發揮課程的人才培養功能[7]。
機器學習是一門實踐性較強的課程。學生在掌握高等數學、線性代數、概率論與數理統計、Python數據分析等課程基礎上進行學習。本課程提供機器學習基礎講解,讓學生能夠較為全面地了解機器學習這門學科的各類問題和方法論。
課程主要分為三個模塊:第一部分為基礎模塊,第二部分為進階模塊,第三部分為綜合實踐,課程學習框架如圖1所示。本課程注重理論教學與實踐教學相結合,通過本課程的學習,學生將熟練掌握機器學習基礎理論和算法,能夠運用Python完成數據挖掘建模工作。
理論部分學習內容主要集中在基礎模塊和進階模塊?;A模塊的理論知識主要包括機器學習基礎知識、模型評估與選擇和數據預處理。算法模塊的理論知識主要包括有監督學習和無監督學習兩類算法,有監督學習算法主要學習線性模型、決策樹、神經網絡、支持向量機、集成學習等算法;無監督學習主要學習聚類算法。教師授課應思路清晰、內容豐富、重點突出、邏輯性強,注重本門課程的基礎性和實用性。
2.3" "實踐應用
在機器學習教學中,理論教學與實踐教學形成同構關系,是對等和映射的[7]。本課程注重學生實踐能力的培養,設置實驗上機來鞏固學生對于機器學習算法的理解,通過實驗鍛煉學生的動手能力,教授并培養學生理論與實踐相結合的能力和進一步深入學習有關知識的潛能。
課程實驗采用上機的方式進行,以Python 3作為數據分析工具,Python是一種解釋型、面向對象的程序設計語言,具有豐富的開源庫。具體實驗環境采用一款支持Python的應用程序——Jupyter Notebook,Jupyter能讓用戶將說明文本、數學方程、代碼和可視化內容全部組合到一個易于共享的文檔中,同時Jupyter支持B/S架構部署。
在三個學習模塊中均涉及實踐內容,基礎模塊部分的實踐內容主要是Python數據分析基礎,涉及的Python軟件庫包括Numpy, Pandas和Matplotlib,其中Numpy是Python的一個科學計算的庫,提供了矩陣運算的功能;Pandas是一個主要用于數據處理、數據分析的庫;Matplotlib是一個繪圖庫。
進階模塊的實踐內容主要側重機器學習算法的基礎使用,涉及的Python軟件庫包括Sklearn和Keras,Sklearn是一個機器學習庫,Sklearn 全稱 Scikit-learn,它涵蓋了分類、回歸、聚類、降維等模塊,降低了機器學習實踐門檻;Keras是一個神經網絡庫,可以進行深度學習模型的設計、調試、評估、應用和可視化。
綜合實踐模塊側重完整機器學習項目的學習,根據經管類專業特點,本課程選擇一些經典的難度較低的案例進行講授和練習,如泰坦尼克號乘客生存預測、用戶流失預測、客戶價值分析等。
本課程實踐教學依托天池AI實訓平臺①進行,天池AI實訓平臺基于阿里云計算環境,支持Python語言和在線交互式數據分析工具Notebook,同時具備豐富的實際案例和數據集。
2.4" "考核方式
本課程教學內容分為理論和實踐兩部分,考慮到傳統期末筆試和實踐類作業各自優勢,本課程考核方式將二者進行了結合。
對于理論知識的考核主要通過平常理論練習作業和期末筆試進行,平常理論練習作業,是為了使同學們在理論學習的過程中,通過練習作業加深對理論的理解程度。期末筆試綜合考察同學們對課程理論知識的掌握水平。
對于實踐考核主要通過平時實驗練習作業和綜合實驗作業的形式進行。平時實驗練習側重于同學們對基礎實踐能力的考查。綜合實驗作業考查同學們綜合應用機器學習和數據挖掘技術解決實際問題的能力,綜合實驗作業題目采用選題指南的形式發布,學生們在選擇實驗題目時,可以從選題指南中選擇機器學習項目進行練習,也可以自擬題目,綜合實驗作業要求同學們按照模板撰寫實驗報告并提交Python代碼??紤]到有些選題工作量較大,同時為培養同學們的團隊協助能力,因此綜合實驗作業允許同學們以團隊協作的方式完成。綜合實驗作業提交后,在課堂上安排交流和成果分享,這樣既能夠檢驗學生機器學習實踐作業的質量,又能夠鍛煉學生們的表達能力。
各項考核內容成績占比分配方面,增加了過程考核和綜合實踐作業的成績占比,降低了期末筆試成績的占比,將學生解決實際問題的能力作為重要考核指標。
3" " " 教學效果
本課程從2021年春季學期開始為本校會計學專業本科生開設,總學時數為48,3學分,共87名學生修讀了本課程,目前已經完成兩輪的教學實踐。
從課程教學情況來看,學生們學習對課程內容很感興趣,學習積極性很高。通過完成綜合實踐作業,學生們熟悉了從數據探索、數據預處理、模型構建到模型評價的機器學習建?;玖鞒?,同時通過參數調整和嘗試不同模型,獲得了效果最優的模型。最終課程總成績平均分84分,80分以上同學占比70%,90分以上同學占比43%,通過課程學習,學生對機器學習這個方向有了全新的認識,培養了具有數據思維的應用型人才,為學生未來走向社會打下了基礎。
4" " " 結" " 語
隨著學科交叉趨勢的發展,對于財經類高校部分非計算機本科專業,如會計學、經濟學等專業,機器學習課程也成為專業課程。對這些專業而言,機器學習課程的建設面臨著一些挑戰,因此本文從財經高校的角度,對非計算機專業機器學習課程教學進行研究。本研究面向本科生進行機器學習課程設計,將課程主要分為三個模塊:基礎模塊、進階模塊和綜合實踐模塊,通過該課程的學習,學生將掌握常見的機器學習算法,并且通過機器學習實踐來加深學生對理論知識的理解。本課程建設方案提高了學生們的學習興趣,有助于培養學生們解決實際問題的能力,為大數據人才培養提供了新的思路。
主要參考文獻
[1]洪慧.智能財務時代下地方性本科高校會計人才培養路徑研究[J].中國管理信息化,2022,25(9):197-199.
[2]趙衛東,董亮.機器學習[M].北京:人民郵電出版社,2018.
[3]葉雙,葉劍虹,雷慶,等.新工科背景下機器學習課程教學改革探索[J].福建電腦,2022,38(4):28-31.
[4]衛志華,孔思尹,丁志軍,等.新工科背景下數據挖掘課程綜合性實驗設計[J].計算機教育,2020(3):127-130.
[5]周樹森,鄒海林.人工智能專業學生工程實踐能力培養研究與實踐[J].計算機教育,2020(10):113-116.
[6]唐培培,吳明暉.基于Kaggle競賽數據的“數據挖掘技術”課程建設探索與實踐研究[J].工業和信息化教育,2021(3):85-88.
[7]趙雪峰,施珺.面向本科生機器學習課程的教學探索[J].計算機教育,2021(2): 170-174.
[基金項目]2020年教育部產學合作協同育人項目“大數據管理與應用專業金融大數據課程建設”(202002238008);2021年教育部產學合作協同育人項目“基于云實驗平臺的數據挖掘實踐課程建設”(202102001023);2021年山東財經大學實驗教學改革研究項目“基于 Python 的信用風險大數據分析開放實驗課程建設”(kf202107)。
[作者簡介]王重仁(1984—" "),男,山東日照人,副教授,管理學博士,主要研究方向:機器學習。