摘要:數據分析與挖掘是智能科學與技術專業的必修課,然而現階段該課程教學中還存在諸多問題亟待解決。文章從現有問題出發,從樹立“教師引導、學生主導”的課堂教學理念、制定多元化且緊跟實際案例的教學內容、科研融入教學實踐、引入研究生“頭腦風暴”式的培養模式以及建立健全考核評價機制等方面探討如何改革數據分析與挖掘課程,以期提升學生汲取知識的自主性以及課堂教學效果,最終培養學生具有靈活地運用課程知識解決實際問題的能力。
關鍵詞:數據分析與挖掘;教學改革;教學實踐
中圖分類號:G642 ? ? ?文獻標識碼:A
文章編號:1009-3044(2022)31-0178-03
隨著人工智能、機器學習、云計算、物聯網等新技術廣泛地應用到社會生活的各個領域,近些年數據的規模呈現出指數型增長的趨勢。在如今這個大數據時代,數據已經變成一種十分珍貴的資源,因此如何運用計算機技術從如此大規模的數據中挖掘和分析數據中隱含的規律以持續指導后續的生產和生活,已經受到全社會的重點關注。近些年,社會對數據分析和數據挖掘專業人才的需求與日俱增,這也促使數據分析和挖掘這門課成為培養數據分析人才的重要課程,它也成為智能科學與技術專業的必修課。數據分析和挖掘是一門涉及包括:數據庫、機器學習、統計學、深度學習、模式識別等技術的多學科交叉課程,這也對教師實施教學過程以及學生學習知識的進程提出了更進一步的要求。然而,目前對于數據分析與挖掘這門課程的教學還存在如重理論輕實踐、課程實踐案例比較陳舊等問題,而這些問題的存在使得這門課程的教學內容無法與時代的發展相適應[1]。因此,探索如何更新數據分析與挖掘的教學理念、教學內容和實施方法、如何建立完善的數據分析與挖掘教學方法、如何在實踐教學中融入現實生活案例以適應社會需求,具有重要的現實意義[2]。
1 數據分析與挖掘教學現狀
數據分析與挖掘這門課程是面向江蘇大學計算機科學與通信工程學院智能科學與技術專業學生開設的一門專業必修課,該課程共安排32學時(其中20學時授課、12學時實驗)。由于學習該課程需要的先修課程數量較多、課程的理論難度較大、課程對實驗要求較高,因此教學任務比較重且對學生的能力有了更高的要求[3-4]。然而,在這門課程實施階段發現還存在如下教學現狀。
1.1 學生對先修課程的掌握程度差異大
數據分析與挖掘課程內容中各環節涉及的知識點與先修課程有較強的聯系,如數據存儲用到的數據庫技術、數據分析用到的統計學原理、數據挖掘用到的機器學習算法等,與課程相關聯的先修課程比較多且理論深度、學習難度大,這也使得想學好這門課程必須掌握先修課程中的技術和原理[5]。然而,通過課堂的教學發現學生對較多先修課程知識點的掌握上存在一定的差距,而在程序設計基礎的差異也使得學生在數據挖掘算法編寫階段出現進度不一的問題。此外,由于數據分析所涉及的知識點中有很大一部分是復雜的數學推導公式(如分類算法SVM的理論是基于數學分析中的拉格朗日乘子法進行大量參數的求解,需要很強的數學功底),因此對高等數學掌握程度不好的學生帶來很大的困擾。這些問題的存在使得學生對學好數據分析與挖掘這門課產生懷疑;同時,由于學生對先修課程知識點的掌握程度不同,因此如何開展數據分析與挖掘這門課的教學以及讓學生更深入地理解課程知識點相對比較困難。
1.2 教學方式枯燥且教學資源有限
智能科學與技術專業的學生在選修數據分析與挖掘課程前已經修完Python程序設計課程,已經較為熟練地掌握通過調取Python包進行數據處理,但是學生對所調用的Python包中涉及的具體算法的原理并不明白。而數據分析與挖掘課程中的很多數據挖掘和數據分析算法比較復雜且需要進行大量的公式推導,如:數據降維中的主成分分析算法(PCA) 需要借助高等數學中的拉格朗日中值定理進行推導。這種理論課所教授的內容是數據挖掘算法和原理的引入及推導,教學方式往往比較枯燥,缺乏更為多樣化的教學形式,因此不易引起學生的興趣,從而無法調動其學習積極性[6]。而實驗環節主要通過實現相應數據挖掘算法以完成教學任務,沒有很好地融入團隊協作的方式,無法充分調動學生對實現算法的熱情。此外,現階段授課的內容主要集中在教材中的知識點,而教材中涉及的機器學習算法大多是經典的算法,無法有效地處理維度高、類型復雜的大規模數據,同時網上的教學資源也沒有很好地對現階段效果更好的機器學習算法進行系統的梳理,因此很難利用現有的教學資源更好地向學生呈現數據分析與挖掘這門課程。
1.3 實驗課程中的算法比較陳舊
在實驗教學過程中,教師所布置的實驗內容大多是復現理論課堂中講述的算法,往往需要通過對算法的復現判斷學生對理論的掌握程度。然而,這種實驗課程形式完全脫離了實際應用場景,無法讓學生真正了解目前社會所使用的前沿技術,導致實驗教學與實際生活相脫節[7]。如實驗課程中的分類算法實現往往會讓學生復現一些機器學習算法,如:ID3、C4.5和CART三種決策樹算法、K最近鄰算法等,而最近幾年流行的深度學習模型雖然能夠得到更好的分類效果,但是很少會讓學生在實驗課中進行復現。這種形式也會讓學生對理論知識的理解只是停留在表面,而無法更深層次地明白算法背后所蘊含的思想。此外,現階段實驗教學中所使用的數據集的規模比較小、維度比較低、類型比較單一,這也與實際情況出現較大的差異。雖然復現的算法能在書本中提供的數據集上順利地運行起來,但一旦遇到實際生活中的大規模高維數據時會因為算法陳舊而出現效率低甚至無法運行的問題。
1.4 考核評價體系不合理
現階段對數據分析與挖掘課程的考察形式是閉卷考試,這種考察形式以學生對教材中涉及的算法原理以及知識點的掌握程度所呈現的筆試成績作為最終的評價指標[8]。然而,這種考察形式缺乏對學習過程的有效評價,沒有考慮到學生的個性化需求,未將學生的實踐能力、綜合能力等納入考核評價范圍,因此無法有效地考查學生在各個學習階段的狀態。這種考核評價體系的存在很難有效地提高學生運用數據進行分析和挖掘的能力,也很難提高學生學習的積極性和主動性。
2 數據分析與挖掘課程改革措施
為了解決現階段數據分析與挖掘課程中出現的諸多問題,可以通過以下一些改革措施來更好地為智能科學與技術專業的學生呈現更為完善的課堂體驗。
2.1 樹立“教師引導、學生主導”的課堂教學理念
轉變傳統的“填鴨式”“教師一言堂”的教學模式,在課堂教學中教師要以學生為主體,樹立“以學生為中心”的教學理念,能夠正確地認識到在課堂教學中“教師為引導,學生為主導”的位置。在教學過程中,可以以小組合作的形式展開,以學生需求為導向,驅動課堂教學,把生活中的實際問題帶入課堂,促進學生之間的討論,通過小組討論、發散思維的方式讓學生深入教學重難點,梳理存在的問題并進行分析;然后派小組代表進行發言交流,教師就學生的發言進行點評并總結。這種形式不僅能讓學生集思廣益、自主學習并切身感受到自己在課堂中的重要性,還能讓學生成為課堂的主導者,充分調動學生參與課堂教學與學習的積極性,提高其學習的興趣;此外,也能增強學生團隊協作意識與凝聚力,培養學生形成創新思維以及養成解決問題的能力。
2.2 制定多元化且緊跟實際案例的教學內容
在教學過程中,緊跟目前工業界和學術界使用的最新技術,通過整理和吸收國內外不斷更新的教學資源,尤其是翻譯和整理最新發表的英文學術論文,并結合智能科學與技術專業學生的學情,了解學生對這門課程的實際需求,對課程知識點、教學案例、課程實驗內容等進行深層次的考慮,從而設計出更為多元化、更強適用性且緊跟實際案例的教學實踐大綱,制定出更為合理、有針對性的教學策略。此外,緊緊把握現實生活中的實際需求以及行業中運用的先進技術,從數據分析與挖掘課程中涉及的知識點(包括章節中的重、難點)出發設計具備典型性、前沿性和整體性特征的應用案例,通過融入課程知識點對實際案例的解決過程進行講解以突出課程各章節中的重難點,并從整體出發設計教學計劃以繪制完整的課程知識脈絡,從而為后續順利地串聯知識點奠定基礎。而在后續教學過程中,以實際案例為導向,牢牢圍繞設計的教學內容,通過介紹實際需求以讓學生帶著問題進行課程學習,通過對如何解決現實生活中的實際案例進行詳細的分析引出課程知識點,并結合最新的技術教案帶領學生一起學習知識點中的重難點,從而讓學生更好地掌握數據分析與挖掘這門課程的教學內容。
2.3 科研融入教學實踐
如今深度學習、機器學習等技術得到了不斷的發展和更新,也出現了很多新的技術和方法,但是現有教材中的知識點比較陳舊,利用這些技術無法有效地處理呈現爆炸式增長趨勢的大規模數據。因此,將日常的科研工作深入地融入數據分析與挖掘課程教學實踐中的各個環節,是課程改革的一大突破。科研融入教學實踐能有效地提高對學生授課的質量,增進師生間的交流互動,進一步提升師生之間的雙向能力。更具體地,可以把科研中的一些子問題引入課程教學過程中,引導學生思考如何改進一些數據分析或數據挖掘算法以提升對數據處理的效率,從而在學好數據分析與挖掘課程的基礎上更深入地思考如何利用數據分析或數據挖掘算法解決現實生活中的一些實際問題。通過將科研融入教學實踐中,可以更有效地將科學研究與理論學習、技術培養與教學實踐相結合,從而建立一種更為有效的教學實踐方式。
2.4 引入研究生“頭腦風暴”式的培養模式
在教學過程中,一個最直觀的感受是課堂中學生往往很少舉手對課程中所涉及的知識點進行提問,而且隨著年級越高提問的人數呈現出下降的趨勢。這一現象出現的一個主要原因是現有的教學模式已經把學生養成了只求分數而忽視知識內涵的習慣。與之相反,研究生培養過程中組會已經成為一種知識交流的主要陣地,而組會往往以一種“頭腦風暴”的形式開展,這種方式不僅有效地促進了知識的傳播,而且也能讓學生從自身所掌握的知識體系出發主動與當前學習的知識進行主動融合,從而更好地對某個知識點進行延展。適當地在數據分析與挖掘課程中引入研究生“頭腦風暴”的培養模式,可以有效地促進學生對課堂知識點的理解與反思,從而更好地學好這門課程。
2.5 建立健全考核評價機制
徹底變更傳統的以最終考試成績為衡量標準的片面的考核評價體系,運用信息化技術手段監測學生課前知識點預習、課后單元測試以及課后作業作答等情況;同時,在課堂中借助“MOOC”“雨課堂”等網絡教育平臺實施課堂簽到、問題回答、問題討論等環節;此外,還組織學生以小組為單位進行匯報,通過這些打分環節的綜合考慮利用綜合評價法對每個學生的教學過程進行評價。通過多角度、全方位的考核和評價給出學生的最終評分,既能有效地對教學實施過程進行評價,也能給學生更多的課程體驗。
3 結束語
在現如今這個大數據時代,數據已經成為日常生產和生活中寶貴的財富,對數據進行分析和挖掘可以發現數據中隱含的規律。與其他計算機課程不同的是,數據分析與挖掘這門課程實用性很強且貫穿到各個行業領域,因此它已經成為計算機專業的主干課程。然而,現階段在教學過程中依然出現學生先修課程掌握程度差異大、教學方式枯燥且教學資源有限、實驗課程中的算法比較陳舊以及考核評價體系不完善等問題。本文針對目前數據分析與挖掘課程的教學現狀和存在問題,探索了數據分析與挖掘課程教學改革策略,提出了樹立“教師引導、學生主導”的課堂教學理念、制定多元化且緊跟實際案例的教學內容、科研融入教學實踐、引入研究生“頭腦風暴”式的培養模式以及建立健全考核評價機制等建議。通過深度考慮學生的個性化需求,提升學生學習這門課程的積極性與主動性,從而改善課堂教學的效果,提高教師的教學質量。
參考文獻:
[1] 丁毅濤.大數據時代下的數據挖掘課程改革探索[J].科技風,2021(27):27-29.
[2] 朱毅,李云,強繼朋,等.數據挖掘課程教學模式改革與探索[J].科教文匯,2021(18):108-109.
[3] 陳芳,張道強.以學生需求驅動的數據挖掘課程教學改革研究[J].軟件導刊,2020,19(9):274-276.
[4] 王建新.數據挖掘課程中數據思維的培養方法探索[J].計算機教育,2019(8):117-120.
[5] 宋薇,李倩偉.軟件工程專業《數據挖掘》課程教學改革研究[J].軟件導刊,2015,14(12):212-214.
[6] 魯江坤.以項目驅動的應用型高校數據挖掘課程改革研究[J].通訊世界,2021(4):153-154.
[7] 湯顯,石蘊玉.新工科背景下數據挖掘課程教學改革與探索[J].教育教學論壇,2019(42):141-142.
[8] 楊秀璋,武帥,夏換,等.大數據時代數據挖掘與分析課程教學改革探究[J].計算機時代,2021(9):107-111.
【通聯編輯:謝媛媛】
收稿日期:2022-05-15
作者簡介:蔡賽華(1990—) ,男,江蘇海門人,講師,博士,研究方向為數據挖掘和數據處理、異常流量檢測。