劉輝
摘 要:大數據與云計算的普及對數據挖掘人才提出了更多更高的需求,越來越多的高校開設了面向商科生的數據挖掘課程。然而,數據挖掘是一門理論與實踐并重且涉及多學科的交叉學科課程,傳統的教學方法在給商科生的授課過程中面臨許多問題。結合數據挖掘課程的特點,分析了教學過程中的問題,并提出了建設性的意見。
關鍵詞:數據挖掘;教學改革;交叉學科;實踐教學
中圖分類號:G4 ? ? 文獻標識碼:A ? ? ?doi:10.19311/j.cnki.1672-3198.2019.23.086
0 引言
隨著互聯網和移動計算的發展與應用,每天產生海量的數據,數據挖掘在社會各個領域得到空前的重視與廣泛的應用。這是一門理論與實踐結合的學科,其中許多數學模型與算法,都具有深邃的思想與廣泛的應用潛力。近年來,數據挖掘技術已經在客戶發掘、市場分析、商品推薦和人力資源等多個領域引起了極大的關注,為商務應用提供了強大的數據分析和決策支持能力,數據挖掘科學也逐漸成為高校商科專業的核心課程之一。例如,許多高校的市場營銷、人力資源管理、國際貿易與物流等專業都陸續開設數據挖掘課程。然而,傳統的數據挖掘課程教學方法與實踐環節是針對計算機專業、統計學相關專業的學生設置的,而商科生的數量基礎與計算機編程能力偏弱,為商科學生講述數據挖掘課程將是一個具有挑戰性的任務。
1 高校數據挖掘課程的特點
1.1 交叉學科
數據挖掘是一門與計算機科學、數理統計、模式識別等多學科交叉的新興科學,該課程內容主要介紹數據挖掘的概念與基本任務,教學內容包含關聯規則、分類、聚類、回歸等數據挖掘任務,例如譜聚類算法就涉及數據結構、線性代數、運籌學等多個學科的知識。
1.2 知識綜合應用程度高
數據挖掘課程中的許多數學模型與分析算法,是多門學科知識的高度凝練與綜合運用,學生在數據挖掘課程的學習過程中往往會覺得知識不夠用,對模型算法的理解不夠深刻。商科學生需要惡補相應學科的知識點,學習強度大,主觀能動性比較差的學生容易放棄。
1.3 理論與實踐結合密切
數據挖掘是一門理論和實踐緊密結合的學科,理論模型與計算機實現聯系緊密,挖掘算法與應用場景聯系緊。針對各種數據分析任務,都有許多種不同的算法,學生需要掌握各種數據挖掘算法的特點,根據具體的應用領域與場景選擇合適算法進行應用。
1.4 不斷改進與發展的學科
隨著人工智能、云計算的飛速發展,越來越多研究者投入到大數據分析領域,不斷完善和提出新的數據挖掘模型與算法。在該門課程的教學中需要向學生介紹最新的研究進展與發展動態。例如,深度學習與增強學習等最前沿的知識點。
2 數據挖掘課程教學面臨的問題
2.1 理論要求較高與商科生數理基礎較弱之間的矛盾
數據挖掘課程通常以數理統計與概率論、計算機算法等課程作為前置課程,數學模型通常以公式推導和算法分析為主,具有較強的理論性。然而,商科專業的學生一般僅具備初級計量經濟學的基礎知識,數據結構、統計學與機器學習及其他知識儲備較弱。學生在課程學習開始普遍感覺難度較大,理論知識要求達不到所需要的標準。數據挖掘課程的較高理論性要求與商科生的數理基礎較弱之間是教學過程一個不可忽視的問題。
2.2 理論與實踐環節脫節
目前高校開設的數據挖掘課程授課偏重于數學模型與算法理論上的講述,不重視甚至省略了實踐環節的教學,純粹的理論知識對于基礎較差的商科生而言晦澀難懂,課堂內容顯得枯燥無味。理論與實踐環節的脫節導致的問題有兩個方面:一是學生無法集中精力理解理論模型,無法編程實現相應算法;二是學生無法與實際應用聯系起來,缺乏實戰經驗。
2.3 教學過程可視化與形象化手段缺乏
數據挖掘往往面臨海量數據的分析處理,大數量處理帶來的困難之一是數據的可視化與算法挖掘過程的形象化展示。教學過程的可視化與形象化手段缺乏導致課堂氛圍不活躍,難于激發學生對數據分析的聽課興趣,更談不上學生在課程之后的知識應用能動性和創新性的培養。
2.4 缺乏實例數據驅動教學過程
在數據挖掘教學過程中,由于課時限制與實例數據的缺乏,大多數高校教師偏重于理論知識的講解,使用的教學案例與數據都是較老的教材與過時的小樣本數據集,缺乏真實的實例驅動教學過程。
3 數據挖掘課程教學的建議
3.1 注重應用實踐環節,弱化理論推導
結合商科生的特點與培養目標,設計應用型和實踐性強的課程問題和以案例體系為主的教學方案,以實例教學為主,理論推導為輔的教學模式,極大地調動學生的學習積極性。
3.2 采用可視化工具,流程化與形象化數據挖掘過程
建議采用KNIME與WEKA可視化數據挖掘工具,將數據挖掘的過程看成一個以數據變換為主導的探索過程,將數據讀取→預處理→分析→結果展示以流程化、圖形化的方式展示出來,并對數據挖掘過程進行現場調試,讓學生親身體會數據挖掘的流程。
3.3 收集真實數據與案例,激發學習興趣
教師在教學與科研過程收集和處理一些真實世界的數據,例如推薦系統、臨床醫學、體育運動等方面的數據,并將這些數據應用于實踐教學環節,以真實數據激發學生的學習動力。
3.4 因材施教,創新考核方式
數據挖掘課程傳統的考核方式通常以期末筆試成績作為評分的主要依據,而筆試往往側重于理論推導,對于算法的編程實現與實踐應用方面的考核較弱。建議因材施教,采用多種考核方式:一是鼓勵數量基礎較好的學生開展數學模型與算法上的深入研究;二是鼓勵計算機基礎較好的學生編程實現數據挖掘算法;三是提倡收集并整理新的數據集,并將現有算法應用于這些數據集上。
4 結語
數據挖掘是一門新興的交叉學科,隨著人工智能、云計算的飛速發展,新的模型與算法不斷加入并擴展數據挖掘的知識體系。在大數據背景下,面向商科生開設數據挖掘課程具有理論與現實意義,但對該課程的教學是一個巨大的挑戰。高校教師需根據該課程自身特點,同時考慮商科生的基礎弱、面向應用的條件,不斷總結教學、調整教學方式,提高該課程的教學質量。
參考文獻
[1]商俊燕.數據挖掘課程案例驅動教學法初探[J].教育教學論壇,2014,(40):69-70.
[2]張艷.大數據背景下的數據挖掘課程教學新思考[J].計算機時代,2014,(4):59-61.
[3]陳欣,王月虎.大數據背景下數據挖掘課程的教學方法探討[J].文教資料,2017:176.
[4]王洪,洪鈴.大數據背景下《數據挖掘理論》課程教學思考[J].現代商貿工業,2018,39(20):146-148.
[5]屈莉莉,陳燕.大數據背景下數據挖掘課程的教學改革與探索[J].教育教學論壇,2014,(16):57-58.
[6]商俊燕.數據挖掘課程案例驅動教學法初探[J].教育教學論壇,2014,(40):69-70.