馬家君 張利 謝泉
摘?要:針對模式識別課程教學過程中學生難以理解的問題,應用大數據分析技術,對模式識別課程學習的難易度、課程教授的滿意度和模式識別課程的重要性三個方面進行了統計分析,并明確了模式識別課堂教學過程中學生難以理解的主要原因,進而從課堂講授和實驗教學兩個方面對模式識別課程的教學方法與教學模式進行了調整與改革,解決了模式識別教學過程中學生難以理解的問題。
關鍵詞:教學改革;大數據技術;模式識別
中圖分類號:G642?文獻標識碼:A?文章編號:1674-7615(2019)04-0137-04
DOI:10.15958/j.cnki.jywhlt.2019.04.024
Abstract:Aiming at the problem of pattern recognition course teaching which is difficult for students to understand and applying big data analysis technology, the present paper made a statistical analysis of the difficulty in learning pattern recognition course, satisfaction of the course teaching and the importance of the course, clarified the main reasons why it was difficult for the students to understand the process of pattern recognition classroom teaching and innovated the teaching methods and adjusted modes of pattern recognition from the two aspects of classroom teaching and experiment teaching and solved the problem of teaching pattern recognition.
Key words:teaching reform; big data technology; pattern cognition
模式識別(Pattern Recognition,PR)是利用計算機對模式進行分類識別,通過對獲取的原始數據的預處理、特征提取、分類器的設計,并在分類錯誤率較小的條件下使分類識別的結果與物理對象相符合的技術[1]。模式識別課程是大數據科學與技術、云計算技術、大數據挖掘、物聯網工程等課程的核心基礎課,是一項充滿智慧的課程,是現代人工智能必不可少的基礎技術,也是計算機技術的一個重要分支[2]。模式識別課程對計算機視覺、人工智能、工業自動化、智慧農業、智慧交通管理和大數據挖掘等領域的研究有重要意義。模式識別課程具有很強的理論性、實踐操作能力要求高,與計算機編程、算法設計等課程內容融合高,是一門與工程實踐緊密結合的綜合性的課程[3]。模式識別課程對數學基本理論性的要求非常高,在大數據、物聯網的培養計劃中具有極其重要的地位。在模式識別方法的理論方面,該課程既結合了概率論與數理統計、數值分析、矩陣論等數學基礎理論,同時又為數據挖掘、人工智能、深度學習等專業課程的學習奠定了理論基礎[4]。模式識別課程中算法的理論分析涉及到高等數學、線性代數等大量的基礎數學知識,由于大部分學生數學基礎薄弱,學生很難深入理解模式識別方法的數學思想[5]。另外,在實驗教學方面,大部分學生的計算機編程能力較弱,即使掌握了模式識別的具體算法,很難將模式識別算法通過計算機編程實現。模式識別課程算法理論學習機實驗編程能力的訓練,能為學生在工程實踐及科學研究中打下堅實的理論和實踐基礎。另外,在模式識別的本科教學過程中,讓學生切身體會模式識別具體算法的應用,對教師教學能力提升也具有很大的挑戰[6]。
本文應用大數據技術,對近兩年主修模式識別課程的教師和學生進行了數據采集。分別從學生對模式識別課程重要的認識、學生對模式識別課程難易度以及學生對教師授課滿意度等幾方面進行了分析,并明確了目前模式識別課程教學中學生難以理解的主要原因。在大數據技術的支撐下,從課堂教學和實踐教學兩方面對現有模式識別教學內容、教學模式做出相應的調整與改革,這部分研究對模式課程進行全面的優化建設與實踐具有重要意義。
以2016至2018年講授和主修過模式識別課程的教師與本科生為數據采集對象。從集體問卷訪談、課程教學視頻、學生作業完成情況和試卷分析中獲取模式識別教學相關數據。在集體問卷訪談方面共發放400份問卷,其中教師問卷10份,本科生問卷390份,專業包括物聯網工程、信息管理與信息系統、電子信息工程3個。本次問卷訪談共回收問卷387份,回收率96.75%。在學生的問卷調查方面,我們設計了課程理論推導難易度、實驗課程重要性、課堂講授滿意度和課程設計合理性四個調查項進行數據采集;在課程教學視頻上,從教室監控獲取視頻數據,并采用大數據技術通過深度學習獲取課堂學生聽課狀態相關信息;在學生作業完成情況和試卷分析上,根據教師統計的相關數據進行分析。綜合以上3種數據源進行大數據統計分析,分析結果如表1所示。

大數據分析表明,認為模式識別課程理論推導較難的學生占75%以上,實驗課程較為重要的學生占80%以上,課堂教學較為滿意的學生不到40%。課程設計較為合理的學生不到50%。在以上統計分析的基礎上,我們認為導致學生對模式識別課程難易理解的主要原因是:學生理論基礎薄弱,學習過程中主動性不強,教師教學方法落后。首先,模式識別算法的理論推導部分,涉及到很多數學分析、工程優化、矩陣論等數學基礎理論,甚至還涉及到小波分析、隨機過程等更高層次的數學理論;其次,模式識別實驗教學過程中涉及到C語言、C++語言、MATLAB編程等計算機編程語言,很多學生計算機編程基礎較為薄弱;最后,教授模式識別課程的老師缺乏相關的工程訓練項目,在課程體系的設計上缺乏創新性。
在國家大力發展大數據技術的背景下,模式識別課程教學的改革對進一步推動大數據相關核心課程的學習,促進大數據科學與技術學科的發展具有重要的意義。
近幾年,模式識別課程建設和教學改革取得了很多成果,但在大數據的新形勢下,尤其是模式識別課與大數據相關理論課程的深度融合上還存在很多問題[7]。模式識別課程教學改革將從課堂教學改革和實踐教學改革兩個方面進行。
1.課堂教學改革
模式識別課堂教學的基本要求是靈活應用緊致性處理模式之間是否可分的問題;通過掌握判別閾值法,明確模式識別的基本處理方法,模式識別是如何分析解決現實問題的;掌握特征生成方法中的提取和選擇,對于給定實物特征能領會提取實物的有用信息。在大數據背景下,除了要求學生掌握模式識別的基本概念、基本理論、基本方法外,還要要求學生能將所學模式識別知識應用于車牌號識別、人臉識別、手寫識別、文本語意識別、指紋識別等大數據工程領域中[8]。模式識別課堂教學改革主要從以下幾個方面進行。
實施虛擬化演示教學。模式識別課程中的PAC降維、感知器算法、貝葉斯分類算法、近鄰法等包含了較多的數學理論推導過程,學生在學習過程中感覺枯燥乏味。采用虛擬化演示教學能在很大程度上提高學生的學習興趣。在模式識別課程中的虛擬化演示教學中,主要針對數學推導較多的fisher線性判別法、貝葉斯分類法、PCA降維等,采用MATLAB的可視化技術,通過在命令空間編寫程序,或者直接編寫M語言程序,生成與fisher線性判別法、貝葉斯分類法、PCA降維相應動畫或圖像,在課堂上通過虛擬化技術演示fisher線性判別法、貝葉斯分類法、PCA降維等算法的推導過程,讓學生直觀體會到模式識別算法圖像效果,結合理論推導,從感觀上加深對模式識別方法的深入理解。在模式識別課程教學中,虛擬化演示的教學方式中需要注意兩方面的事項:一方面,在選擇具體演示的模式識別算法時,盡量選擇公式推導過程中數據易于可視化的例子,如通過醫學圖像處理中的圖像的亮度均值、亮度標準方差二維數據來對醫學圖像進行分類;另一方面,MATLAB在運行過程中,可以采用分部運行,程序執行過程更加清楚,學生更容易理解。
實施“啟發式”教學模式。在啟發式教學法中,一方面,需要引導學生思考模式識別知識的具體應用有哪些;另一方面,需要將學生所掌握的模式識別算法怎么通過計算機編程來解決工程實際問題。從模式識別緒論部分的講解開始,引導學生明白模式識別課程是用來解決如人臉識別、指紋識別、車牌號識別、產品是否合格、工業機械設備運轉是否正常等實際問題,并啟發學生思考模式識別在日常生活還能解決的實際問題有哪些,通過這種啟發式的教學模式,學生積極思考回答問題,加深對模式識別課堂的理解。另外,引導學生在京東、天貓等網商場上搜索與模式識別相關的智能產品,例如指紋打卡機、驗鈔機、智能機器人,引導學生思考模式識別相關產品的工作原理,以及要用到的模式識別基礎理論知識,采用哪些相關的技術手段來實現。
實施“強化練習”的教學模式。在模式識別的教學中運用強化練習的教學方式,對每一個模式識別的知識點,通過具體的例子講解,然后再通過相應的練習題,讓學生在課堂上練習,并根據學生的完成情況,調整強化練習的具體項目,將強化練習分為基礎、深化、提高三個層次,逐步提高學生主動學習的興趣和持續學習的動力。
將目前學生比較感興趣的微信跳一跳游戲外掛開發、人臉識別、指紋識別等技術引入課堂教學。并進行實際案例的演示,讓學生能直觀地知道模式識別的具體應用,提高學生學習興趣。
采用虛擬化演示教學方式。在模式識別的課程講授過程中,通過計算機編程,將模式識別過程中難以理解的公式推導或模式識別的具體算法,采用虛擬化技術,設計視頻演示,有效豐富模式識別教學內容,激發學生在模式識別過程中積極思考和積極學習的熱情。
2.實踐教學改革
在模式識別的實驗教學過程中,鍛煉學生編程能力及運用模式識別具體算法解決工程實際問題的能力是很重要的。目前,模式識別實踐教學過程中通常存在兩個方面需要解決的問題:一方面,實踐教學時間短。模式識別課程在本科階段一般作為考查課,課時通常為36學時,通常30個學時用于課堂教學,在6個學時的實踐教學過程中,設計高效的實驗教學內容是極為重要的;另一方面,模式識別實驗教學過程中面臨實驗項目不好選擇的問題。模式識別實驗過程中fisher線性判別法、貝葉斯分類法、PCA降維等模式識別具體算法很復雜,直接讓學生通過計算機編程實現的工作量非常大,在有限的實驗教學學時的時間內很難完成。
對于模式識別實驗教學過程中時間短的問題,在實驗課上讓學生集中進行編程練習,并在實驗課后安排學生具體的模式識別項目,利用學生課余時間完成。這樣可以在一定程度上解決學生模式識別實踐教學時間不夠的問題。另外,實踐教學過程中的原理部分可以在課堂教學過程中作為案例進行詳細講解,節省實踐教學過程中進行原理性講解的時間。另外,在模式識別實踐教學選題方面,除了選擇實現一些例如人臉識別的經典問題外,可以選擇與大數據、云計算相關的一些課題。例如,基于MapReduce思想,編寫車牌識別程序。實現對貴州某兩處監控圖片中的車牌的識別,完成對除貴州省車輛外的外省車輛的統計,并完成對兩處監控中套牌車輛的識別,并得出結果。在這樣的實踐課程環節中,學生不僅能將模式識別的方法運用到具體工程實踐中,還能鞏固所學的MapReduce編程思想,能夠利用所學的Java調用已封裝好C++的so動態庫完成車牌的識別,然后利用MapReduce完成對車牌的統計和對套牌車的識別。最后將在云計算服務器上其執行。
在模式識別實踐教學過程中,可以采用的編程語言有C語言、C++語言、MATLAB語言、Verilog HDL硬件描述語言、JAVA語言、Python語言等。由于MATLAB編程語言將很多的模式識別算法中需要用的矩陣求逆、矩陣求特征值、神經網絡等封裝成具體的函數,編程結構簡潔明了,能凸顯模式識別算法及實踐教學的工程實用性,因此模式識別實踐教學以MATLAB編程語言為主,配合Java等編程語言練習。列入對于簡單的將人臉識別系統可以分解為:數據預處理、特征提取、分類器訓練、分類識別等幾大模塊,在設計數據預處理部分,可以在MATLAB中通過imread函數直接讀取圖片并轉換為向量,在特征提取部分,可以采用eig函數直接獲取矩陣的特征值和特征向量,程序編寫簡單易懂。
設計精品實驗。模式識別課程是大數據挖掘、大數據可視化、云計算技術等課程的基礎課程,同時,也需要C語言、C++語言、MATLAB語言編程及Python編程語言的基礎。因此,可以考慮將基于云計算、大數據平臺的人臉識別、車牌號識別、語音識別等項目設計為精品實驗,可以將學生所學理論知識有機結合在一起,提高學生綜合運用所學知識解決工程實踐問題的能力。這為優秀本科生留下足夠施展才華的空間,同時也為本科生的課外實踐、設計競賽、SRT項目申報和本科畢業設計提供貯備。
設計層次實驗。在模式識別的教學過程中,部分學生理論基礎較好,實踐動手能力較強,而大部分學生理論基礎較為薄弱,計算機編程能力不足,另外還有少部分學生,幾乎沒有編程能力。因此,考慮到模式識別實驗教學過程中學生的層次化特點,可以將模式識別試驗設計為層次化。例如,對于人臉識別的實驗教學,將實驗分成人臉圖像的讀取、PCA降維、K均值算法識別、貝葉斯分類識別、近鄰法識別、K近鄰法識別、線性判別函數識別和神經網絡識別幾個部分。其中,人臉圖像的讀取、PCA降維給學生提供部分編程代碼,基礎比較薄弱的學生可以一邊抄寫一邊理解。對于基礎較好的學生可以綜合運用K均值算法識別、貝葉斯分類識別、近鄰法識別、K近鄰法識別、線性判別函數識別和神經網絡識別,以提高最終的識別率。通過層次化實驗設計,可以鍛煉不同層次學生的實踐動手能力。
本文應用大數據分析技術,對模式識別課程理論推導難易度、實驗課程重要性、課堂講授滿意度和課程設計合理性四個方面進行了統計分析,大部分學生認為模式識別課程理論推導較難,模式識別實驗課程重要,不到50%的學生認為模式識別課堂教學較為滿意,模式識別課程設計較為合理。并明確了模式識別課堂教學過程中學生難以理解的主要原因是學生理論基礎薄弱、學習過程中主動性不強、教師教學方法落后。本文結合大數據應用技術,從課堂講授和實驗教學兩個方面對模式識別課程的教學方法和教學模式做出調整與改革,提出了解決模式識別教學過程中學生難以理解的問題。在課堂教授方面,提出了“虛擬化演示”教學、“啟發式”教學、“強化練習”教學的改革方式,以解決模式識別課程教學過程中學生難以理解的問題。在實驗教學方面,提出了精品實驗和層次實驗的教學改革方式,并將大數據、物聯網相關的項目融入到實驗中,解決模式識別實驗教學過程中教師實踐經驗不足的問題。本文應用大數據技術,對現有的模式識別教學模式與教學內容需要做出合適的調整與改革,該改革方案對模式識別課程進行全方位的優化建設與實踐具有重要意義。
參考文獻:
[1]?張學工.模式識別[M]. 北京: 清華大學出版社,2010:45.
[2]?SERGIOS T.?Pattern Recognition[M]. San Diego: Academic Press,2006:39.
[3]?張芳,肖志濤,韓曉軍,等.?模式識別課程教學改革思考[J]. 計算機教育,2012(4): 45-47.
[4]?劉雨,孫即祥,余莉.?模式識別課程開放式案例教學設計[J].電氣電子教學學報,2011 (3): 103-105.
[5]?戚玉濤,劉芳,焦李成.?模式識別教學實踐與課程改革[J].計算機教育,2010(19):24-26.
[6]?吳有富,吳應加.?信息分類中的一種模糊技術[J]. 貴州大學學報(自然科學版),2001 (1): 9-15.
[7]?許道云.大數據計算的基礎理論探究[J]. 貴州大學學報(自然科學版),2016 (4): 1-11
[8]?張偉,程穎.基于大數據技術的研究生教育管理系統構建與應用[J]. 貴州大學學報(社會科學版),2018 (2): 134-138.
(責任編輯:趙廣示)