郭麗莎
【摘 要】根據筆者近幾年的實際教學實踐,本文對如何將統計軟件課程的教學內容及體系改革與學科競賽相結合進行了深入的探討。從對本課程教學現狀入手,分析了大數據時代對本課程的教學需求,并給出了課程改革的一些建議及筆者的一些實踐經驗,以期更好地為教學和學科競賽服務。
【關鍵詞】大數據;統計軟件;學科競賽;R軟件
中圖分類號: C8-4;G642文獻標識碼: A 文章編號: 2095-2457(2019)32-0141-002
DOI:10.19694/j.cnki.issn2095-2457.2019.32.065
統計軟件課程開設的目的是讓學生通過學習,能夠掌握并熟練應用統計軟件處理實際問題,比如進行數據處理、統計模型分析等,為將來專業領域的實際工作或繼續深造打下基礎。隨著大數據時代的來臨,運用統計軟件進行數據分析和求解統計模型已成為大勢所趨。
然而目前國內高校統計學專業的統計軟件課程沒有統一的教學內容,講授的統計軟件也多種多樣。如何選擇合適的教學內容,使所培養的學生符合大數據時代的需求,是統計學教學研究的一個重要且具有現實意義的問題。此外,越來越多的學科競賽,如“泰迪杯”全國數據挖掘挑戰賽、全國統計建模大賽、全國計算機設計大賽大數據挑戰賽等,對學生的統計軟件的掌握和應用情況要求非常高。這些都體現了統計軟件課程教學改革的必要性和緊迫性。
1 統計軟件課程的教學現狀
統計軟件課程的主要內容包括兩大部分:一是統計理論與方法,包含數據預處理、描述統計分析、推斷統計、多元統計等。二是統計軟件的應用,主要講述SPSS、SAS及R的使用方法,并對實際數據進行分析、建模和求解。
目前國內大多數關于R軟件的教材都是基于多元統計及回歸分析等內容展開,教學過程通常是先介紹統計模型的原理,然后介紹R軟件的使用方法及相應的應用案例。這樣的模式就會造成學生在學習期間過分注重相應統計命令的學習,而忽視統計方法選擇過程的實訓環節,便會致使大部分學生應用統計方法解決實際問題的能力得不到鍛煉,進而影響學習和應用統計軟件的能力。另外,教材中的案例往往比較精簡,而學科競賽的賽題更加復雜、大型,所以傳統的教學不能適應學科競賽的需要。
2 大數據時代的教學需求
由于大數據時代的到來,利用計算機對數據進行處理分析是數據研究的必備技能,因此統計軟件課程在當前社會學、經濟學、統計學等學科的課程教學中占據著非常重要的位置。這門課程不僅僅培養學生的專業知識,更是對學生技術水平及綜合素質的一種提升。但從教學考核的形式來看,目前各高校對教師教學效果的考核往往是以結果考核方式為主,因而也就限定了老師的教學內容以及教學方式,這顯然不利于發揮這門課程在人才培養方案中的作用。
眾所周知,數據處理是成功解決問題的關鍵,包括各種原始數據的分析、計算和匯總等過程。從數據處理的過程中可進一步理解實際問題,獲取更多的有效信息及解決問題的思路。因而,在當前大數據時代,統計軟件課程的教學必須應對數據處理和分析的關鍵需求,根據課程的特點,調整考核方式,淡化結果考核。
“為什么現在我們的學校總是培養不出杰出人才?”這就是著名的錢學森之問.最主要原因是我們的學生比較缺乏創新意識,那么什么是創新意識呢?發現和提出問題是創新的基礎;獨立思考、學會思考是創新的核心;歸納概括得到猜想并加以驗證,是創新的重要方法。現代數學教育的基本任務是培養學生的創新意識!為此,大學乃至省級、國家教育機構專門設有各種競賽活動,設置開放性的題目,來推動學生們的創新意識。例如“泰迪杯”全國數據挖掘挑戰賽、全國統計建模大賽、全國計算機設計大賽大數據挑戰賽、“挑戰杯”全國大學生課外學術科技作品競賽、全國大學生數學建模競賽、美國大學生數學建模競賽等等針對大學生開展的重大賽事,每年都吸引大量的學生參賽。縱觀歷年這些賽事的賽題,不難發現涉及許多大數據和統計相關的題目,且均需要應用統計軟件進行求解和計算。因此,在當前的大數據時代,對統計軟件課程的教學要求還同時包括了訓練學生參加學科競賽,培養學生的創新意識。
3 教學改革方案探討
3.1 改革教學內容
通常的統計學本科教學培養方案中,對統計理論與方法主要要求學生掌握描述性統計分析、統計推斷、多元統計、時間序列等。然而在有限的教學學時內,將上述內容都講精講透是幾乎不可能的,因此必須要有所側重。筆者認為,在如今的信息時代,將理論知識進行計算機可視化是一種趨勢,因此描述性統計分析和統計作圖的重要性更加不言而喻。
描述統計是描繪或總結觀察量的基本情況的統計總稱。描述統計學研究如何取得反映客觀現象的數據,并通過圖表形式對所收集的數據進行加工處理和顯示,進而通過綜合概括與分析得出反映客觀現象的規律性數量特征。透過對于數據資料的進行圖像化處理,將資料摘要變為圖表,以直觀了解整體資料分布的情況。通常會使用的工具是頻數分布表與圖示法,如多邊圖、直方圖、圓形圖、散點圖等。由于描述統計分析具有以上特點,因此在實際應用中比更偏于理論的統計推斷結果更易于被大眾接受,所以我們認為在介紹統計理論與方法時,應側重于描述性統計的理論和方法。
此外,課程的改革需要打破傳統以統計方法的計算和結果分析為主的教學方式,增加數據分析處理的環節,例如可以與統計建模相結合。對于大多數學生來講,第一次接觸與統計建模有關的訓練模式,如果案例的內容安排缺少過渡性則容易讓學生覺得內容晦澀、高深難懂,加重學生負擔的同時還容易使學生喪失學習興趣,所以案例由簡到繁是任課教師應該注意的問題之一。
統計方法應用或設計大數據處理相關的建模案例較多,切忌生搬硬套地把建模問題融入統計軟件的課程.應根據本校軟件課程的教學課時數,進行內容的合理取舍,使學生能更好地接受,讓學生掌握統計理論及軟件實現的同時,增強實際應用的靈活能力。
3.2 改革教學方法
當今社會是數據爆炸的時代,在大數據背景下,應用R軟件進行數據挖掘,建立統計模型并求解,是十分重要的技能,有著相當廣泛的應用。為了增強訓練效果,在建模式培養的過程中,應該淡化教師主導的思維模式,強調學生學習的主體地位.除了教師講解相應的統計建模案例外,可以將學生進行分組,自主選擇題目,課下進行數據搜集和處理及方法的選擇等環節,課上進行報告和討論,最后由教師進行點評,給出可行的修改意見.這樣既有利于調動學生學習的積極性和主動性,又能從整個過程中加深學生對統計方法的認識和運用,達到學以致用.
3.3 改革考核方式
如前所述,對于應用能力的考核,應淡化結果,重視過程。這門課對學生的培養目標是以具備數據處理的基本能力為目標,然而在數據處理的過程中,每個學生所使用的方法不盡相同,所得的結果也不可能完全一致。但是,在實踐的過程中,他們可以熟悉或掌握基本的數理處理方法和技巧。因此在對學生進行考核時,應該注重于考核在實踐過程中的動手能力,而非結果。
3.4 增強參賽能力
理論的學習,最終是為了實際的應用。因此在教學工程中,筆者認為應該引入實際案例,即針對真實數據,應用統計知識和方法求解實際問題。我們可以選取一些較為大型的、綜合性的案例。例如,對于企業大用戶的用電負荷數據,我們可以采用神經網絡和CART決策樹模型來自動識別竊漏電用戶。在對餐飲企業進行綜合分析時,我們可以同時應用多個模型,即使用ARIMA時間序列模型來預測銷售額,使用協同過濾算法對菜品進行智能推薦,使用Apriori算法對菜品進行關聯分析,使用K-Means算法進行客戶分群,使用決策樹算法進行客戶流失預測。
同時,我們可以適當地引入一些競賽題目,如全國統計建模大賽賽題,“泰迪杯”全國數據挖掘挑戰賽賽題等,一方面調動學生的積極性,學以致用,另一方開闊學生的視野,為參加學科競賽打下良好的基礎。例如,2019年第七屆“泰迪杯”全國數據挖掘挑戰賽B題:直腸癌淋巴結轉移的智能診斷,需要用到讀取CT圖像數據、神經網絡模型、圖像分割、特征提取、變量選擇、支持向量機、隨機森林等,也可以進一步地提高,運用Stacking集成模型等。
4 總結
統計軟件這門課程在大數據時代的背景下,對統計學人才的培養起到非常重要的作用。因此,我們必須變革傳統的教學方式,讓我們培養的學生能適應現今企業對大數據處理和分析的人才需求。綜上所述,我們建議統計軟件課程從課程考核改革入手,恰當地選擇統計理論、方法和軟件,同時結合一定實際案例教學,全面提高學生的實踐能力,希望我們的一家之言能對同行們起到一定的參考作用。
【參考文獻】
[1]丁娟.關于高校統計軟件課程教學改革的思考[J].現代職業教育,2016,19:147.
[2]張璇,張小慧.統計軟件課程教學改革的探索與實踐[J].科教文匯,2013,5:51-53.
[3]江海霞,王成,杜涵蕾,等.“統計軟件與應用”類課程教學模式改革探討[J].教育現代化,2017,7:37-38.
[4]顧光同.《統計軟件》課程教學改革的探索與實踐[J].教育現代化,2018(1).
[5]楊宜平,趙培信.R統計軟件在統計教學中的應用[J].重慶工商大學學報,2013,30,3:74-76.
[6]王沛,張玉環.本科生《多元統計分析》課程教學改革研究[J].蘭州文理學院學報(自然科學版)2015,29(6):99-103.