牛奉高 王恩慧
[摘 要] 大數據時代,社會各界對數據分析人才的需求迅猛增長,且要求不斷提高。文章以山西省高校統計學專業的學生為調查對象,從學科內容、教學方法、大數據課程的建設等方面進行了統計調查,運用SPSS軟件對數據進行分析,得出統計學專業發展現狀,并在此基礎上探討了大數據時代背景下統計學專業的課程改革及統計人才的培養方案。
[關鍵詞] 統計學 大數據 課程改革 供給側
中圖分類號:G642.4;C8-4 文獻標志碼:A
一、研究背景
提及“數據”,人們必然會想到“統計學”。作為處理數據的科學,傳統的統計學思想方法已經不能處理規模巨大、增長與傳遞迅速、非結構化程度高的數據或數據集。因此,大數據時代對于統計學來說,既是機遇也是挑戰。
供給側改革一般指供給側結構性改革,供給側相對應的是需求側,最初是國家旨在調整經濟結構,使要素實現最優配置[1]。人才培養的供給側改革是以市場為牽引,以產業需求和人才雙創需求為導向,使高校教學更好地培養出適應社會需求的學生。統計學作為一直沖在處理數據最前線的學科,應積極適應時代發展要求,統計學人才應該善于挖掘大數據中所蘊含的智慧[2]。
二、研究現狀
順應時勢,進入大數據時代后,全國的骨干示范帶頭院校已經陸續展開了大數據方向的課程建設。袁衛[3]通過回顧統計學發展歷史和討論統計學教育現狀,強調在做大的基礎上應做強統計學科,處理好與數學、經濟學等學科的關系,以及處理好與非統計專業人才培養的問題。陳秀芬[4]基于大數據時代對統計學課程的影響,探討了目前統計學課程教學存在的問題,強調統計學教學應注重統計方法的應用、增強學生軟件的運用能力及創新教學模式等。李金昌[5]基于對大數據的理解,認為統計學需要改變認識數據的思維、收集數據的思維和分析數據的思維。陳倩[6]針對“大數據”時代對人才的新需求,總結了統計學課程教學中存在的問題,提出“理論教學→案例教學→實驗教學→實踐教學”多層次、多模塊的理論和實踐相結合的教學體系。
三、研究設計
本研究以山西省五所高校統計學專業的本科生和研究生為調查對象,通過發放紙質問卷和網絡調查獲取數據,共發放了340份調查問卷,收回328份,剔除無效問卷20份,有效問卷為308份,其中包括100份紙質問卷和208份電子問卷,有效問卷占發放問卷總數的90.9%。此次調查問卷共設計了16個問題,分別從學生對大數據認知程度、高校大數據相關課程開設情況、教學方式及大數據相關領域的就業前景做了調查,并利用Excel和SPSS軟件進行數據處理和分析。針對不同的問題、不同的數據分別應用多重響應分析、相關性分析、單因素方差分析、可靠性分析、列聯表分析及圖表法等對數據進行分析。此外,本研究以一些大數據相關企業報告、行業報告和高校關于統計學科的報告等為參考資料,進一步探究高校統計學專業教學改革。
四、數據分析與結論
(一)學生對大數據的認知程度較低
大數據時代的到來使得統計學不僅與數學、計算機科學技術和經濟學等人們所熟知的學科聯系緊密,而且越來越多的學者利用統計方法去分析處理生物醫學等其他學科的海量數據。學生對大數據領域相關知識或技能的掌握,一般取決于學校或學院是否開設大數據相關課程或舉行講座,是否讓學生參與一些大數據方面的實踐項目等。對于山西省五所高校學生對大數據認知程度的調查,問卷中設計了五個相關問題,分別是“您認為統計學與以下哪些學科聯系緊密”“您所在的院校是否開設大數據相關課程”“您是否參加過大數據相關的會議或講座”“您如何看待統計學專業開設大數據課程的必要性”“您是否參與過大數據相關的科研項目”。
表1是對高?!笆欠耖_設大數據相關課程”,學生“是否參加大數據相關會議或講座”及“是否參與過大數據相關的科研項目”這三方面統計調查的相關性分析表,N為樣本量。從表1可以看出,“是否參與過大數據相關的科研項目”與“是否參加過大數據相關的會議或講座”“所在院校是否開設大數據相關課程”的P值都是 0.000,遠小于顯著性水平0.05,說明參加大數據相關會議或講座、開設大數據相關課程與參與大數據相關科研項目顯著相關。
(二)實踐教學環節薄弱
統計學強調用數據說話,因此,應熟練使用統計軟件來處理和分析數據。本研究對學生的軟件使用情況進行了調查,針對各高校實踐課程的安排設計了四個問題,分別是“您通常用哪幾種統計軟件處理數據”“您所學的專業課程是否安排上機實踐”“您認為大數據相關課程上機實踐課時應占該課程總課時的比例”“您認為哪些統計學相關課程會對您將來的工作學習有幫助”。
表2是對學生常用統計軟件的多重響應分析表。從表2可以看出R、Matlab、Excel和SPSS這四種軟件的使用率較高,而與處理大數據相關的軟件Hadoop和python使用率極低。從分析結果來看,各高校都有開設實踐課程,但在大數據環境下實踐課程安排仍然不足,學生對于處理大數據的軟件了解甚少,目前主要還是SPSS和Matlab等。
(三)對學生需求不了解
本研究在對大數據課程的設置上,學生主要考慮的方面進行了調查,并對本科生和研究生所考慮方面的異同進行了分析,得到交叉列表(表3)。
從表3可以看出,無論是研究生還是本科生,在大數據課程的設置上,最先考慮的是課程的前瞻性與易學性。為了探究研究生和本科生關于課程設置上考慮的方面是否相同,文章利用SPSS進行了方差齊性檢驗,得P值為0.102,故認為方差是齊性的。然后進行方差分析得P值為0.007,遠小于0.05,故認為本科生和研究生考慮問題存在差異。
(四)學生對大數據行業就業意向不強烈
針對學生在大數據時代的就業意向,問卷設計了三個問題,分別是“您認為大數據在哪些科學研究領域更有發展潛力”“您對大數據分析相關行業的前景預測”及“在大數據時代影響下您畢業后傾向于哪些行業就業”。從表2中可以看出,308名學生中有267名學生(86.7%)認為有必要開設大數據有關課程,因此,大部分學生認為有必要開設大數據相關課程。本研究利用SPSS探討學生對大數據相關行業的前景預測與看待開設大數據相關課程的必要性是否有關,得到看待統計學專業開設大數據課程的必要性和對大數據分析相關行業的前景預測二維交叉表(表4)。


本研究通過對學生畢業就業傾向進行調查,卻得到了與看好大數據分析相關行業前景相悖的結論,圖1為學生畢業就業傾向分布圖。
由圖1可以看出,本科生和研究生對公務員、事業單位和教育行業就業傾向更大,而對與大數據分析緊密相關的IT行業就業傾向很不明顯,這與表4中大部分學生看好大數據分析相關行業相矛盾,這也反映了理想與現實的差距,學生受傳統就業觀念的影響依然較大,因此應結合學生就業情況來進行教學改革。
五、相關建議
(一)調整課程結構
1.重視數學基礎不動搖,但要縮短學時
統計學學生首先必須具備扎實的數學和統計學理論基礎知識,可以將微積分(如積分、微分和多元積分)和線性代數(如矩陣分解、線性變換、歐式空間)的數學思想運用到統計學中。一方面,高等數學發展成熟且不斷在社會中普及、向中學滲透,學生數學分析能力普遍提高;另一方面,大學學時有限,更多課堂時間需要用在向上銜接的課程上。
2.加快課程改革,與大數據充分銜接
開設大數據課程或者參加大數據相關講座是學生學習大數據的主要平臺[7]。大數據屬于基礎資料,在計算機科學、統計學、數學及運籌學等多個領域有所應用;大數據的獲取使數據整理步驟更加復雜,需要應用更多的技術,如數據的甄別技術、數據倉庫技術等;大數據時代除少部分數據具有結構化特征外,更多的是非結構化數據[8]。因此,要結合大數據的特點,對統計學的基本內容進行拓展,加入機器學習等大數據課程,學習處理海量數據的新方法,讓學生學會用數據思考。
(二)樹立復合型統計人才的培養目標
大數據時代下的統計學不僅要求學生有扎實的理論知識基礎,更對動手能力和處理實際問題有較高要求,需要學生熟練使用多種統計軟件,掌握編程的概念和方法等。因此,學生應具備整理、清洗和重新整理數據的能力,要對數據有敏感的觀察力,創新思維[9];要熟練運用R、Python、SAS等統計軟件,要熟知各種數據庫的訪問、數據錄入、數據真偽性檢驗等;要掌握多種編程語言,如把問題模塊化、算法思想、結構化程序設計等[10];提高學生的寫作能力、溝通技能及團隊合作能力,尤其是碩士研究生和博士生,要能夠簡明清晰地講解自己的研究項目或專業知識,培養自身的溝通協作能力[11]。
(三)結合就業推動供給側改革
統計學課程設置應充分考慮學生畢業去向,對學生畢業后繼續學習還是就業要有不同的培養方案,因此要結合學生的就業意向進行教學改革。具體來說,要對大數據分析相關行業就業前景有一個大致的判斷,并對未來大數據在哪些領域更有發展潛力有一定的認識,這樣才能更有針對性地對大數據相關專業知識進行學習。
大數據人才需求十分旺盛,但能夠勝任大數據相關工作的人才十分短缺,這對于統計學的發展來說是很好的機遇,可以實現高校與社會互利共進,符合國家長期戰略發展需求。在課程改革方面,課程設置必須與就業相結合,讓學生有好的就業前景是統計學教育改革的重點,因此,應密切關注社會需求,積極調整課程體系,讓學生更多地接觸有關社會實際問題的探究[12]。
參考文獻:
[1]吳翌琳,房祥忠.大數據探索性分析[M].北京:中國人民大學出版社,2016.
[2]郭迎春.大數據時代統計學課程教學方法與模式研究[J].教育現代化,2016(32):9.
[3]袁衛.機遇與挑戰——寫在統計學成為一級學科之際[J].統計研究,2011(11):3- 10.
[4]陳秀芬.大數據時代下統計學課程教學改革的思考[J].高教學刊,2015(20):106- 107.
[5]李金昌.大數據與統計新思維[J].統計研究,2014(1):10- 17.
[6]陳倩.大數據背景下對統計學課程教學模式的思考[J].科技資訊,2013(21):177.
[7]孟生旺,袁衛.大數據時代的統計教育[J ].統計研究,2015(4):3- 7.
[8]趙彥云,劉子燁.統計學要在大數據科學中扮演重要角色——ASA發布統計學科建設的發展報告[J].中國統計, 2015(12):4- 5.
[9]Jordan J M, Lin D K J. Statistics for Big Data: Are Statisticians R eady for Big Data?[J].中國統計學報,2014 (1):133- 149.
[10]Schoenfeld A H. C ognitive Science and Mathematics Education[M].New York:Lawrence Erlbaum Associates,2010.
[11]Wang C, Chen M H, Schifano E, et al. Statistical Methods and Computing for Big Data[J]. Statistics & Its Interface,2015(4):399.
[12]汪霞,錢小龍.高校課程結構調整與大學生就業:基于工作搜尋理論的分析[J].清華大學教育研究,2012(3):21- 27.