田國華
[摘 要]大數據時代,傳統統計學課程的教與學都發生了深刻變革。明確什么是大數據,厘清大數據和統計學的關系對學科發展至關重要。文章主要從教學內容、教學方法和教學手段3個方面探索教學改革的實施路徑,以期學生能更好地運用統計學分析和解決工作和學術科研方面的問題。
[關鍵詞]大數據;統計學課程;應用導向;實踐導向
doi:10.3969/j.issn.1673 - 0194.2020.22.110
[中圖分類號]G642.3[文獻標識碼]A[文章編號]1673-0194(2020)22-0-02
1? ? ?緒 論
隨著大數據和人工智能時代的到來,人們對數據的關注度越來越高,大到國家政府,小到企業個人,都處于這個深刻變革的數據時代,無論情愿與否,都無法逃避。大數據時代賦予數據分析前所未有的使命,但也對其應用提出了嚴峻的考驗。目前,人們對大數據的理解和認識存在很多方面的誤區。其中,很突出的一個表現就是凡是數據都冠以“大數據”之名。另一個表現是國家將大數據產業發展作為戰略布局和頂層設計后,各地紛紛成立了大數據中心、大數據機構以占領大數據產業高地。加強基礎設施硬件建設的同時,還在加強“軟件”建設。大數據概念的界定取決于定義者的觀點和學術背景,歸結起來,大數據指在一定的條件和合理的時間內,可以通過現代計算機技術和創新統計方法,有目的地設計、獲取、管理和分析數據,揭示隱藏在其背后的有價值的模式和知識。
2? ? ?傳統統計學與大數據概述
統計學是一門搜集、整理和分析總體的數據資料的理論和方法的科學。統計學作為社會經濟管理等領域的方法論學科,是分析問題、解決問題的重要方法,在經濟學、管理學、醫學、生物學等學科應用十分廣泛。傳統統計學與大數據的主要區別分為以下7個方面。
2.1? ?樣本概念的轉變
傳統統計學中的樣本概念至關重要,只有在明確了總體和樣本的概念后,才能根據研究任務和研究目的確定樣本框和樣本容量。在這種情形下,依據隨機原則抽取的樣本數據是稀缺資源,通過對該樣本數據進行詳盡的分析研究,可以實現樣本最大價值,進而做出科學推斷。而在大數據時代,大部分數據是網絡數據,可以進一步分為靜態數據和動態數據。
2.2? ?數據結構的變化
傳統統計學中分析的數據為結構化數據,是通過統計調查依據事前設計而搜集整理的數據,可以用統計圖和統計表呈現。大數據不僅包括傳統統計學中的結構化數據,更常見的是半結構化數據、非結構化數據,甚至是異構數據,可以挖掘出比傳統統計學更有價值的信息。
2.3? ?搜集概念的擴展
傳統統計學中的數據分為一手數據和二手數據(統計圖或統計表)。前者是通過統計設計、統計調查獲取的數據;后者是經過整理可以直接進行分析的數據。大數據搜集需要經過以下3個步驟:先進行數據預處理,即數據清洗(識別與整理),再進行數據分析,從繁冗的數據中根據研究目的篩選出相關性較高且兼具價值的數據,最后進行數據存儲。
2.4? ?數據來源不同
傳統統計學中的數據無論是直接調查獲取的一手數據還是借用經整理后的二手數據,共同的來源都是實地調查,區別僅僅是調查主體是否為數據需求者。由此很容易對數據進行事前安排、事中控制以及事后核對。如果大部分數據來源于網絡,就無法做到事前安排,也很難做到事中控制,且數據很多時候是發散的,更不可能進行事后核對。
2.5? ?量化方式的變化
傳統統計中的數據是結構化的數據,且量化方法日漸成熟。而大數據多為半結構化、非結構化數據,對其進行量化還存在技術瓶頸。目前,將半結構化及非結構化數據進行量化或者轉化為結構化數據是一個非常重要的研究領域。
2.6? ?分析思維的改變
傳統統計學中的數據分析思路為定性到定量再到定性;而大數據分析思路是從定量到定性。前者主要運用歸納法,這一方法依然是大數據分析的主要方法,后者仍然要通過個體的特征歸納出總體的特征。但對異常值的分析和研究往往更具深意,運用的是演繹法獲取更細小的特征。
2.7? ?統計軟件增多
傳統統計學需要運用統計軟件建立模型進行分析。常用的統計軟件較多,依據是否需要編程可分為兩類:一類是具備可視化菜單操作的軟件,如SPSS,這些軟件兼具編程功能,但相對而言,菜單操作功能更強大;另一類是編程軟件,需要具備一定的計算機語言知識,如R語言、EViews編程、Stata語言。
3? ? ?大數據時代統計學課程改革的方向
統計學作為經濟管理類專業學生的專業必修課程,各大高校和學者都在探索研究改革的方式和策略。東北財經大學的崔瑛認為在高等財經院校(系)非統計專業開設統計學課程時應開設“國民經濟統計學”,其中,包括統計基本知識和國民經濟統計兩部分?;葭日J為只有將統計思維能力培養作為今后統計專業教育的重點,才能真正實現統計教育的可持續發展和統計市場供給和需求的長期平衡。王德勁認為將統計學教學內容進行“模塊”設計,針對各專業需求,選擇不同統計“模塊”,可以充分調動統計學教師、各專業教師和學生的積極性和能動性,將統計學知識和方法教學與各專業存在的實際問題緊密結合。白日榮等認為統計學改革應側重統計思想的傳遞與挖掘,多組織學生進行實踐、實驗活動,讓學生在應用中學習。游傳新同樣是對教學內容進行模塊設計,并提出了課程考核方式的改革。周國富則通過問卷調查的方式了解學生對統計學教學過程中的意見和建議。
統計學課程內容主要包括:統計概述、統計調查、統計整理、抽樣推斷、參數估計、假設檢驗、時間數列、統計指數、相關于回歸分析。就目前的教學狀況看,針對非統計專業開設統計學及相關課程教學時,應在教學內容、授課方式、教學手段和教材選用等方面進行改革。
3.1? ?教學內容的應用導向型變革
經典統計學課程內容僅涵蓋最基本的描述性統計,很少涉及數據分析實踐中必需的推斷統計。無論是統計學的哪個模塊,都應以應用為導向,重新整合內容,將課程設置為應用統計學的統計調查部分。學生在理解普查和非全面調查方法的基礎上,基本可以依據給定的項目選擇適當的方法。但統計調查絕不是單一的選擇調查方法就可以搜集到數據,還涉及統計方案撰寫等內容。即在調查階段有調查方案,在整理階段有整理方案,分析階段相應也需要分析方案。這些方案的撰寫和設計不是在調查事后確定的,相反,為了不偏離研究任務和研究目標,在事前就要制訂完備的方案。尤其是調查方案中的問卷設計,是整個調查方案中最核心的部分,但目前的教學只能紙上談兵,給定項目或自選項目,無法制定具有可行性和價值的問卷。想要打破這一局面,切實提高學生的應用能力,還需要學生在實踐和應用中找到問卷設計的核心和要領。
①統計整理部分。學生掌握最多的是給定分組標志,從而進行統計分組,繪制簡單的直方圖和折線圖。但不以應用為導向的學習必然無法根據項目的研究任務和研究目標自主選取恰當的標志,從而挖掘有價值的信息。②統計分析部分。統計學中諸如抽樣分布、參數估計、假設檢驗、方差分析等內容是理解統計分析的關鍵,然而這部分內容在多數高校中放在概率論與數理統計課程中講解,更多是從復雜的數理推導角度進行詮釋。統計學原理課程因內容上具有重合性,一般不會再次講解,然而從抽象的數理推導過渡到運用,還存在巨大的鴻溝,需要教師著重解決該問題。
3.2? ?教學方法的問題導向型變革
要改變傳統的“教師講、學生聽”的授課方式,根據課程內容設計相應案例,同時采用互動教學方式。教材大多選用理論性強、但缺乏應用內容的教材。基于此,相關單位可從多種教材中博采眾長,汲取精華,適時編寫適用于應用型本科非統計專業使用的教材。此外,在提高學生對新知識的求知欲,保證他們學會經典統計方法的同時,要根據大數據發展的最新形勢,運用恰當的方法搜集、整理、分析數據。
3.3? ?教學手段的實踐導向型變革
學校應從實踐角度出發培養學生的基本軟件操作能力。統計學涉及的軟件較多,如可視化的SPSS、ExceLR;程序化的EViews、SAS、Stata、Matlab等,本科階段應至少掌握SPSS和Stata,應依托項目搜集數據,分析數據類型和結構,選取恰當的分析方法進行數據分析。
主要參考文獻
[1]朱建平.大數據認知的誤區[J].中國統計,2016(12):24-26.
[2]朱建平.大數據時代對傳統統計學變革的思考[J].統計研究,2016(2):3-9.
[3]朱建平.大數據時代下數據分析理念的辨析[J].統計研究,2014(2):10-19.
[4]邱東.大數據時代對統計學的挑戰[J].統計研究,2014(1):16-22.
[5]崔瑛.財經類非統計專業統計教學的改革[J].高教學刊,2015(20):28-29.
[6]惠琦娜.從統計思維能力培養看統計教學改革[J].統計與決策,2010(3):168-170.
[7]王德勁.非統計專業本科《統計學》課程“分塊”教學與管理模式改革設想[J].統計與咨詢,2008(5):70-71.
[8]白日榮,蘇永明.非統計專業統計學教學的改革與創新[J].統計教育,2007(12):25-26.
[9]游傳新.經濟管理類專業統計學課程教學改革模式研究[J].長江大學學報:社會科學版,2009(4):246-247.
[10]周國富.高校非統計專業《統計學》課程教學內容改革應注意的幾個問題[J].統計教育,2008(3):33-34.