文/李紅
目前,互聯網、5G、人工智能、物聯網、多媒體、大數據等技術正在不斷發展。其中,大數據技術已經在零售、制造、金融、政府政務、醫療、物流及移動通信等多個領域得到了廣泛應用,并且創造了巨大的經濟效益和社會效益。隨著大數據時代的到來,統計學研究對象的基礎發生了變化,人們認識、收集和分析數據的思維也發生了變化。[1]大數據提高了統計質量,降低了統計成本,使統計學的應用領域不斷擴大。大數據給統計學帶來了發展機遇,但分布式大數據和數據流環境也給統計學帶來了挑戰。統計學最直接的挑戰是,在大數據環境下,部分傳統經典的統計方法已經失效。[2]有學者提出從改變對樣本的認識、改變對不確定性的認識等八個方面出發,應對大數據帶來的機遇與挑戰。[3]

統計學是關于數據收集、整理、分析和解釋的一門學科。數據是統計學的研究對象。在大數據時代之前,統計數據往往來自普查、抽樣調查和統計報表;人們在研究目的的驅動下,收集數據;數據類型為結構化數據。然而,在大數據時代,數據類型不僅包括結構化數據,還包括非結構化數據(如文字、圖片、聲音、視頻、網頁、日志等)、半結構化數據。數據來源渠道多樣,不需要事前設計和組織調查,并且數據獲取速度快,從而極大地擴充了統計數據的來源。
2.2.1 數據收集方式發生變化
在大數據時代,統計數據大多來自網絡上自動記錄、儲存的數據,不具有目的性,數據采集不再局限于傳統的問卷調查、座談會、電話調查等方式,而是使用傳感設備自動采集。這種新的數據采集方式,使統計樣本的概念發生了變化。傳統統計學樣本是來自總體的部分個體,樣本應該具有代表性,并且能夠反映總體的特征。在大數據時代,樣本就等于總體。人們需要利用網絡爬蟲技術,采集網頁信息或數據。
2.2.2 數據整理方式發生變化
在大數據時代之前,統計數據整理是指根據統計研究的任務和要求,按照整理方案,對調查收集到的原始數據進行加工,使之條理化、系統化,從而得出反映總體特征的綜合資料的工作過程。統計數據整理的程序包括統計數據的審核、分組與匯總、統計圖表編制。數據審核主要審核數據的完整性、準確性和及時性。在大數據時代,數據量非常大,其中可能存在虛假的、錯誤的數據,這些數據不能直接使用。因此,在使用大數據之前,人們需要開展數據篩選、數據清洗、數據提煉、數據降維、數據降噪等工作。大數據不再強調數據的精確性,“允許不精確”已經成為大數據的一個顯著特點[4,5]。與樣本容量小、數據類型為結構化數據的統計數據相比,大數據的數據量更大,數據類型更加復雜多樣,數據價值密度更低。
2.2.3 統計分析方法發生變化
大數據時代的到來,給傳統統計分析方法帶來了挑戰,一些傳統的統計分析方法已經不再適用,人們需要發展新的數據分析方法。分布式并行計算技術的快速發展,催生了適用于大數據抽樣、分類、聚類、關聯分析的K-means算法、Apriori算法等新的分析方法。傳統統計學教材側重變量之間的因果關系,統計推斷分析是以抽樣分布理論為基礎的。在一定的概率下,人們可以利用樣本特征,推斷總體特征。然而,在大數據時代,統計分析側重相關關系分析,樣本就是總體。因此,人們不再用樣本特征推斷總體特征。
統計學是一門方法論科學,它主要培養學生利用統計學理論和方法分析解決實際問題的能力。因此,學校需要加強學生實踐能力培養。目前,經管專業統計學課程教學包括理論教學和實踐教學。由于教學內容復雜和課時較短,學校往往重視理論教學,卻忽視了實踐教學。同時,傳統實踐教學大多使用Excel、Eviews、SPSS等統計軟件。這些統計軟件無法對高維、復雜、多樣的海量數據進行降維、清洗。在大數據時代,這些軟件已經不再適用。此外,實踐教學中的數據通常是經過加工整理后的二手數據,而不是原始數據。其中許多基于小樣本數據建立的傳統統計方法,并不適用于大數據分析。[6]實踐教學與大數據分析人才需求脫節,導致許多學生無法利用所學知識去解決企業的實際問題。
大數據要求人們在數據處理與分析等方面使用新技術。因此,教師不僅需要掌握相應的統計理論知識,還需要掌握計算機互聯網技術、信息技術等相關知識,例如數據庫、結構化編程、算法、數據結構等知識。另外,教師還需要熟練應用統計軟件,對大數據中的數據進行獲取、清洗、降維、降噪、數據可視化展示、分布式計算、并行計算。這對經管專業統計學教師提出了更高要求。因此,為了適應時代發展,滿足人才培養的需求,教師需要及時調整和更新知識結構,提高大數據分析技能。

大數據時代的到來,使大數據在體量、類型、結構等方面與傳統數據有所不同,這對數據的搜集、篩選、整理與分析提出了新的要求。在經管專業統計學教學中,教師應樹立大數據思維,結合與專業相關的大數據案例,選用合適的統計分析方法,對數據信息進行搜集、存儲、清洗、整理與分析,增強學生的大數據意識,提高學生的大數據分析能力。
在大數據時代,數據類型不僅包括結構化數據,還包括非結構化數據。教師可以從以下兩個方面出發,優化統計學課程教學內容:增加真實的大數據案例和大數據處理技術等相關內容;增加大數據的統計分析方法。教師應將大數據環境下產生的經濟問題、商務問題作為案例,采用基于大數據分析技術的教學模式,培養學生的實踐能力。在大數據時代,人們不再區分總體與樣本的概念(總體即樣本),并且開始重視相關分析與因果分析。因此,教師應結合實際情況,增加推斷統計等內容。另外,在教學過程中,教師不僅需要介紹抽樣調查的基本原理和主要方法,還需要介紹參數估計、假設檢驗、時間序列分析、回歸分析、主成分分析等統計方法。
為滿足大數據時代對數據分析人才的需求,教師應加強實踐教學。教師需要增加實踐學時,利用Python等統計軟件,提高學生數據分析能力;需要引入真實案例數據,并且保證每一章都至少有一個真實案例;應以問題為中心開展教學,以任務驅動改變教學方式,引導學生從被動接受知識轉變為帶著問題主動探索知識。除此之外,教師應將社會熱點問題作為案例,比如新冠肺炎疫情下的國家宏觀經濟和居民消費、稅收優惠與企業研發投入、社會保險費率與企業用工成本等。教師還需要組織學生開展調查和研究,指導學生收集、整理、分析相關數據。實踐教學應重在引導學生利用統計方法解決實際問題,培養學生的獨立思考能力和動手能力。
教師應充分認識大數據時代帶來的變化和挑戰。教師需要不斷更新知識結構和提高教學能力。在大數據時代,人們需要應用分布式計算、云存儲、關系數據庫等信息技術,快速搜索、抓取、存儲、計算和分析各種類型的數據。因此,教師應當與時俱進,不斷學習大數據知識,更新和完善自身的知識體系,以適應大數據背景下的統計學課程教學需求。
在大數據背景下,社會對經管專業人才提出了新的要求。因此,在經管專業統計學課程教學中,教師應樹立大數據思維,不斷更新教學內容,增加實踐教學,完善知識體系,以適應大數據時代對數據分析人才的需求。