章政
(蘇州大學應用技術學院,江蘇蘇州 215325)
統計學作為經管類專業以培養學生數據能力為目的的一門課程,在大數據時代具有重要作用。然而,隨著大數據的產生,統計學的定義、作用與思維方式都發生了變化,促使統計學的發展邁入新的臺階。因此,重新完善統計學課程體系并將大數據與統計學進行有機結合,以培養能夠適應大數據時代的新商科數據人才已勢在必行。
(1)商科數據人才。新零售、新制造、新管理等新型模式的產生,對商科專業教學提出了新的挑戰。這要求培養出來的商科學生具有新理念、新思維以及新方法。在大數據時代,最重要的是數據思維。數據思維實際上還沒有一個明確的定義,指的是在提出問題、分析問題、解決問題的過程中,以數據的收集和利用為核心手段的思維方式。許多企業走在數字化轉型的前沿,其數據人才功不可沒。數據人才通過對數據的收集、預處理、加工以及應用等環節對業務進行預測與調整,有效提高了公司的服務效率。商科專業培養的學生不僅需擁有專業知識,也應具有在數據中看見并形成見識的能力,其中包括管理見識和商業見識。
(2)統計學與商科數據人才培養。隨著企業數字化轉型,數據思維應該成為所有政府管理者、企業管理者必須要掌握的思維方法。高校作為企業人才培養的高地,應將數據思維的培養貫穿于整個教學過程。統計學是培養學生數據思維與數據能力最基本的一門課程。
一名合格的數據工作者不僅能夠掌握業務與行業知識、數據科學相關理論、數據分析方法,還應能夠用先進的分析工具進行分析,使分析過程更加高效、分析結果更加準確。統計學課程在人才培養中的作用為培養學生的數據分析與應用能力,因此在對數據能力要求更高的大數據時代,統計學課程在教學過程中具有重要作用。
(1)研究內容與研究對象的深化。統計學是一門研究數據的科學與藝術。在以往的統計學應用過程中,由于受到搜集條件的限制,數據往往是通過抽樣調查而得來的結構化數據。在大數據背景下,隨著信息化技術的迅速發展,數據來源更加廣泛,數據種類變得更復雜。凡是可以被數據化的信息載體,都可以被稱為數據。這類數據大多為半結構化、非結構化或者異構的[1]。面對非結構化數據,幾乎沒有哪種分析過程直接對非結構化數據進行分析,也無法直接得出結論。因此,在大數據背景下,統計學的研究對象應從結構化的數據轉化為結構更復雜、來源更廣泛、數據體量更大的多類型數據。
(2)研究思路的變化。在傳統的統計學研究過程中,通常從實際問題出發確定研究目的,根據研究目的進行數據收集、數據分析以及結果解釋。涉及統計推斷問題時,需要在確定研究目的時提出假設并通過結論對假設進行檢驗,這是一個從定性分析到定量分析再到定性分析的過程[2]。
在大數據背景下,研究思路則轉化為從定量分析到定性分析。這是由于大數據時代,樣本即總體,此時數據分析最基礎性的工作就是如何從大量數據中找到與研究相關的定量數據,并從定量數據中找出數據背后蘊含的價值,為決策與判斷提供依據。大數據的數據體量巨大,蘊含的價值密度較低。在對這些數據進行分析時,通過數據整合、探索發現并加以總結,將有助于發現意外的規律與結論。一旦某些規律被發現,其蘊含的價值往往很高。
(3)研究工具的多樣化。Excel、SPSS、SAS、R、STATA以及MATLAB為傳統統計學課程最常用的教學軟件。統計軟件的作用在于以一些統計模型如相關分析、回歸分析為基礎進行數據分析與處理,發現數據規律[3]。
當數據的體量和數據類型達到一個限度時,傳統的數據采集、存儲、處理以及分析技術已經不能滿足數據分析需求,須采用分布式存儲、分布式并行計算、流處理等技術。大數據所依賴的數據分析技術為非關系型的,由此衍生出一系列專門做大數據分析處理的工具,如HADOOP、SPARK等。同時,統計學中的數學分析模型已經無法滿足大數據的需求,相比于大數據時代常用的分類、聚類、預測算法,它們數據處理效率較低且無法滿足數據復雜性需求。
(1)教學目標的改革。傳統統計學課程的教學目標主要分為3個方面:第一,對統計原理、理論以及方法的理解;第二,需要學生具備較強的數據搜集、整理、分析以及解釋的能力;第三,需要學生擁有運用統計方法分析解決實際問題的能力。統計學是一門集知識性、應用性以及操作性為一體的課程,也是幫助學生建立數據分析思維掌握數據知識最重要的一門課程。大數據時代的統計學教學,應將學生數據思維的培養引入統計學教學目標。統計學課程不在于教會學生多少公式、多少算法,而在于培訓學生以數據為核心進行思考的能力與意識。同時,隨著數據的多樣化,應讓學生具備大數據時代數據的無樣本性、復雜性和容錯性等意識,使學生既有處理一般數據的能力,又具有識別大數據、分析和處理大數據的能力。
(2)教學內容的改革。統計學分析的4個環節為數據獲取、數據加工整理、數據分析以及結果的呈現解釋說明,因此傳統的統計學教學均圍繞著這4個層面展開,且是基于結構化的少量數據。隨著半結構化與非結構數據的出現,數據的獲取及分析方法均發生了改變。在數據獲取環節,數據既可以從調查與實驗中獲取,也可以通過互聯網、物聯網產生。獲取的數據多為非結構化數據,因此需增加數據的收集與獲取方面的教學。在做一個大數據分析項目時,大部分工作都會集中在數據加工整理環節,基于此應增加數據清洗、數據整合、數據變換、數據歸約內容的教學。大數據時代分析的數據不再是樣本,傳統的統計推斷部分如參數估計、假設檢驗失去了處理大數據的意義,一些傳統的數據分析方法在處理大數據時的結果也無法達到預期[4]。因此,在數據分析環節可以增加能夠處理大數據的分類算法、聚類算法、關聯分析等內容。在統計分析的最后一個環節需要對結果進行可視化呈現,可增加復雜的數據可視化內容教學。
統計學課程課時較為有限,在增加大數據環節教學內容的同時,應將原教學內容進行調整與整合。教學方面需弱化算法、模型的推導過程,關注模型在實際問題的應用,以培養學生的數據思維。
(3)教學方法的改革。大數據時代的到來,對學生的自主學習能力、應用能力提出了更高要求,傳統的“填鴨式”教學模型已無法滿足學習需求[5]。在實踐教學環節,傳統的統計軟件在數據處理量、數據處理速度、模型準確性等方面均無法滿足需求,應選取大數據教學平臺進行實踐教學,其中Python、R語言、Hadoop等大數據分析軟件和處理工具可作為教學環節的一部分。另外,教學層面應創新教學模式,可利用翻轉課堂、混合式教學等模式。教學過程可從項目出發,以學生為中心培養學生解決問題的能力與數據思維[6]。
數據作為統計學的研究對象,在大數據時代已發生了顛覆性的變化,這為統計學的教學工作提出了更高的要求。對于經管類專業的統計學教學,首先應根據數據概念的深化在教學內容上進行改革,同時運用大數據時代先進的分析工具,進行以培養學生數據思維為目的的教學工作,使這類學生成為既具有行業見識又有數據能力的復合型人才。