程勝
摘要:本文歸納了大數據發展的特點,分析了統計學面臨的挑戰,就統計學本科教學體系中存在的問題進行了梳理,并提出了教學改革的方向和相應措施。
關鍵詞:大數據;統計學;教學體系
中圖分類號:G642.4 文獻標志碼:A 文章編號:1674-9324(2018)16-0169-02
一、引言
大數據的本質是實體社會的虛擬化,無處不在的海量信息正改變著整個世界和日常生活方式。大數據之所以“大”,首先在于數據采集成本低、數據累積速度快,由于計算機技術的發展和普及,人們記錄、采集數據的成本較以前有了極大地降低,而且數據累積速度更加快捷。其次,數據來源多元化,如從產品全生命周期階段來看,貫穿設計到制造、從使用到維護、直到維修整個階段都會產生許多結構或非結構數據。大數據不僅體量大,增長速度快,而且數據的多樣性,即數據的來源、種類也日益復雜。再次,數據處理速度快,快速的處理是大數據內在要求,大數據的時間價值十分重要,如GPS位置信息,快消品網站、金融交易及用餐時間的外賣網站點擊流等,由于用戶眾多,短時間內產生的數據量十分龐大且具有強時效性就要求處理速度快速化。最后,數據價值密度低,正是由于數據產生量巨大,數據自動采集成本低,數據被記錄完整的可能性較以前有了極大提升,但也意味著包含了大量噪音信息。這也使得有用信息的提取及數據規律的探尋面臨前所未有的挑戰。
本質上,大多科學研究活動并非從事先設想好的理論架構或科學原理來演繹、推理科學問題,而是從數據本身出發,運用不同分析方法歸納總結和發現科學規律。大數據環境下問題越來越復雜,使演繹研究變得愈發困難。高維、高頻的不同來源、不同結構、不同形式的海量數據可以快速、方便地被整合,使原來處于孤立、分散的數據更加容易地聯系起來,為發現數據背后的規律打開了更寬廣的視圖,更能發現小數據時代不易發現的新現象、新知識和新規律。
在大數據時代,部分傳統的統計方法在來源多元性、多重結構的大數據環境下失效,也難以完成復雜的計算和存儲。當然,盡管大數據提供了強大的數據分析條件,但也得付出如人力成本、時間成本和計算成本等。大數據并不能提供一個適宜于所有問題的解決方案,仍需要采用適合的統計方法來解決不同的問題,如抽樣、相關分析、因果推斷仍是可選手段。因此,大數據背景下,如何發展統計學學科?如何開展適應時代要求的統計學教育活動及培養人才?這些命題都需要統計學者思考。
二、本科統計學教學體系存在的問題
大數據為傳統統計分析方法提供了可觀測足夠多的樣本,但也提出了如何刪選、提取數據,如何整合異質性多元數據、復雜結構數據的難題,同時在實際中,數據并非單純的越多越好,大數據所負載的信息價值存在邊際遞減效應,當數據體量越大,信息收集邊際成本在增加,而信息價值在遞減,如何平衡信息成本和效用同樣是一個巨大挑戰。因此,如何培養適應大數據時代的統計學人才以滿足市場需要是目前高校教學體系改革的重要問題。目前,大多國內本科統計學教學體系存在以下幾個問題。
第一,培養目標和大數據契合度不高。傳統的本科統計學專業培養體系更多地關注如何培養學生收集、整理和分析數據的能力,而大數據時代數據的獲取較為容易且更為全面,與計算機技術的融合愈發緊密,傳統意義上的數據分析模式已經不能適宜于大數據的數據結構特征。這就需要統計學專業人才的培養目標從傳統的應用型向數學、統計學、計算機科學高度融合的復合型轉變。
第二,培養方案中缺乏對數據收集、抽樣的訓練環節。大多數高校本科統計學培養過程都是基于統計技術開展的,如強調回歸分析、協整、預測、時間序列及判別、聚類等分類技術的運用,而忽視了如何開展數據收集、如何抽樣的教學訓練。另外,大數據的生成與采集在人為的設計框架之下,可能存在系統性偏差,抽樣可以與大數據交叉驗證。
第三,教學內容與大數據關聯性不強。目前大多高校統計學教學都圍繞著統計學原理、計量經濟學、應用回歸分析、時間序列分析等課程開展。但是在大數據環境中,統計學離不開數學和計算機科學的支撐。同時,大數據應用領域包括經濟、管理、生物、傳播學等多個領域,教學內容的學科交叉是大數據背景下統計學人才培養的重要基礎。另外,統計學的培養體系須注重教學內容的模塊化,因此,教學內容則要從不同培養的目標出發,設計如經濟統計、管理統計、金融統計、生物統計等方向的教學內容模塊,并引導學生從多個模塊中尋求大數據關聯,發現新規律,創造新知識。
第四,實踐環節薄弱。由于數據邊際成本降低,過去以模型驅動的教學體系已不適應實際應用的需求,以模型出發,收集數據以證明模型或機制的正確與否往往無法逃離人為設計機制的嫌疑,且更多地是“過去式”規律的研究。大數據時代,更多需要從數據出發,以相關分析為基礎,以因果關系檢驗為主要工具,探尋大數據間隱藏的、不被認知的科學規律。因此,盡管大多高校都設計了教學實習、認知實習及畢業實習等環節,但由于應用領域的細分,統計學學生在實習過程中,往往因為沒有相關領域的基礎知識,實習的效果并不明顯。
三、本科統計學教學改革的方向和措施
由以上分析可知,大數據的來臨是統計學人的機遇,同樣也是挑戰,統計學人才的培養不能再在理論到理論的閉環中轉圈,只有結合大數據的特點,積極開展教學內容、教學實踐的調整和改革,才能在新的時代環境中,培養具有扎實理論的復合型人才。
第一,重構教學體系,重新設計教學內容。大數據的出發點在于體量巨大的數據,更加注重數學基礎、統計學理論知識和計算機技術的訓練,更加關切數據應用。因此,統計學教學體系的改革要從基礎和應用兩方面著手,一是加強高等數學、概率論、統計學知識的基礎訓練,培養學生嚴謹的邏輯思維和扎實的基礎知識;二是增加計算機技術的課程,加強學生對網絡技術、網絡計算的架構認知,了解計算機并行計算、優化計算的算法設計特點,開設JAVA設計課程,培養學生良好的編程習慣,提高編程能力;三是基于不同的應用,開設多門選修課程,引導學生基于興趣開展相關領域的專業知識學習。有意識地培養適應與不同行業需要的統計學新型人才。
第二,創新教學模式。教學模式的創新必須遵從以發揮自身優勢為原則,以解決實際問題為目的,以市場需求為導向,各培養院所應結合自身特點,設計合理的教學模塊,改革教學模式,體現大數據時代統計學專業人才培養的方向。大數據背景下統計學的教學模式須強化案例教學,在講授基礎知識的同時,也應注重以新現象、新問題、新案例為基礎,積極開展課堂討論和交流,引導學生如何將知識轉化成能力,提升學生發現問題、分析問題和解決問題的能力。同時,課堂教學中,也可以論壇的形式,老師和同學們一起來厘清問題的結構、邊界、層次及面臨的解決困境,共同提出解決問題的方法邏輯及工具清單。同樣,教學模式的改革也要注重科學研究能力的培養,可設立多導師組制度,以研究問題為主軸,以多個學科組成的導師組為輔助,幫助學生解決學習中的各種實踐和理論問題。另外,教學模式的改革需要從個性化的、行業化的角度開展實踐,培養單位需從自身的學科特長、遵從學科優勢發揮的原則,創新適宜于自身特點的特色教學模式、特色教學內容,以培養個性化的行業大數據分析人才。
第三,加強實踐環節。傳統的統計學課程體系中經管設計了課程實踐、認知實踐等內容,但由于較少涉及到實際案例及應用,學生實習效果不佳。大數據背景下,實踐環節需要從兩個方面加強,一是強化學生計算機技術的實踐環節,目前大多統計學學生的計算機基礎較為薄弱,不了解云計算的邏輯框架,不了解并行計算的原理,不了解數據庫的基本結構就不能很好地利用計算機技術架構數據平臺。二是加強以項目式訓練的實踐環節,大數據具有行業分布廣,市場導向性強,專業知識要求高的特點,這就要求以系列不同類型、不同行業的項目開展學術訓練,如此不僅能拓展學生的專業視野,提升學生動手參與解決實際問題的能力,也將提前完成學生就業的磨合期,讓學生能夠更加從容地、專業地參與到實際工作中。
統計學作為一門具有較強應用特征的顯性學科,在大數據浪潮中,只有真實面對自身學科局限,探索學科前沿,以充分發揮其基礎性作用為基石,才能在新背景、新形勢下得到更好地發展。同時,統計學本科培養單位也應結合大數據的特點和自身優勢,開展課程體系和課程內容的適時調整,強化統計學基礎知識與計算機技術的高度融合,凸顯教學模塊化的設計理念,注重教學實踐環節的訓練和導向性,培養適宜于大數據要求的多學科交叉、復合型人才。
參考文獻:
[1]李金昌.基于大數據思維的統計學若干理論問題[J].統計研究,2016,33(11).
[2]王燕,李彥.大數據時代下的統計學重構研究[J].中國林業經濟,2016,(03).