王志剛,師津,張巖
(內蒙古財經大學統計與數學學院,呼和浩特010070)
2017 年12 月,中共中央就實施國家大數據戰略第二次集體學習上,中共中央總書記習近平在主持學習時強調“善于獲取數據、分析數據、運用數據,是領導干部做好工作的基本功。高校作為人才培養單位,是數據分析能力培養和數據科學素養形成的關鍵時期,為未來提供合格的人力資源是高校不可推卸的責任,而教師是教育的主要實施者,也是教學成果和學生成長的重要影響因素致之一,因此教師的數據思維能力和數據科學素養直接決定了人才培養目標是否能夠實現。
國內研究者關注的數據思維能力和數據科學素養的影響因素主要包括數據意識、數據獲取、數據處理、數據評估和數據道德六個方面的能力(阮士桂[1]2016;隆茜[2]2015;郝媛玲[3]2016;張進良[4]2016;張斌[5]2017;黃如花[6]2016)。而國外研究者則更著重于利用數據來演繹、推導結論及利用數據進行決策的能力(Mandinach E和Gummer E[7-8]2016、2013)。綜上,可以看出:眾多學者對高校教師數據素養的研究側重定性分析,并沒有對高校教師的數據思維能力和數據科學素養通過調查數據定量分析。由于目前的研究仍然處于起步階段,缺乏必要的定量分析,為此本文結合教育學與統計學交叉研究的基本范式,將數據思維能力影響因素和數據科學素養提升方案作為統計學研究對象,通過問卷調查的方式獲取第一手數據,對影響高校教師數據素養的各個因素進行定量分析,得出真正制約內蒙古地區高校教師數據素養提升的原因,為其他落后地區數據素養研究提供參考。
本文所搜集的數據以內蒙古地區高校教師填寫的調查問卷為第一手數據。利用基礎統計方法或機器學習法分析數據以得到關于教師數據素養現狀的數據分析結果。但第一手數據內容多為邏輯型數據變量和字符型變量,直接進行線性運算例如:集中趨勢的度量、離散程度的度量、偏態與峰態的度量沒有實際意義,因此需要對部分數據進行因子化處理,將因子與其他變量進行耦合分析,得出相關結果。通過對數據進行回收,我們共收集到266 份初始調查問卷,通過去除唯一屬性、時間篩選的方法最終保留240 份有效數據。
在選取變量時按照從原始數據中選取合適的屬性作為數據挖掘屬性,選取過程應參考的原則是:盡可能賦予屬姓名和屬性值明確的含義、統一多數據源的屬性值編碼、去除唯一屬性、去除重復性、去除可忽略字段、合理選擇關聯字段。
調查內容主要包含高校教師數據意識態度、數據知識、數據教學實踐、數據教學應用、大數據五個方面。其中,數據意識態度包括數據意識與數據態度兩方面;數據知識包含數據基礎知識與數據工具使用情況兩方面;數據教學實踐包含數據采集與獲取、數據處理與分析、數據評價三方面;數據教學應用包括數據挖掘和交流、數據制定教學決策兩方面;大數據包含大數據研究平臺與大數據對高校教師數據科學的影響。本文利用棘狀圖等可視化形式呈現了內蒙古高校數據科學素養相關五個方面的情況,并對不同性別、不同任教科目對高校教師數據科學素養的影響進行分析。
(1)高校教師數據意識與態度。在所調查的樣本中,內蒙古17 所本科高校中教師使用數據解決問題的意識中,36.7%的教師數據意識較強;33.3%的教師對于數據意識沒有概念,也從不留意身邊數據;其余30%的高校教師偶爾關注周邊數據,并將其應用教學實例中。在數據態度方面,考察教師使用數據的倫理道德方面,是否合理、安全地使用數據,并對所含隱私數據是否進行保護等方面,其中83.3%的高校教師選擇從合法渠道買賣數據并保護隱私數據。
(2)高校教師數據知識。根據調查結果顯示:數據基礎知識掌握方面,利用統計數據進行相關知識的教學占比76.6%,經常、偶爾通過書籍等渠道了解或者專門學習數據如何分析占比分別為63.3%與20%;對于數據工具使用情況,60%的高校教師使用數據分析工具超過三個,而Excel、SPSSS 使用率高達63%以上,相反地,SAS、R、Python、Stata 等軟件使用極低,其中最高占比16.7%。從這兩方面來看,內蒙古高校教師使用統計軟件的能力較弱,使用工具較單一。但數據基礎知識方面情況良好,單這一方面可看出,內蒙古高校教師數據知識在逐步積累。
(3)高校教師數據教學實踐。根據教師數據實踐所含內容,將其分為數據采集與獲取、數據處理與分析、數據評價三方面進行分析:
①數據采集與獲取。對于高校教師而言,通過設計調查問卷獲取第一手數據資料是經常采取的數據獲取方式之一。而在設計問卷頻率獲取數據的調查中,30%的教師從來沒有通過設計問卷獲取數據,40%的教師平均每學期1 次通過設計問卷采集數據,其余30%每學期平均超過2 次,并對其進行分析。
②數據處理與分析。在此次調查中,經常使用統計軟件從事相關工作占樣本的63%,利用統計數據進行相關知識的教學占比76.6%。從這兩方面來看,內蒙古高校教師在實踐教學中數據處理能力有待加強。
③數據評價。高校教師利用統計知識對學生成績分析情況來看,16.7%的教師對于學生的每次成績都進行數據評價與分析;而從來不會對學生成績進行數據評價占比33.3%,其余50%只統計重要考試成績。從這一方面來看,內蒙古高校教師數據評價較為片面。
(4)高校教師數據教學應用。從數據挖掘與交流方面來看:76.7%的教師利用數據制定教學目標,并將其應用到教學中;76.7%的教師根據數據選擇調整教學計劃;而經常統計學生的興趣并運用到教學計劃中占樣本總體的13.3%;選擇從不統計學生興趣,并不會將其運用到教學計劃中占比30%;其余56.7%采取偶爾統計學生興趣并運用到教學計劃中。從這方面來看,內蒙古高校教師數據教學應用范圍較窄,應用能力較弱。
(5)高校教師大數據。在大數據環境下,40%的高校教師認為其對于強化教師的數據意識、鍛煉教師的數據搜集和分析能力,可以有效提高高校教師的科研能力;53.3%則認為強化高校教師的數據意識能力、分析等能力只對某些學科有幫助,對于大部分學科則沒有幫助。從這一方面來看,內蒙古高校教師大數據對于數據科學素養的培養認識欠缺,范圍僅限于與“數據科學”相關專業。
從調查結果中,選取高校教師數據科學素養內容中男性、女性選擇較為不同的方面,如圖1 所示的數據知識、數據工具、數據評價、數據挖掘與大數據的五項內容。由圖1 可知,在所調查的樣本中,男女比例分別為43.3%、56.7%,所調查樣本量中男女比例較為均衡。

圖1 高校教師數據科學素養性別分布棘狀圖
數據知識方面,男女教師的選擇明顯不同。其中偶爾學習數據知識這一選擇中,女性選擇占比83.3%,經常、從不學習數據知識選項中差別較小。在數據知識方面,男教師學習數據知識的積極性要明顯高于女教師。數據工具方面,男教師數據工具使用數量要明顯高于女教師。其中,女教師多數集中在使用1 個數據工具上,而男教師則集中2 個以上。數據評價方面,男教師對于學生成績分析的頻率要高于女教師。也就是說男教師對數據經常進行評價,相反地,女教師數據評價次數較少。在數據挖掘方面,男教師多數選擇通過數據挖掘,利用數據制定教學目標,其中在是否對數據進行挖掘選項中,女教師更傾向“不挖掘”。在大數據方面,女教師更認為大數據能強化教師的數據意識、鍛煉教師的數據搜集和分析能力,有效地提高高校教師的數據科學能力。
從調查結果中,選取高校教師數據科學素養內容中科目選擇較為不同的方面,如圖2 所示的數據意識、數據知識、數據工具、數據評價、數據挖掘五項內容。由上圖可知,在所調查的樣本中,文科、理科、工科的比例分別為16.7%、70%、13.3%,所調查樣本中內蒙古地區理科課程與教師較多,故其比例較高。
數據意識方面,在經常留意數據與培養數據意識中,文科教師與工科教師比例較為接近,其對數據較為敏感,在一方面,文科、工科與理科教師數據意識相差不大。數據知識方面,理科>文科>工科。其中經常學習數據知識這一選擇中,工科占比23.8%,文科占比19%,理科占比57.2%,文科、工科差距較小;偶爾、從不學習數據知識選項中文科、工科差別較大,文科教師選擇偶爾、經常從書本獲取數據知識,而工科教師則更愿意選擇其他途徑獲取數據知識。數據工具方面,工科類教師數據工具使用數量要明顯高于其他類教師。其中,工科教師多數集中在使用2 個以上,而文科和理科教師在每個層次都有分布。數據評價方面,工科教師對數據評價的頻率較高,且范圍較廣;相反地,文科類教師數據評價次數較少。在數據挖掘方面,理工類教師更擅長對數據進行挖掘分析,而文科類教師數據分析與挖掘能力較弱。

圖2 高校教師數據科學素養科目分布棘狀圖
通過以上分析發現高校教師數據素養主要存在以下三個問題:
(1)高校教師數據素養水平層次不齊。由于學科領域、研究環境、知識結構的差異,數據素養在主體上的表現也呈現差異化。特別是在學科領域尤為明顯,我們將學科分為文科與理科,文科教師善于對數據進行搜集與積累,而理科教師在數據的挖掘,數據分析工具的使用更勝一籌。此外,高校教師在運用數據分析問題,解決問題時往往對問題的理解、數據的挖掘不夠深刻,在數據評估與數據分析方面不夠科學。
(2)高校教師數據道德水平有待提高。部分教師通過非法渠道獲取數據,在提倡保護知識產權的時代的今天,數據同樣受到法律的保護。通過非法方式獲取數據既受到道德的譴責,也是違法行為。同時數據道德水平的有待提高也從側面反映出部分教師缺乏數據意識,收集數據的能力不足,無法獲取有效數據。
(3)高校教師數據素養發展動力不足。高校教師數據素養在國外得到較長時間的發展,已經比較成熟,而我國起步較晚,對數據科學素養缺乏深入的研究,也沒有形成完整的數據素養培養體系。發展平臺、發展機制的相對落后嚴重制約了我國高校教師數據素養的提高。
針對以上問題我們提出如下建議:
(1)開展與其研究領域、學科教學相關的數據素養培養。同時,要對高校教師的研究領域、知識結構展開背景調查,充分了解不同科研背景、教學背景下教師的數據管理需求??梢蚤_展不同層次的教學講座、論壇,課程,使數據素養融入到相關專業。有針對性的對高校教師進行數據素養的培養,能夠有效提高高校教師在其教學、科研領域的教學能力與科研能力。
(2)加強對正確的數據素養的宣傳力度。高校應當從自身發展的實際情況出發,同時結合教學、科研的實際特點,開展數據意識、數據態度,以及數據應用價值的培訓,能夠使得教師、研究者、以及制度制定者更加深入地了解數據素養的深層次內涵,營造良好的數據使用文化發展環境,讓正確的思想指導我們的工作。
(3)建立健全符合高校自身發展特點的數據素養教育培養體系與評價體系。數據素養的提升不僅需要高校教師從自身角度進行提升還需要高校建立完備科學的培養與評價體系。這就需要通過政府與各級教育主管機構的支持與干預,充分發揮相關部門的作用。先行建立全國性的權威數據素養試點院校,待發展成熟后進行推廣。同時根據我國高等教育的特色與培養目標,參考國外先進經驗,在實踐中不斷總結經驗,來制定一套規范化、體系化的國家標準。