胡培培
(無錫科技職業(yè)學院 學工處,江蘇 無錫 214028)
近年來,大數(shù)據(jù)的研究和應用越來越廣泛,催生了社會諸多領域的變革。在教育領域,大數(shù)據(jù)對教學、學習、管理、評價、科研、服務等教育主流業(yè)務提供智慧支撐,改變了傳統(tǒng)教育思維方式,為破解傳統(tǒng)教育難題提供了新思路。其中,利用大數(shù)據(jù)完善學生資助體系是較典型的應用。
目前,普通高校建立了以“獎、助、貸、勤、減、補”等多種形式并舉的資助政策體系,資助額度和人數(shù)逐漸增加,資助覆蓋面不斷擴大,但在實踐中存在 “精準資助”定位不準、資助資源浪費嚴重、跟蹤監(jiān)督不到位、育人工作跟不上等問題。在目前沒有健全、暢通的渠道了解學生家庭經(jīng)濟狀況的前提下,大數(shù)據(jù)可以作為解決以上問題的一種嘗試。
大數(shù)據(jù)是指無法在一定時間內(nèi)用常規(guī)軟件工具對其內(nèi)容進行抓取處理的數(shù)據(jù)集[1]。學校大數(shù)據(jù)中心可以采集貧困生的校內(nèi)外數(shù)據(jù)處理并分析,在大數(shù)據(jù)的驅動下,高校資助工作可以更加量化與科學化。
(1)有利于資助政策的完善。每年教育部資助中心都會發(fā)布當年資助發(fā)展報告,用大數(shù)據(jù)解讀全國資助發(fā)展情況,通過了解優(yōu)勢和不足,為下年資助政策制定與決策提供依據(jù),各高校也應如此。
(2)有利于提高資助精準性。教育部長袁貴仁在2015 年全國教育工作會議上明確提出: “要提高國家資助政策的精準度,確保國家學生資助、獎補等優(yōu)惠政策真正落實到每一個需要幫扶的學生身上。”[2]通過對貧困生校內(nèi)外數(shù)據(jù)的采集和深度挖掘,全面掌握學生家庭經(jīng)濟和生活實際情況,改變以往單憑學生申報的家庭經(jīng)濟情況分配資助資源的做法,建立實行動態(tài)資助體系,提高資助精準度。
(3)有利于育人工作的開展。高校資助工作的重心逐漸從物質(zhì)資助轉為精神資助,重視貧困生健康人格和能力的培養(yǎng)。大數(shù)據(jù)可以監(jiān)督學生的學業(yè)和道德成長情況,對于發(fā)現(xiàn)學生成績明顯下降或者參加培訓、活動次數(shù)少的及時給予指導,同時結合就業(yè)大數(shù)據(jù)優(yōu)先推薦貧困生就業(yè)。
(4)有利于資助工作創(chuàng)新研究。以前高校為甄別貧困學生,想了很多辦法,包括競選貧困生、評議貧困生,這些做法遭遇不尊重學生隱私的質(zhì)疑,而大數(shù)據(jù)通過權限設置可以保證學生信息安全。
智能資助的關鍵是貧困生信息的全面采集和處理,在建構智能資助大數(shù)據(jù)技術體系的過程中,“三權分立”模式是一種趨勢,即數(shù)據(jù)采集、存儲管理、數(shù)據(jù)分析使用過程的安全保護由不同的管理決策者來執(zhí)行,以保證貧困生信息的安全。
按照資助大數(shù)據(jù)的全流程管理過程,在標準規(guī)范的約束下,智能資助大數(shù)據(jù)技術架構包括如下五層,具體組成與技術實現(xiàn)如表1所示。

表1 智能資助大數(shù)據(jù)技術架構
第一,數(shù)據(jù)采集層。他是整個智能資助系統(tǒng)的基礎層。所采集的數(shù)據(jù)包括靜態(tài)的貧困生情況調(diào)查表,動態(tài)的智能手機、電腦、傳感器、監(jiān)視器等采集的貧困生校內(nèi)外信息等。
第二,數(shù)據(jù)傳輸層。他負責將采集到的成千上萬的貧困生信息通過光傳輸、通信與網(wǎng)絡設備等傳輸?shù)酱髷?shù)據(jù)處理中心進行處理,網(wǎng)絡性能是重要參數(shù)指標。
第三,數(shù)據(jù)存儲層。他用于存儲傳輸?shù)綌?shù)據(jù)中心的各種數(shù)據(jù),主要包括服務器、存儲器、數(shù)據(jù)中心和云服務。高校需要有一個高度自動化、可橫向擴展的存儲與計算平臺,綠色數(shù)據(jù)中心(指數(shù)據(jù)機房中的IT系統(tǒng)、制冷、照明和電氣等能取得最大化的能源效率和最小化的環(huán)境影響)支撐著智慧校園各個上層應用。
第四,數(shù)據(jù)處理層。他是智能資助系統(tǒng)的核心,貧困生數(shù)據(jù)傳輸?shù)酱髷?shù)據(jù)中心的各類數(shù)據(jù)庫上存儲起來后,通過各種平臺軟件群進行分析預測,經(jīng)過計算機一系列精密算法,處理生成各種需要的數(shù)據(jù),以可視化的形式展示所需要的信息。
第五,數(shù)據(jù)應用層。他將可視化展示的信息經(jīng)數(shù)據(jù)接口提供給應用層,為資助決策者提供信息的查詢、分類、決策、預警、趨勢判斷等應用服務。
在智能資助大數(shù)據(jù)技術架構基礎上搭建大數(shù)據(jù)計算平臺,以平臺為核心開發(fā)實現(xiàn)數(shù)據(jù)處理各環(huán)節(jié)的多個應用系統(tǒng),通過應用系統(tǒng)和平臺的協(xié)調(diào)運行,實現(xiàn)智能資助。
處理貧困生信息的技術有兩類:一類是定期總結并處理貧困生家庭情況、經(jīng)濟水平、消費水平等數(shù)據(jù)的大批量處理技術,如目前廣泛使用的Hadoop和Spark;另一類是實時處理貧困生監(jiān)控信息的流式數(shù)據(jù)處理技術,如Storm。這三種計算平臺的特點和應用情況如下:
(1)處理海量數(shù)據(jù)的開源分布式技術Hadoop。他是由Apache基金會開發(fā)的分布式系統(tǒng)開源框架,其核心是HDFS和Mapreduce,以高性能、可拓展性強、簡單、高效受大眾關注,是大數(shù)據(jù)處理領域實際上的標準,Hadoop衍生出Common、Aaro、Hiver、Hbase等多個生態(tài)圈項目。目前,該技術普遍應用于電子商務(如淘寶)、金融模擬、文件處理、海量日志分析、廣告投放等領域。Hoodoop是離線批處理平臺,引入SQL高級查詢語言,如PIG和HIVE。他是對關系型數(shù)據(jù)庫的補充,擅長處理結構化數(shù)據(jù),也可以用于處理文本和圖像等沒有固定屬性的非結構化數(shù)據(jù)。在智能資助中,由于采集的貧困生信息大都具有固定屬性、能用關系模型刻畫的結構化數(shù)據(jù),具有非實時性,因此高校大多數(shù)使用Hadoop技術。
(2)處理速度更快的分布式處理系統(tǒng)Spark。他擁有Hadoop Mapreduce的所有優(yōu)點,在用于復雜的迭代算法(如機器學習、圖挖掘算法)和交互式數(shù)據(jù)挖掘算法方面更具優(yōu)勢,其核心是RDD技術。在智能資助中,有些貧困生數(shù)據(jù)可能是通過智能手機終端、SNS等獲得的,而Spark Graphx和Mlib結合使用非常適用于微信、微博、社交網(wǎng)絡、電子商務等智能化數(shù)據(jù)的挖掘。與Hadoop相比,Sparks擁有更快、更通用、更好的容錯性能,迭代運算效率更高,他是以后高校智能資助大數(shù)據(jù)處理技術的運用趨勢。
(3)處理實時數(shù)據(jù)的流計算系統(tǒng)Storm。Storm的核心概念是流,由Nibus、Zookeeper、Supervisor三大組件組成,其特點是流式數(shù)據(jù)和實時計算。該技術被廣泛應用于實時場景如廣告推送、實時監(jiān)控、社交網(wǎng)絡分析、實時交易系統(tǒng)等。Storm技術可以解決某些實時性要求比較高的貧困生信息,如突發(fā)狀況、資助資金使用情況的實時監(jiān)控等,他是今后高校大數(shù)據(jù)處理技術發(fā)展的趨勢。
高校在運行過程中,可選擇采用不同的技術平臺對不同類型資助數(shù)據(jù)進行處理和挖掘。
智能資助大數(shù)據(jù)全流程包括資助數(shù)據(jù)的采集、處理、分析、展示和應用五個關鍵環(huán)節(jié)。具體過程如下:
對貧困生信息進行全方位采集是實現(xiàn)智能資助的基礎。它主要通過傳感器、互聯(lián)網(wǎng)、業(yè)務數(shù)據(jù)表、日常觀察等采集貧困生家庭經(jīng)濟、消費、資助情況、學習、社會活動等方面的數(shù)據(jù),用于判斷貧困生家庭經(jīng)濟情況和成長情況。貧困生信息采集分在線自動采集和線下觀察兩種。自動采集數(shù)據(jù)包括學生基本信息(家庭成員數(shù)、成員健康狀況、家庭收入、家庭經(jīng)濟情況等),學生在校數(shù)據(jù)(食堂消費、超市消費、休閑場所消費、門禁記錄等),困難申請記錄(國家資助次數(shù)與金額、助學貸款次數(shù)與金額、勤工助學次數(shù)與金額等);日常觀察數(shù)據(jù)包括學習表現(xiàn)和生活表現(xiàn)。
數(shù)據(jù)處理是實現(xiàn)智能資助的重要支撐。數(shù)據(jù)處理就是借助數(shù)據(jù)管理和分析工具,對采集的貧困生大數(shù)據(jù)按照數(shù)據(jù)類型進行分類、識別、轉換、計算、檢索,逐步形成描述某一主題的信息集合過程。它包括數(shù)據(jù)清洗、規(guī)范化處理、綜合性處理、數(shù)據(jù)存儲、數(shù)據(jù)交換等步驟。隨著智能校園建設的推進,資助數(shù)據(jù)類型越來越豐富,半結構化和非結構化數(shù)據(jù)所占比重越來越大,這就需要先對資助數(shù)據(jù)進行整合和存儲,以便進行后期數(shù)據(jù)分析。
數(shù)據(jù)分析是實現(xiàn)智能資助的關鍵環(huán)節(jié)。利用商業(yè)智能(business intelligence )、機器學習、數(shù)據(jù)挖掘、預測分析等技術對資助數(shù)據(jù)分析,挖掘貧困生數(shù)據(jù)以實現(xiàn)資助目標。
在智能資助數(shù)據(jù)分析中會運用很多大數(shù)據(jù)挖掘算法模型實現(xiàn)分析目標,如可以利用新型聚類分析算法分析資助績效評估,新型人工智能網(wǎng)絡和決策樹算法分析預測未來貧困生發(fā)展情況,SVM支持向量機精準分類貧困生貧困層次,蒙特卡洛算法認定貧困生資格,深度學習算法識別圖像、語音和人工智能領域的信息。在挖掘方案方面采用基于SPARK的MLbase挖掘工具,自動化分布式挖掘,設計簡單,自動找算法,自己選擇和優(yōu)化,產(chǎn)出最優(yōu)的模型和計算結果。當然也可以采用基于HADOOP的Mahout,實施海量分布式數(shù)據(jù)挖掘,但需要使用者具備機器學習能力,選擇想要的算法和參數(shù)。
該過程是分析出數(shù)據(jù)結果以后,以直觀的方式展現(xiàn)給用戶,以便服務于決策支撐,它是資助大數(shù)據(jù)分析的重要環(huán)節(jié),如何讓復雜的分析結果易于理解是技術解決的重要問題,可視化技術的發(fā)展解決了這一難題。
可視化是用戶可以見到的一種大數(shù)據(jù)表現(xiàn)形式。他將大量復雜的數(shù)據(jù)自動轉化成直觀圖表,能提供多種進行數(shù)據(jù)分析的圖形方法。他能夠反應信息模式、數(shù)據(jù)關聯(lián)或趨勢,幫決策者直觀觀察和分析數(shù)據(jù)。目前,基于2D的圖形圖像展示方式和基于3D的多維展示交互技術發(fā)展迅猛,常見的工具有VISualeyes、Google Trends、Zoomdata等。精準資助認定的結果界面上逐條顯示精準資助認定結果的學生信息,如姓名、學號、年級、學院等。
資助數(shù)據(jù)展示的結果是為了更好地開展應用,如精準認定、優(yōu)化資助策略、動態(tài)管理、預警異常狀態(tài)、指導貧困生成長成才等。不同的應用目標需要不同的數(shù)據(jù)展示圖。當然技術要和人很好地配合,對于技術分析的結果要進行人員二次確認,加強對貧困生的人文關懷,真正實現(xiàn)精準資助和感恩育人的資助目標。
高校在具體技術實施過程中,因師資和資金問題,可采取與企業(yè)合作的形式,利用企業(yè)技術和人才優(yōu)勢,購買企業(yè)提供的教育大數(shù)據(jù)技術產(chǎn)品與服務,如成都尋道科技有限公司精準資助認定系統(tǒng)。從而把有限精力投入到更好地為學生服務中去。
高校在實施智能資助過程中,可以按精準認定—精準資助—動態(tài)調(diào)整—預警機制—人文關懷模式進行,操作如下:
根據(jù)大數(shù)據(jù)分析結果將貧困生貧困情況分等級,評定標準各高校可以根據(jù)自身情況制定。有的高校是根據(jù)家庭經(jīng)濟情況,有的高校是根據(jù)學生在校消費情況,有的高校是根據(jù)統(tǒng)一的貧困生認定指標確定困難指數(shù)。
根據(jù)認定結果發(fā)放獎助項目。高校的獎助項目很多,為了最優(yōu)化資助資源,避免浪費,發(fā)放的基礎是依據(jù)成本理論和教育分擔原則,評估學生家庭經(jīng)濟狀況,學校發(fā)放獎助總金額=年教育成本-(年家庭總收入-年家庭總支出),總金額不高于年教育成本。在實施中,根據(jù)貧困等級,特困獎助最高額為年教育總成本,比較貧困金額為部分學費+年成活費總額,一般貧困獎助最高額為年生活費總額。特困生可以減免學費和給予生活補助。
資助大數(shù)據(jù)管理系統(tǒng)可以記錄學生日常消費和行為,通過數(shù)據(jù)分析調(diào)整貧困等級,對比分析學生困難情況與獲得資助信息情況,評估學生獲得資助是否滿足學習和生活的經(jīng)濟需求,協(xié)助學校及時調(diào)整資助資源,避免資助不足和過度資助。對日常消費的分析要注意時間均衡性,可選取一學期校內(nèi)月消費均值作為調(diào)整貧困等級的參考標準。
大數(shù)據(jù)系統(tǒng)可以預警經(jīng)濟和學習行為波動較大的學生,提醒資助管理者注意。對于預警的學生,資助老師要及時核對情況,對于經(jīng)濟突發(fā)困難的要及時給予補助,對于學習成績下降大的要及時給予指導。
資助管理者要保護貧困生信息安全,尊重學生隱私與自尊心,給學生營造良好的大學校園環(huán)境;心理老師要開展多種形式的貧困生心理輔導、心理咨詢;輔導員和班主任要關心貧困生的日常生活情況,鼓勵他們成長成才;學校要開展多種形式的針對貧困生的技能培訓、實習實訓和勤工儉學,提高他們的就業(yè)能力;就業(yè)部門加強對貧困生就業(yè)推進和指導,使貧困生早日走上工作崗位。
成都電子科技大學(以下簡稱“成電”)應用了尋道科技研發(fā)的“精準資助”系統(tǒng),該系統(tǒng)有線下流程電子化、大數(shù)據(jù)精準認定貧困生以及貧困生動態(tài)管理三大功能[3]。新生報道前,登錄界面進入智能系統(tǒng),點擊學號完善個人信息后進入智能助困系統(tǒng)界面,填寫個人信息,系統(tǒng)將采集新生家庭經(jīng)濟及成員信息、學生本人及受資助信息、學生所在生源地經(jīng)濟水平信息、學生日常消費評價等涵蓋4大類、40余個小類的上千萬條數(shù)據(jù)。通過大數(shù)據(jù)的挖掘與分析,自動生成家庭經(jīng)濟困難新生名單。學生在校期間,收集校內(nèi)消費數(shù)據(jù),如食堂飯卡、超市消費、健身館消費、乘坐校際班車、水卡等,分析學生的消費水平,通過計算機一系列精密的算法,系統(tǒng)判定學生的困難指數(shù)(1~9),困難指數(shù)越高則代表越貧困。學生被分為不困難、一般困難、困難和特困4大類。最終,系統(tǒng)篩選出了200名最需要資助的學生。將此名單與各學院輔導員進行一一核對,反饋挖掘的困難學生名單準確率100%。
系統(tǒng)還可以精準把握不同年級、不同民族、不同類別、不同去向的學生資助需求,實現(xiàn)差異性資助。如針對品學兼優(yōu)的學生組織企業(yè)參觀實習、短期出國交流,針對少數(shù)民族同學設立少數(shù)民族學生獎學金,針對有志于服務西部、選擇基層就業(yè)的學生發(fā)放求職交通補助等。
為了動態(tài)完善受助學生數(shù)據(jù)庫,學校每年寒暑假還將開展“百名輔導員實地走訪經(jīng)濟困難學生家庭”活動。此外,學校也將建立學生網(wǎng)絡征信檔案體系,對學生資助申請材料進行核實,將申請資助過程中的不誠信行為記入學生誠信檔案。
6.2.1采用與企業(yè)合作的形式 成電采用的是尋道科技大數(shù)據(jù)研究所開發(fā)的家庭經(jīng)濟困難學生精準識別系統(tǒng)“智慧助困系統(tǒng)”,公司提供系統(tǒng)維護、功能定制與后續(xù)服務等功能。與企業(yè)合作,高校即避開大數(shù)據(jù)應用人才與管理等方面缺失,又節(jié)約了開發(fā)資金。
6.2.2精準識別與動態(tài)管理 該系統(tǒng)在線全面采集學生數(shù)據(jù),動態(tài)記錄學生消費、行為軌跡,運用大數(shù)據(jù)算法,從多行為軌跡、人脈關系、學生消費、家庭背景、助貸記錄五個維度建立學生經(jīng)濟水平評估模型[4],對比分析學生困難指數(shù)和貸款記錄,評估學生是否需要資助與資助額度,真正實現(xiàn)“資助智能管理,資源利用更加精準”的目標。系統(tǒng)一旦發(fā)現(xiàn)學生經(jīng)濟情況好轉,則停止或減少資助力度;經(jīng)濟情況變差,則增加或加大資助力度。
6.2.3以人為本的資助 成電把資助育人工作貫穿學生成才全過程,注重學生心理健康成長。入學前建立聯(lián)系,介紹資助政策,提供來校路費;在校期間實施一對一幫扶、實地走訪、差異性資助,注重提升學生就業(yè)能力;畢業(yè)后持續(xù)關注基層就業(yè)、服兵役等后續(xù)資助,真正做到“讓每一個貧困生都活得精彩”的目標。
精準資助和育人教育是今后我國學生資助工作的兩大目標。大數(shù)據(jù)技術可以很好地解決貧困大學生認定、資助、管理以及社會資源的收集、分配、監(jiān)督等問題,為助力貧困生成長成才提供可靠的幫助。
[1] 趙勇.大數(shù)據(jù)革命:理論、技術和創(chuàng)新模式[M].北京:電子工業(yè)出版社,2014:3.
[2] 中國教育報.全面深化綜合改革全面加強依法治教加快推進教育現(xiàn)代化:袁貴仁部長在2015年全國教育工作會議上的講話[EB/OL].(2015-01-22)[2017-08-21]. http://old.moe.gov.cn//publicfiles/business/htmlfiles/moe/moe_176/201502/183984.html.
[3] 中國教育資訊網(wǎng).創(chuàng)新新生扶貧 “精準資助”系統(tǒng)獲央視點贊[EB/OL]. (2016-09-19)[ 2017-08-21][EB/OL].http://learning.sohu.com/20160919/n4686925-11.shtml.
[4] 成都尋到科技有限公司.尋到科技精準扶貧[EB/OL].(2016-12-11)[ 2017-08-21] http://www.xdbigdata.com/public/template/helpDetail.html.