馮永鵬,張云婷
(1.江南大學,江蘇 無錫214222;2.無錫商業職業技術學院,江蘇 無錫214222)
教育部在2022年工作要點中提出,要加強精準資助,推進資助育人,全面落實各項學生資助政策[1]。大數據提高了精準資助的靶向精準度與資助內容的被瞄準率,使資助工作從“經驗主義”走向“數據主義”,大數據帶給我們方便的同時,仍然還有很多深層次問題需要面對。一方面,作為建立在海量數據支撐基礎上的思維方式,這些海量數據所反映的客體真實性如何?另一方面,如何在符合法律法規的基礎上更加全面、完整和系統地掌握數據?這些問題在文中詳細探討。
大數據因人而生,由人發展,為人所用,具有鮮明的意識形態屬性。大數據時代開啟了一場新的時代變革,人們對于大數據的基本態度以及從多方視角看到大數據釋放出的潛在價值的態度,正是我們認識這個問題的關鍵。大數據在貧困生精準資助過程中具有巨大技術優勢,是化解“供與需”矛盾,消除“泛與散”現象的有效手段,有助于推動高職院校貧困生精準資助工作的科學開展。
大數據能夠通過采集、處理和分析學生數據信息,以有效的信息技術手段和計算方法,發現和提取學生信息數據的價值,實現精準識別。一是大數據的信息采集功能。在遵守相應程序且非用作其他教育目的的情況下,大數據可以通過技術優勢采集學生所在生源地經濟水平信息、學生家庭經濟及成員信息、學生日常生活消費數據、學生本人及受資助信息、學生勤工儉學信息、學生社交特征以及行為軌跡等信息,為確定資助名單提供可靠依據,提高靶向瞄準的精準度,防止片面依賴經驗決策或因經驗不足難以決策等情況發生。二是大數據的分析功能。一方面,大數據能夠在采集學生基本信息的基礎上,依靠尋找數據尺度算法和降低復雜度,全程記錄貧困學生的在校需求情況、受助情況軌跡與校園活動軌跡,做到深度分析與及時反饋,從動態上把握重點特殊困難群體并有針對性地進行資助幫扶,進行個性化資助策略調整。另一方面,大數據可以對受助學生從進校到畢業進行全過程、全方位和全立體的數據分析,對受助群體及個體的思想和行為特征進行多維度的描述,從而立體式地還原受助學生數字化生活的真實狀態,從而為學生成長提供幫助。此外,大數據還可以根據受助學生的個人數據信息建立需求模型,觀察不同學生的行為特征和群體特征的差異性,在一個數據庫中找到普遍聯系,然后對適用于這種普遍聯系的個人深入勘察,幫助我們規避“畫像”缺陷。
大數據可以完善精準資助服務發展支持體系,提供以智能化、信息化為主導的精準篩查對接資助服務,真正實現資助工作的科學化和精準化。一是大數據的支持功能。大數據以信息化平臺為基礎,以互聯網大數據管理為保障,以精細化管理為手段,提高資助和受助數據共享、集成與支持功能,通過分析學生學期和學年消費金額和消費形式,獲取、處理和分析消費數據,以有效的信息技術手段和計算方法,發現和提取受助信息數據的價值,形成數據共享、集成與分析模型,為高職院校精準資助工作提供高附加值的應用和支持,促使了高職院校精準資助工作的創新化與深度化。同時,大數據可以實現受助學生信息采集、跟蹤管理、信息更新全方位全節點的資助數據可視化。二是大數據的篩查功能。大數據技術可以對受助學生生活和心理狀況進行詳細篩查,并用程序科學檢測學生校園卡消費、學費銀行卡收支、學生貸款記錄等情況,做到每學期對數據庫進行更新,通過細致的情況統計和優化數據統計方法,篩除不能反映真實情況的“壞數據”,保留“好數據”,形成科學量化評估指標體系,進而最終確定受助學生名單,保證實現每一位家庭經濟困難學生“應助盡助”,確保資助力度真正符合學生實際所需。
為進一步證實大數據技術在高職院校貧困生精準資助中的可行性,本研究采用隨機森林模型算法對江蘇省無錫市五所高職院校10000份采樣數據進行分析。隨機森林算法是監督學習算法,它利用在森林里創建的多個決策樹解決分類和回歸問題[2]。隨機森林算法一大優點是可以科學地測量出每個特征對分類結果的相對重要性,用該算法進行特征重要性評估的核心思想是通過查看每個特征在森林里的每顆樹上做了多少貢獻,最后取一個平均值,得到各特征的相對重要性程度,從而為高職院校貧困生精準資助提供科學化參考。總體來看,隨機森林模型在特征篩選上的客觀表現和科學體現也是使用其進行數據分析的重要原因。
本研究設定8個閾值,以貧困類別為標簽,利用隨機森林算法對10000份采樣數據中的學生日常消費數據進行分析,得到特征重要性評估圖(見圖1)。選擇學生日常消費數據作為主要分析對象,是因為學生日常一卡通消費情況能夠更加直觀地反映出學生的消費行為規律、消費行為以及真實的消費水平。首先,對10000份學生一卡通消費產生的數據獲取、處理,對一卡通消費情況進行適時動態分析,發現學生一卡通通過關聯性因素挖掘分析,獲得有效數據,從食堂消費次數、次均消費金額、超市消費數據、衣物消費數據、電子產品消費數據、生活費來源以及其他額外消費數據等多個維度建立貧困學生精準識別統計模型,通過反復迭代的方式確定模型中各參數的具體權重,并根據綜合得分情況劃分貧困學生與貧困等級。

圖1 高職院校貧困生認定影響因素重要性評估
根據數據分析結果(圖1)可以看出,學生利用一卡通在食堂每次的均消費、每月的衣物消費、在食堂吃飯的次數、在超市的消費金額以及在眾多影響因素中占比最高。把這四個影響因素作為主要觀測點,觀察特別貧困學生、比較貧困學生、一般貧困學生及非貧困學生在其影響因素下的消費情況,對比四個類別學生的消費情況反映出的消費差異。分析發現,特別貧困學生、比較貧困學生、一般貧困學生及非貧困學生在食堂吃飯的占比逐級遞減,每次在食堂的均消費、每月超市的消費和每月的衣物消費都逐級遞增(圖2)。由此得知,貧困學生比非貧困學生更習慣在食堂用餐,且均消費也要低于非貧困學生,額外消費也較少,這與現實情況比較相符,也印證了所采集數據的真實可信。

圖2 四個類別學生的消費情況
為了更加直觀地觀察貧困生和非貧困生之間的消費差異,對四個類別學生的食堂均消費、超市均消費及衣物均消費數據進一步分析,發現:特別貧困學生均最低,非貧困學生均最高。上述數據進一步證實了,食堂均消費情況、超市均消費情況、衣物均消費情況三個數據能夠更加直觀地反映出不同等級類別的貧困學生的真實消費情況(圖3),為精準認定貧困學生、科學劃分貧困等級提供了有價值參考。

圖3 各類別學生消費對比
運用隨機森林算法可以根據學生的不同類別消費數據自動分析并等級評價,科學劃分相應貧困等級。如若發現已經認定為貧困生的學生出現高消費情況,可以及時進行教育引導,而對于系統數據評價非困難低消費學生,可以通過線上與線下相結合的方式,讓隱形貧困和臨時性貧困的學生能夠得到及時的資助。無論學生消費行為預警引導還是學生動態關懷,其認定性將會更加精準。隨著后期學生網絡消費、網絡支付等“線上一卡通”學生消費數據的接入,大數據會更加完整,并根據數據自動迭代、深度學習,從而真正實現學生精準資助的智能化、科學化。
在科學把握新時代資助工作深刻變革的背景下,運用大數據有助于真正實現高職院校精準資助工作的“供給側改革”。
在大數據背景下,須站在戰略高度,看到高職院校精準資助工作的新思路新方向,找準著力點,朝著問題去,使大數據在高職院校精準資助工作領域得到快速推廣與應用。一是樹立大數據理念,學會“讓數據說話”。隨著人工智能和大數據的快速發展,迫使高職院校學生資助部門需建立起以“數據說話”為核心的定量決策思維,根據大數據的時間長度與空間廣度分析,使資助工作主客體對相互之間思想和行為變化及特征的把握更加真實、全面,既能從變化的數據中尋找因果關系,又能從系統的數據中尋找關聯要素。二是整合數據資源,提升認定精準度。進一步整合家庭經濟困難學生數據資源,將全國學生資助管理信息系統與民政、扶貧、殘聯等部門有關信息系統對接,對基礎信息進行共享和比對,加強資助數據的獲取、篩選、整理、組織、分析和決策,確保貧困學子等信息全部納入“貧困生”數據庫,同時確保信息真實有效。三是建立聯動機制,形成工作合力。大數據使用的關鍵點在于數據能否互通,倘若數據無法互通,那么分析得出的結論就相差甚遠。這告訴我們,運用大數據來處理海量信息,對信息處理的要求更高,信息的采集、存儲、處理和分析各個環節更需要各部門間建立資源共享、協作攻關的動態合作機制,切實加強部門間的工作協同,科學利用大數據進行信息整合,打造精準資助工作“一盤棋”格局,否則,大數據戰略只能是一盤散沙。四是強化育人理念,將精準資助與立德樹人有機結合。精準資助更深層次的理念是資助過程中是否實現了育人效果。當前,運用大數據進行精準資助的理念正逐漸普及,在資助認定上大數據可以做到精準的經濟資助,但這只是資助育人的初級階段,如何做到資助與育人并重,把“立德樹人”根本任務融入學生資助工作全過程,實現從“輸血”變為“造血”才是重中之重。一方面,在資助方式上由過去的保障型資助向發展型資助轉變,強化有償資助,培育受助學生的感恩與自強意識;另一方面在資助內容上加強受助學生心理適應資助、能力培養資助、就業指導資助與創新創業資助。譬如,探索設立專項基金資助家庭經濟困難大學生海外游學工作項目,不僅可以拓展貧困學生國際視野,也可以增長見識、提升能力與完善人格,切實發揮資助育人功效。
一是實現資助對象識別指標化。運用大數據平臺科學采集學生生源地經濟水平信息、學生家庭信息、學生受助信息、學生日常消費信息四類基本數據,并結合學生的勤工助學、志愿服務、社會實踐、家教軌跡、獲獎情況、借閱興趣、社交特征等多個維度進行綜合數據分析挖掘,將數據進行整合與處理,構建個性化指數模型,系統判定學生的困難指數與資助等級。二是實現數據對接、聯通與共享。目前,多數學校借助自身專業優勢建立大數據平臺,運用大數據平臺將各部門實時數據進行打通,使數據可以實現更大規模的關聯計算,進而實現數據驅動業務,為實施“智慧資助”提供了有效的數據支撐,實現用數據跑腿、用數據打假,做到由“粗放”與“漫灌”向“精細”與“精準”轉變,真正實現“點助”。三是實現線上與線下良性互動。注重整合數據資源,打破原來的數據孤島模式,建立一個更加科學、有效的數據管理平臺。探索運用大數據平臺對資助數據進行專業化處理,為科學精準認定提供基礎,從而更好地提升高職院校精準資助工作效率和質量。大數據平臺以嚴謹的評判標準,線上采集“客觀數據”,分析校園卡和其他消費數據,線下結合學生在校表現的“主觀數據”,運用大數據算法努力在資助公平和學生尊嚴之間找到平衡,既凸顯了“人性化”主體價值和數據的本真意義,又打破了原先資助資源“一刀切”的分配模式。譬如,南京某職業院校建立了集貧困學生認定、學生校園消費行為動態分析、學生消費行為預警與引導、學生動態關懷、線上線下有機融合為一體的學生精準資助管理系統。平臺依據學生線上申報、班主任線上審核,采用權重記分方式對學生的消費數據自動分析和等級評價,如果發現貧困學生存在高消費行為,系統將進行預警,系統還將對學生群體中非困難低消費學生進行提醒,通過班主任線下的及時核實和反饋,進行選擇性資助。
對于大數據技術,學界一貫的觀點是大數據技術是人文的,大數據技術終歸是為人性服務,脫離了人性的技術,也就無所謂應用和其他價值。一是堅持工具評價與價值評價相結合。對于大數據而言,無論它是如何的智能,面對技術的發展,我們仍需回歸到理性中來,若執著于某種工具,我們可能會失去看問題的多元視角。大數據根據數據采集、挖掘和分析做出準確預判,克服基于經驗或直覺所產生的推斷缺陷,但同時也要避免過度依賴數據,因為大數據為我們提供的只是參考答案,而不是最終答案,大數據的“碎片化”“模糊化”會導致人們難以系統認知復雜事物,需理性認知、認清大數據。畢竟資助工作的目標是育人,是培養受助學生實踐能力、創新精神和社會責任感的重要方式,數據只是起到了輔助作用,工具評價終究要服務于價值評價[3]。二是建立科學有效的評價體系。首先,構建科學的工具評價指標體系,通過大數據比對、分析等評價手段,建立“全局一把尺子”貧困生識別認定機制,健全“數據采集、數據運用、數據監管”三維程序,實現民政、學校等部門數據庫的全方位對接,提供以智能化、信息化為主導的精準對接資助服務。其次,結合工具評價和價值分析,通過價值評價修正工具評價結果,從而更加全面、準確地了解受助學生的實際情況。再次,重點考慮“客觀數據”與“主觀數據”所扮演的角色,也就是說當數據說話時會發生什么,是否有利于推動我們的工作,唯有將“客觀數據”與“主觀數據”結合,并融會貫通,而不單純只是為了“數據”而“數據”,大數據才會變成強大的工作武器。三是堅持定期審核與動態調整相結合。采用定期審核與動態調整的認定方式,能夠做到資助對象指標明晰,認定資助對象更加精準,避免了“唯大數據論”。建立學期審核制度,一方面通過班主任、輔導員長期觀察與寒暑期實地走訪等途徑及時了解掌握學生基本情況;另一方面通過合理且不侵犯學生隱私的方式收集學生的校園超市消費數據、助學貸款數據、學費欠費數據、校園公交使用數據、電子產品消費數據等信息,復核家庭經濟困難學生資格,對于不符合情況定期更新與調整家庭經濟困難學生數據庫,努力做到人本化認定、動態化認定與精準化認定[4]。
提高數據安全保護意識,確保信息安全是用好數據的前提。一是健全學生資助信息安全管理機制。首先,規范學生資助信息系統的使用權限與范圍,科學與嚴謹公開各類學生受助詳細信息,落實信息安全宣傳教育,強化數據各階段使用保護。在資助數據使用階段,運用互聯網技術對數據進行智能分類,通過對敏感數據進行特別標識與脫敏處理或者“差別隱私”,將數據信息模糊處理,促使大數據庫的查詢不能現實精確的結果,而只是相近的結果,防止信息泄露;在資助數據公示階段,對數據異常調用行為進行實時監測,并制定統一、完整的資助信息管理規范體系[5]。二是創新信息安全保障技術手段。高職院校在推進大數據建設和充分發揮大數據固有價值的同時,必須堅持隱私安全與保護并重的方針。針對當前可能面臨的數據安全與隱私保護等信息安全問題,需進一步探尋最新安全保障技術手段,強化學生資助信息終端設備及網絡環境安全管理,創新統一身份認證登陸、加快信息安全基礎設施建設,以保障信息化數據安全,切實解決數據安全和個人信息保護問題。三是提升數據安全防控機制。大數據的使用安全風險主要體現在“采集、存儲、使用、公示”四個環節,貧困生數據具有內容豐富與特征明顯兩個特點,即通過關聯信息和大數據算法,貧困學生的興趣愛好、學習能力、性格特征、消費水平等深層個人特征可以被推算出來。因此,高職院校要強化數據采集、存儲、使用與公示過程中的保護措施,使得學生的個人信息得到安全保障,避免引發二次利用。四是提升管理人員信息安全防范意識。不斷強化資助管理人員對于受助群體的數據信息安全保護意識,在數據采集、使用與公示的過程中,防止泄露學生個人信息與隱私,不斷提升大數據精準資助工作安全化、標準化和信息化水平[6]。
總體來看,在大數據背景下,不再是“一把鑰匙開一把鎖”,而是“一把鑰匙可以開不同的鎖,而同一把鎖也可由不同的鑰匙來開”。利用大數據開展高職院校貧困生精準認定工作,有利于實現資源配置的精準化,有利于資助管理決策的科學化,有利于在資助公平和學生尊嚴之間找到了平衡,既充滿人性,又精準高效。可以說大數據技術與高職院校精準資助工作的深度融合有助于引發“資助生態”的再平衡。