商瑤(太原理工大學軟件學院、太原理工大學現代科技學院)
傳統高校農村貧困生識別都是人工統計、手工操作再進行篩選,難免出現統計誤差和人為因素干預,而本文采用深度學習算法對高校農村貧困生進行精準識別,構建高校農村貧困生資助評定系統,進而簡化高校農村貧困生評定工作,提高了準確率和效率,減少了師生之間的不必要摩擦,促進智能高校校園建設。
本文將以現場實驗的方法,對深度學習的神經網絡系統的功能性進行深入挖掘,以驗證深度學習在農作物病蟲害識別中的實際應用效果。該實驗中操作系統的配置參數為:Ubuntu-Linux 16.04 64 位,VSCode-win32-x64-1.30,OpenVINOTM。 計算機的中央處理器采用英特爾凌動TMX5-Z8350 處理器,硬件開發板的配置參數為4GB DDR3L RAM 和64GBeMMCUP Board,數量為一塊;英特爾神經計算棒二代一個,內存條選用IntelCore(TM)i5-5200UCPU@2.20GHz/4G,固態盤的容量大小為128G,筆記本電腦一臺,免驅動攝像頭一個。而該操作系統的軟件環境則由Python3 語言環境、Caffe 深度學習框架、ps6 繪圖軟件以及OpenVINOTM 開發工具箱組成。
該系統在啟動后,操作終端的默認運行環境為python,而pip 執行命令主要借助于Caffe 所依賴的包,主要涵蓋pandas、glob2、numpy 等,并利用pip 執行命令來安裝caffe。在互聯網運行環境下,操作人員可以操作終端界面通過解壓縮的形式來下載tarball,將配套的組件安裝在運行系統當中。然后開始配置神經計算棒的驅動程序,如果系統在正常運行狀態下,操作終端出現demo completed successfully 的字樣時,則可以確定神經計算棒的開發運行環境的構成條件已經達成,接下來對系統的運行過程進行細致分析[1]。(一)打開神經計算棒的句柄
如果系統具備較強的學習功能,首先需要確定神經計算棒的準確位置,這時,系統程序員利用編制好的程序在系統當中探尋神經計算棒的位置,在這一過程中,如果操作終端持續不斷的提示神經計算棒未找到的字樣或者聲效,操作人員應當及時檢查系統的配置情況是否符合深度學習模型構建的要求,同時,對系統連接狀態進行認真校驗,當確認連接無誤后,能夠快速確定神經計算棒所處的位置,這時,操作人員可以打開神經計算棒的句柄,隨即進入下一道操作工序。
(二)數據預處理
當神經計算棒的句柄打開以后,操作人員將需要識別的人員信息等基本情況導入緩沖區,被處理對象通過神經計算棒的推理運算功能而形成一個統一排序的列表,系統根據字母排序創建運行目錄,進而對需要導入系統內的圖像進行預處理,經過處理后的數據不占用內存空間,而且數據的大小可以隨時進行調整,借助于計算機的平均減法等算法對相關數據進行處理和運算。
(三)執行結果推斷與打印
執行結果的推斷與打印是深度學習的最后一個處理階段,首先被處理后的數據信息被轉變成為半精度的浮點數,此時,英特爾神經計算棒能夠根據浮點數及時獲取準確的數據結果,然后進入到打印程序,當分析結果打印完畢,操作人員應當制裁桌面圖標,并使系統保持在關機狀態。
(一)流程圖
高校農村貧困生精準識別的流程如圖1 所示。對貧困等級精準識別并建立評定的數據模型主要包含:
(1)從校園一卡通、學生信息、學校教務等系統中依據專業和年級對學生信息進行提取,并將提取的數據作為原始的數據。
(2)整體分析所提取的數據,剔除與高校農村貧困生等級精準識別的無關屬性列。
(3)對優化的提取數據進行前期預處理,包括提煉數據源中的重要文本信息、異常和缺失值的分析處理、冗余屬性統一以及處理規范化等。
(4)數據處理后,建立貧困等級精準識別及評定的模型,對構建的模型進行模型訓練及評價分析。
(5)對上面形成的模型結果對比并進行深入優化。
(6)調用高校農村貧困等級精準識別及評定模型,動態實時測評高校農村貧困生基本情況。
(二)數據選取方法
為了滿足高校農村貧困生精準識別及資助的需求,從以下幾個方面進行數據選取。
首先,貧困生家庭貧困情況是高校農村貧困生識別的重要依據。目前全國各地區仍然具有不平衡的經濟水平,東部沿海地區仍然高與中西部地區,特別是長江三角洲和珠江三角洲地區,家庭年收入遠高于其他地區,家庭的整體經濟水平良好,因此地區的經濟水平高低是高校農村貧困生識別和認定中的核心指標。其次,消費行為是高校農村貧困生識別的又一標準,家庭貧困程度的高低直接影響消費能力的好壞,也就是說貧困家庭的學生消費能力也差,限制其日常的消費。因此校園一卡通中消費記錄功能可以很好的反映學生消費情況,為貧困評定提供有力支撐,所以將交易的地點金額類型作為高校農村貧困識別和認定的第二指標。最后,農村貧困生的傳統認定方式僅僅改善貧困生的經濟情況,并未考察貧困生德育方面,一些貧困生會因此有怠惰行為,理所當然享受國家的貧困資助政策,更有嚴重不珍惜此類的教育機會,對資助金進行肆意揮霍,最終肄業在家。因此第三個貧困識別和認定指標就是德育方面。因此將補考情況、課程成績、學分比重、出勤率、圖書借閱等數據表明貧困生的具體學習情況。
(三)數據分析
作為深度學習的一個重要步驟,數據分析是預處理的前奏,也是對數據進行挖掘從而獲得準確有效結論的基礎。其主要包含缺失值、不一致、異常值這三個方面來核查抽取數據是否有臟數據。
1.缺失值分析
數據的缺失主要有這幾種情況,首先是記錄的缺失,其次是缺失記錄重要文字信息,這兩種數據缺失的情況,嚴重影響結果分析的正確性。數據缺失值的產生有兩個原因:首先,提取準確信息很繁瑣或者無法及時提取信息,比如貧困生相關上網信息;其次,信息輸入時由于人為因素、非人為因素(數據采集設備或者存儲介質故障)等等而丟失,比如入學初學生自己填寫自己的個人信息情況,就有可能漏填或者不清楚具體信息而空白不填情形,出現部分值的缺失。
2.異常值分析
異常值分析的重要目的是檢驗數據,對錄入錯誤和不符常理情況是否存在進行判斷,異常值的分析和剔除可以更好地優化模型。通吃情況下只有個別值屬于異常值,異常值分析方法一般有簡單統計計量和箱型圖分析兩種。
3.一致性分析
一致性分析的重要目的是數據準確性的確保,降低數據的不相容及矛盾的產生問題,導致違背實際的后果。主要是在集成過程中產生的數據不一致,原因主要是提取數據的數據源不同,或者數據格式單位類型不同等,在下一次數據存放時未更新數據的一致性。
通過上述實驗可以看出,目前,利用卷積神經網絡構建的深度學習模型已經日漸成熟,完全可以在高校農村貧困生的精準識別當中推廣應用。但是,在實際應用過程中,也暴露出一些亟待解決的問題,比如系統硬件的選擇與配置極易對學習效率產生負面影響,因此,技術人員應當不斷對卷積神經網絡系統進行升級改造,以提升高校農村貧困生的識別精度,提高貧困資助的準確率和效率,簡化貧困資助程序,為高校農村貧困生精準資助提供強大的技術保障。