章喻鑫 吳開龍 王榮遠 李志強 成陽


摘要:目前,高校貧困生資助體系雖然已經建立,但貧困生的判定存在著短板和不足。高校一卡通內存在著大量寶貴的潛在數據,通過SQL Server數據庫和Excel的結合,可以從高校一卡通里探尋有價值的數據信息,幫助評定潛在貧困生的程序更加完善。該文為學校管理人員提供一種可靠的數據分析途徑。
關鍵詞:高校一卡通;SQL Server數據庫;Excel;貧困生;數據分析
中圖分類號:TP392? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)04-0037-02
Abstract:Although the funding system for poor students in colleges and universities has been established, there are shortcomings and deficiencies in the determination of poor students. There are a lot of valuable potential data in the college card. Through the combination of SQL server database and Excel, valuable data can be explored from the college card, and the process of evaluating potential poor students can be improved. This article provides a reliable way of data analysis for school administrators.
Key words: the college card; SQL server database; Excel; poor students; data analysis
1 引言
作為高校必備的學生信息管理和消費的載體,一卡通系統是十分重要的。隨著信息化的不斷發展,大學校園數字化、網絡化是不可阻擋的潮流趨勢。高校一卡通被視為數字化校園建設的主要工程,實現了三大主要功能,作用于校園內的每個角落。目前來看,高校一卡通主要提供交易、信息管理、身份識別等三大功能[1]。其中交易代表了學生在校園內的主要消費,能夠反映學生在校生活期間的總體消費情況。因此可以借助一卡通內的消費數據,進行分析學生的經濟狀況,從而可以起到輔助判定貧困生的目的。
高校一卡通內的數據會因校內活動變得異常復雜,如果高校在初建一卡通平臺時未考慮后續數字化網絡化的發展,沒有特定的去優化一卡通系統,就會導致其中數據的雜亂無章,從而增加了數據處理的難度。一般來說,消費數據項目越多,越能精確的體現學生的消費水平和家庭狀況,日常使用校園卡的頻率越高,也就越能說明學生的消費主要是在校園內進行。這對于學校高層人員判定學生經濟情況有極好的借鑒作用,為決策人員實施決策提供必要的事實依據[2],因此高校一卡通的數據的高效利用是非常有價值的。
2 搭建一卡通數據分析框架和流程
高校一卡通內數據經過簡單分析處理,主要分成兩大類,分別是交易數據類和行為數據類,其中交易數據類主要分為學校各食堂、校園內超市、洗浴、復印店以及圖書館書籍超期等消費信息,行為數據類型包含校園內的各種行動軌跡和宿舍等地點門禁信息。
在高校一卡通系統中,消費數據是有明顯特征的,其大部分數據儲以記錄的方式存儲于數據庫中,我們將其按照學生卡號和消費的編號、時間、金額等數據重新組織記錄,準備放入構建的數據倉庫中。經過對數據進行抽取、轉換、加載等相關處理,在構建好的數據倉庫中,我們可以進一步地對消費數據進行分析。把與消費相關的(如時間、用戶、金額和消費類型等)作為不同的維度來衡量學生的狀況。在這里,我們將其分為四個表,分別為時間表,消費表,一卡通表和商戶表。時間表中包含年、季度、月、日以及時間編號;消費表分為消費類型、商戶編號、卡ID號、消費金額以及時間編號;一卡通表包括卡ID、持卡人的個人信息以及卡內余額;商戶表分為商戶序號、商戶種別和其他詳細信息。其中主要操作是對數據類型和缺失值的處理,可以將其分為兩大獨立的部分進行,數據類型歸為一類,數據類型的不同可以轉換為統一類型。缺失值歸為另一類,針對缺失金額部分可采取平均值填入的方法。
本次實驗采取模擬某高校的大量流水數據,通過抽樣的方法,對其在有規律的一段時間內的數據抽取出,利用SQL Server的DTS方式把我們需要分析的數據導入到目標數據庫中,DTS的用途是可以從不同的源將數據抽取、轉換和整理到理想的目標位置[3]。用戶可以通過DTS工具很容易地創建適合于特定的自定義移動解決方法。我們利用這些數據建立一個以消費為事例的數據倉庫,通過該數據倉庫,可以了解到我們處理的數據信息。在這里,我們以學生的消費具體時間段、不同學段的學生消費頻率等內容進行分層次的分析。在得到的數據基礎上可以利用OLAP Services建立數據立方體。步驟如下:(1)建立主量:利用Dimension Wizard選擇時間表,建立時間維度;選擇消費表,建立消費維度;選擇商戶表,建立商戶維度[4];選擇一卡通表,建立個人信息維度;(2)構建數據體:在OLAP菜單管理器上選擇Cubes文件夾新建Cube向導。選擇消費事實數據庫中的消費表,該表里是學生的消費信息。在立方體測量時,應選消費金額;最后完成該立方體的構建;(3)通過引導創建MOLAP存儲類型的集合[3]。MOLAP可以把OLAP分析的多維度的屬性值將數據從物理層面上存儲為高維數組的形式,形成立體的結構。維的數據屬性值和多維數組的下標值或下標的范圍形成相互對應的關系,總數據屬性值變成多維數組的屬性值,可以存儲在數組中。
在此構建完成后利用Excel進行分析,我們可以選擇菜單欄中的新建數據庫查詢選項,再次選擇OLAP多維數據集中的新數據源目標,并為訪問的數據庫選擇一個OLAP供應者中選擇OLE OB for OLAP,按提示步驟完成對消費事實數據庫的選擇。
將立方體的數據調入Excel中,數據分析工作可以在此完成。通過加載Excel里的數據分析工具庫選項,選擇合適的分析工具庫和規劃求解加載項,數據分析中還有直方圖、回歸、抽樣、描述統計、傅里葉分析等工具可以實現數據的不同角度的利用。我們還可以直接通過已經處理好的數據建立數據透視表,利用不同形式的圖形進行簡單直接的觀察,得出我們所需要的結論。以下為我們實際操作中的部分數據直觀圖和數據表的處理。
在此,我們可以根據其學生總體消費水平的高低判斷學生的貧困程度。以單位學年類同等水平的學生消費為基準,找出低于此水平的學生人群,即可判斷為潛在貧困生。具體有如下特點:
(1)潛在貧困生每次消費的金額平均較少。
(2)潛在貧困生每日消費的金額比較少,并且刷卡消費的頻率相對來說穩定。
(3)潛在貧困生消費的總金額在同一學年中相對較少。
(4)潛在貧困生使用高校一卡通交易的頻率比較高。
基于此,從Excel中可以得到吻合上述特征的學生,甚至還可以通過調節立方體中粒度的大小,以便于實際的貧困生判定情況更加吻合,從而選出潛在貧困生。
3 結語
本文主要簡單介紹了如何利用SQL Server和Excel配合構建分析框架,對高校一卡通里數據結果進行分析。關鍵點在于對一卡通內消費數據的界限的確定,在界限明顯情況下,界限之下即為潛在貧困生的消費水平,同時也能夠確定學生消費狀況,其結果不僅夠使學校為潛在貧困生提供更精準化的管理和補助金的發放,還能能夠為輔導員輔助決策[5]、優化校園卡管理等提供了有力的數據支撐框架。在此建立和分析的過程中發現SQL Server和Excel能夠處理高校一卡通內學生數據,但效率方面不夠高,還需要根據事實確定合適的維度和粒度,可視化程度還欠缺,這也是將來應該改進的地方之一。
參考文獻:
[1] 李志國,張彬,范佳偉.智慧校園一卡通數據的分析及利用[J].信息與電腦(理論版),2019(4):3-4.
[2] 丁蓉,孫曉輝,李智勇.基于校園一卡通的高校貧困生消費行為分析[J].電子測試,2016(18):78-79+99.
[3] 田永青,陳衛華,朱仲英.基于SQL Server的數據倉庫的建立和分析[J].電子技術,2001(8):35-38.
[4] 丁潔,賈應煒,蘇興龍,郇林.校園一卡通數據挖掘分析設計與應用[J].自動化技術與應用,2020,39(2):132-137.
[5] 周皞,萬里亞.基于校園卡數據挖掘的高校貧困生輔助判別研究[J].職教通訊,2012(35):59-61.
【通聯編輯:王力】