徐亮
(浙江建設職業技術學院教育技術中心,浙江杭州 311215)
當前,教育信息化已進入2.0時代,高校基本上都已建成了數字校園三大基礎平臺,集成了OA、人事、教務、學工、科研、一卡通等多個業務系統,數據規模逐漸擴大。隨著高?!白疃嗯芤淮巍备母锛爸腔坌@建設工作的逐漸深入,高校各項業務的開展對數據的依賴也逐日增長,基于數據的業務協同化、服務個性化、分析交叉化、決策科學化等新需求不斷涌現。然而這些新需求的推進卻舉步維艱,無法實現或者實現效果遠不如預期,用戶不滿意,最終這些尖銳的矛盾都指向了數據,暴露出了當下大部分高校在數據方面存在的一些共性痛點、堵點問題。這些問題阻礙了數據在智慧校園中發揮更大的作用,制約了高校的信息化管理及教學水平的提升。如何提高數據質量進而為師生提供更有效的數據服務,是下一階段高校教育信息化發展的方向[1]。因此,對高校數據存在的問題進行剖析并提出對策有十分重要的意義。
高校的信息化建設開始于20世界80年代,前期主要關注校園網絡建設,以及各行政部門、教輔部門、教學院系各自建設業務系統,缺少統一的頂層設計,沒有采用適合高校的數據通用規范,對一些數據錄入頁面沒有進行規范化約束,簡單采用大量文本框來錄入數據,導致各業務系統的數據標準不統一。同時,部分業務系統在日常運行維護過程中,使用人員數據錄入不規范,在客觀上造成了數據孤島。例如教學秘書在教務系統排課時,因掌握的教師信息不全,特別是外聘教師,常用外聘1、外聘2等代號代替教師真實姓名,一直到學期結束,教務系統中也仍然在使用這些代號。
由于是各行政部門、教輔部門、教學院系各自建設的業務系統,各部門管理的范圍不一樣,導致各業務系統間的一些統計數值也不一致。例如,由于計算規則各業務部門自行定義,導致同一年級的在校學生總數在迎新系統、學工系統和教務系統中的統計數值不統一,客觀上形成了各業務系統間數據打架的現象;另外還存在著一個學生或教職工在身份變化后有多個學號或教工號的情形,影響了學生和教職工點人頭的準確性。
由于大部分高校前期開始信息化建設時缺少統一的頂層設計,各業務系統建設主要以實現功能為主,對一些非主數據的錄入沒有進行強制性約束,使得業務系統產生的數據不完整,大量數據缺失,導致數據分析缺少科學性,不利于決策判斷。
雖然高校已建有大量的業務系統,但仍存在部分業務系統缺口,導致高校在日常管理過程中產生的一些業務數據無業務系統錄入,隨著時間推移,很多數據就會丟失。例如當審計部門需要審計高校公車使用情況時,很多高校才突然發現公車使用數據沒有留存,或數據有零散保存,但由于人事變動,記錄很難齊全。
在高校實際工作中,往往存在跨部門的數據共享交換及溝通管理機制不健全,產生數據的部門認為別的業務部門用不到這些數據,需要數據的部門認為別的業務部門不會產生自己需要的數據。例如,教務處在對實訓部門的實訓室進行排課或考試等安排時,并不能提供出完整有效的實訓室使用信息,導致實訓室使用產生爭議。另外,有的業務部門在建設業務系統時只考慮本部門的需求,不去了解其他業務部門已有數據和需要本部門提供數據的情況,造成重復建設或無效建設,甚至建設的業務系統游離在學校總體規范之外,不將可開放共享的數據進行共享,也不從學校數據中心獲取數據,建設數據封閉的系統,形成新的數據孤島。
一些管理人員往往習慣于excel管理各類數據,存在業務系統數據更新不及時或共享不及時的情況,導致開放給其他業務系統的數據存在滯后的情形。另外,傳統技術如ODI(Oracle Data Integrator)數據交換工具雖然支持多種異構數據庫[2],但其數據同步的效率較低,在定時全量同步模式下工作比較穩定,但同步周期較長。若采用增量同步,則需要根據時間戳等變量來進行設置,而目前大部分業務表都不符合設置變量要求。至于采用CDC模式實現數據實時同步,則需要配置大量的觸發器,占用大量資源,不僅對數據庫的業務性能影響較大,而且故障點也多,經常出現無規律停止同步的情況,糾錯困難,維護成本較高[3]。
面對高校大數據存在的種種問題,深入剖析問題產生的原因,找出問題的根源,對提高數據質量,實現大數據為學校管理決策提供支撐有重要意義。
自上而下,首先是對標國家相關部門、行業主管單位發布的各類指導性文件,如《國務院關于印發促進大數據發展行動綱要的通知》、《教育信息化2.0行動計劃》等文件對高校數據發展提出的相關要求;其次對標地方政府對高校數據融合提出的要求,如根據浙江省的“最多跑一次”改革工作對數據提出的相關要求,從高校層面上講,就是要實現校務管理提檔升級,提升師生零跑腿辦事占比,實現數據“一次錄入、多處使用”,為各部門協同辦事提供基礎支撐;最后結合學校智慧校園建設的總體規劃,實現數據與高校管理和教學的深度融合,利用大數據分析來為高校發展提供決策支撐。
結合各級部門對數據提出的相關要求,高校在數據方面存在的短板問題可歸納為以下四個層面。一是高校在前期信息化建設時缺少全校統一規劃,各部門業務系統自建自管,各自獨立,功能重疊又各自生產數據;二是缺少全校性的數據管理頂層制度,沒有建立統一的數據標準或數據標準落實不到位,各部門職責交叉重疊,責、權、利邊界清晰度不高,沒有落實數據“一人一數一源”的原則;三是缺少載體,缺乏全校共建共享共用的統一數據錄入平臺,業務數據各自錄入,數據權威源不明確;四是高校數據質量考核力度不強。高校的信息化部門一般都為教輔部門,在校內地位不高,往往屬于邊緣部門,對全校各部門的數據質量考核較難落實。
針對目前分析高校數據存在的一系列問題,本文結合作者所在高校,提出一些初步解決策略。
在充分的調查研究的基礎上,對全校的數據體系進行整體規劃,確定高校數據專項工作的總體目標,實現高校數據生命周期管理從半閉環向全閉環轉變,數據質量管控從人工溝通向自動管控轉變,顯著提升數據的支撐能力,服務于數據采集、教學診斷以及“最多跑一次”改革工作等,從而實現技術賦能,助力高校大數據體系構建。
確立全校數據管理頂層制度,明確數據管理的組織機構和職責分工、數據分類及數據負責部門、數據開放使用規則、數據質量考核體系、劃分數據安全等級,實時更新數據UC矩陣表,消除“一數多源”或“一數無源”的情況。
建立全校數據綜合服務公共大平臺,包括數據標準維護、各類數據的一站式錄入、數據質量治理、數據開放共享、瀏覽及統計等子應用,構成平臺內部大閉環。
升級學校數據標準,將原有數據標準單一的技術屬性拓展增加業務屬性、管理屬性和安全屬性,將紙質線下標準搬到線上標準,形成責任清單,落實每個數據項的數據責任體系,明確指出每個數據項的源頭責任部門和生產者,落實數據 “一數一源一人一責”的原則。
結合學校自身的業務需求和發展狀態,制定數據質量考核辦法。同時建立全校數據質量指標體系,綜合評價數據的完整性、規范性、一致性、準確性、唯一性和關聯性,并將數據質量指標進行量化,根據數據標準“一數一源一人一責”的原則,以數據質量指標作為全校各部門數據質量考核的依據。
高校數據治理是一項長期的、復雜的綜合性系統工程[4],需全校統籌協調,各部門共同參與,自上而下分層次逐步推進,先完成全校核心主數據的治理,再逐步拓展到非主數據的治理,最終實現全校數據質量的全面提高。
隨著大數據技術的不斷發展,高校數據資源已成為學校的無形資產和戰略資源,是高校各項業務運作的基礎。規范數據資源的統籌管理,實施數據治理,提高數據質量,是高校實現數據共享、開展大數據分析和應用的前提。因此,解決高校數據存在的問題,使數據能輔助高校教學管理,為高校發展決策提供支撐,將成為高校當前數據工作的重點。