文/武漢大學人事部 楊芳 袁園(通訊作者)
我國高校信息化經(jīng)過30 多年的發(fā)展歷程,經(jīng)歷網(wǎng)絡設施建設、應用系統(tǒng)建設和數(shù)字校園集成等階段,隨著信息技術的不斷發(fā)展和應用創(chuàng)新,正從數(shù)字校園逐漸轉型成為智慧校園[1]。高校在信息化發(fā)展過程中,通過信息系統(tǒng)的建設使用,逐漸沉淀和積累了各類數(shù)據(jù)資源。這些數(shù)據(jù)資源是實現(xiàn)高效管理、優(yōu)質服務和科學決策的重要基礎,是支撐高校可持續(xù)發(fā)展的重要資產(chǎn)。而高校普遍在數(shù)據(jù)的質量、共享、應用、安全等方面存在不足和短板,影響數(shù)據(jù)效能的充分發(fā)揮。準確把握數(shù)據(jù)管理的現(xiàn)狀問題,制定科學合理的數(shù)據(jù)治理策略,對高校信息化管理者具有重要的現(xiàn)實指導意義。
本文在與業(yè)務人員面對面訪談、查閱相關參考文獻的基礎上,深入分析高校信息化發(fā)展現(xiàn)狀,將高校數(shù)據(jù)管理方面存在的問題歸納為以下幾類:
(一)數(shù)據(jù)來源復雜多變。近年來,我國高等教育信息化的水平持續(xù)提升,面向教學、科研、管理、服務的各類業(yè)務系統(tǒng)紛紛出現(xiàn)。與此同時,信息填報與業(yè)務辦理越來越普遍和頻繁,甚至出現(xiàn)多頭采集、重復填報數(shù)據(jù)等現(xiàn)象,占用了教職工和學生大量的時間和精力。數(shù)據(jù)來源途徑復雜而分散,數(shù)據(jù)從生成到利用的路徑不清晰。以教學科研成果數(shù)據(jù)為例,各類績效考核、職稱評審、項目申報都是重要的依據(jù),但普遍存在不同業(yè)務系統(tǒng)重復錄入的現(xiàn)象,產(chǎn)生數(shù)據(jù)重復、冗余、不一致等問題,在后繼的共享應用中,沒有形成清晰的來源。尤其在部分系統(tǒng)的新舊更替中,數(shù)據(jù)的來源與去向頻繁變動,對高校數(shù)據(jù)管理帶來了很多潛在的問題。
(二)數(shù)據(jù)標準缺乏控制。高校信息化建設中缺少頂層設計,數(shù)據(jù)標準滯后于系統(tǒng)建設的問題普遍存在。首先是規(guī)劃、制定、優(yōu)化數(shù)據(jù)標準的能力較為欠缺,其次,雖然制定了數(shù)據(jù)標準,但執(zhí)行、落實的力度不夠,甚至在某種程度上形同虛設。業(yè)務系統(tǒng)的更替,往往數(shù)據(jù)標準要適應業(yè)務系統(tǒng),而非業(yè)務系統(tǒng)建設時以數(shù)據(jù)標準為主的現(xiàn)象依然普遍[2]。學校各部門購置或者建設業(yè)務系統(tǒng)時,往往采用符合本部門業(yè)務需求的數(shù)據(jù)標準。例如,人事資源管理系統(tǒng)可能采用人力資源管理領域的通用標準,而科研管理系統(tǒng)可能采用科研管理領域的通用標準,不同管理領域的差異導致業(yè)務系統(tǒng)數(shù)據(jù)格式不統(tǒng)一。由于數(shù)據(jù)的格式、內(nèi)容不固定,導致其在不同系統(tǒng)的不一致,在轉換格式后才能相互對接,甚至造成了部分舍棄,影響了數(shù)據(jù)的共享和整合。
(三)數(shù)據(jù)質量難以保障。數(shù)據(jù)來源和標準的不足,也對數(shù)據(jù)質量造成了直接的影響。由于各部門業(yè)務系統(tǒng)相互獨立,對數(shù)據(jù)質量的要求也存在差異。很多業(yè)務系統(tǒng)在建設的過程中注重實現(xiàn)系統(tǒng)的功能,忽略數(shù)據(jù)質量的控制,在錄入或導入數(shù)據(jù)時缺乏必備性、標準性、規(guī)范性的約束,數(shù)據(jù)缺失、格式混亂、數(shù)值錯誤、準確率低等質量問題較為普遍。管理人員不足、缺少信息化能力等原因,也可能成為影響數(shù)據(jù)質量的因素。除了數(shù)據(jù)缺失、不符合格式等明顯錯誤,還有很多是因為數(shù)據(jù)錄入造成的隱性錯誤,這些問題通過技術手段難以發(fā)現(xiàn),需要人工校對才能確認并糾正,需要占用大量的人力和時間。
(四)數(shù)據(jù)共享交換不暢。高校很多的業(yè)務系統(tǒng)之間存在一定的依賴關系,需要數(shù)據(jù)的共享,暢通的數(shù)據(jù)交換對可靠的數(shù)據(jù)共享起著重要的作用。因一些崗位的人員變動頻繁,更新也不及時,對下游的共享帶來了不便。常見的數(shù)據(jù)共享交換有數(shù)據(jù)庫交換、文件傳輸交換、API接口交換等方式。數(shù)據(jù)庫交換方式在業(yè)務系統(tǒng)數(shù)量較少、數(shù)據(jù)庫類型一致時易于實現(xiàn),但在業(yè)務系統(tǒng)數(shù)量多、數(shù)據(jù)庫異構時,存在讀寫性能瓶頸與兼容性適配的局限。文件傳輸方式基于數(shù)據(jù)的導入導出,適合異構數(shù)據(jù)庫之間的共享,但效率較低,難以滿足實效性的需求。API接口交換在實時性、異構性上均有優(yōu)勢,但技術實現(xiàn)較為復雜,需要不同應用廠商的配合。在數(shù)據(jù)共享交換上,高校往往選擇技術實現(xiàn)較為簡單、支持不同類型數(shù)據(jù)庫的方式?;趥鹘y(tǒng)ETL(抽取、轉換、加載)的數(shù)據(jù)庫交換目前在高校應用中仍然比較常見,該方式在定時(如每天一次)模式下相對穩(wěn)定。若想實現(xiàn)實時模式的ETL,因為數(shù)據(jù)傳輸量大大增加,需采用觸發(fā)器方式來實現(xiàn),對數(shù)據(jù)庫的讀寫性能造成較大負擔,甚至導致數(shù)據(jù)庫服務的異常,進而造成數(shù)據(jù)共享的中斷。因為這些原因,數(shù)據(jù)共享交換的滯后性、不穩(wěn)定性,造成了不同業(yè)務系統(tǒng)之間數(shù)據(jù)更新不通暢,在校園日常生活中較為常見,比如更換校園卡后第二天才能在門禁設備上正常使用、欠費繳清后不能立即辦理相關手續(xù)等。
數(shù)據(jù)治理是指將數(shù)據(jù)作為資產(chǎn)而開展的一系列組織行為,貫穿數(shù)據(jù)管理的全生命周期。數(shù)據(jù)治理需要結合技術與管理的手段,形成標準化與持續(xù)改善的機制,實現(xiàn)提升數(shù)據(jù)質量、保障數(shù)據(jù)可用性的主要目標,具體內(nèi)容包括組織架構、政策制度、技術工具、數(shù)據(jù)標準、流程規(guī)范、監(jiān)督及考核等方面[3]?;趩栴}導向的原則,制定適合高校實際的數(shù)據(jù)治理策略,明確數(shù)據(jù)來源與部門責任,制定并落實數(shù)據(jù)標準,建立用戶反饋與糾錯機制,促進數(shù)據(jù)質量提升,優(yōu)化數(shù)據(jù)共享交換,更加充分發(fā)揮數(shù)據(jù)效能,總體框架如圖1所示。

圖1 基于問題導向的高校數(shù)據(jù)治理總體框架
因此,需要以問題為導向,針對性的解決數(shù)據(jù)管理中面臨的主要問題與挑戰(zhàn),制定數(shù)據(jù)治理的具體策略。
(一)落實“一數(shù)一源”機制?!耙粩?shù)一源”指的是高校信息化所需的每一條基礎數(shù)據(jù)有且只有一個對數(shù)據(jù)的真實性和準確性負責的業(yè)務部門,對相關數(shù)據(jù)資產(chǎn)的唯一性、一致性和可用性負責。在明確數(shù)據(jù)源責任單位的基礎上,構建數(shù)據(jù)資源的共享與保障體系,保障數(shù)據(jù)質量和利用效率。通??筛鶕?jù)數(shù)據(jù)業(yè)務屬性和部門業(yè)務職責,確定各類數(shù)據(jù)產(chǎn)生的歸屬部門為數(shù)據(jù)源單位。各數(shù)據(jù)源部門落實“一數(shù)一源”的機制要求,負責相關數(shù)據(jù)的采集、處理和質量管理,保障數(shù)據(jù)的準確性、完整性、及時性,避免對同一數(shù)據(jù)重復采集、多頭管理。
良性的數(shù)據(jù)循環(huán)機制的建立是十分有必要的,高校的人事、教務、學工等系統(tǒng)是數(shù)據(jù)采集的主要源頭,要在數(shù)據(jù)源頭補足短板,已有的要全量歸集,沒有的要及時補充。建設全校統(tǒng)一的共享數(shù)據(jù)庫基礎平臺,已經(jīng)建立數(shù)據(jù)標準、確定數(shù)據(jù)源頭的業(yè)務數(shù)據(jù),應采取適當工具抽取并存儲到共享數(shù)據(jù)庫中,不能通過工具抽取的線下數(shù)據(jù)可通過填報工具錄入或文件導入。采集范圍可隨著數(shù)據(jù)責任、數(shù)據(jù)標準的推廣和落實,逐步擴展到各業(yè)務部門和業(yè)務系統(tǒng)。歷史數(shù)據(jù)應該采取有效的存檔機制,記錄數(shù)據(jù)變更的過程。
(二)有效推行數(shù)據(jù)標準。標準被定義為“用來判斷其他事物質量的好東西”或“由權威建立和確定。作為衡量數(shù)量、重量、范圍、價值或質量的規(guī)則”。數(shù)據(jù)標準是指保障數(shù)據(jù)定義和使用的一致性、準確性和完整性的規(guī)范性約束,是對數(shù)據(jù)的命名、數(shù)據(jù)類型、長度、業(yè)務含義、統(tǒng)計口徑、歸屬部門等,定義統(tǒng)一的規(guī)范,保證各業(yè)務部門、各業(yè)務系統(tǒng)對數(shù)據(jù)的統(tǒng)一理解、對數(shù)據(jù)定義和使用的一致性。數(shù)據(jù)規(guī)范體系的建設是數(shù)據(jù)治理目標實現(xiàn)的保障,有助于數(shù)據(jù)在不同業(yè)務部門、系統(tǒng)的共享、交互和應用。在高校數(shù)據(jù)治理實踐中,應參考國家和教育部頒發(fā)的數(shù)據(jù)標準,結合自身實際編制數(shù)據(jù)標準,包括數(shù)據(jù)定義、數(shù)據(jù)格式以及數(shù)據(jù)應用標準,以及數(shù)據(jù)定義與應用規(guī)則,建立標準化的代碼標準、元數(shù)據(jù)模型,實現(xiàn)數(shù)據(jù)標準的唯一性、實時性和擴展性。代碼標準是各業(yè)務系統(tǒng)相應字段需要參照的規(guī)范定義,通常有機構代碼、學科代碼、課程代碼等[4]。在建立數(shù)據(jù)標準的過程中,收集、整理相關信息形成規(guī)范知識庫,例如通用型及業(yè)務型數(shù)據(jù)字典,數(shù)據(jù)間的邏輯關系,數(shù)據(jù)的轉換規(guī)則和數(shù)據(jù)的流轉路徑,表結構定義、字段注釋和屬性等,用于治理后的數(shù)據(jù)共享交換、糾錯修正等。
數(shù)據(jù)標準的制定應遵循唯一、可擴展、簡單、規(guī)范、易用的原則。高校數(shù)據(jù)治理涉及的業(yè)務數(shù)據(jù)種類多、數(shù)量大,將這些數(shù)據(jù)全部納入標準體系需要耗費巨大的人力物力,難以在較短的時間內(nèi)實現(xiàn)。建議對與基礎信息相關、共享率高、使用頻次高的字段優(yōu)先建立標準。在推行數(shù)據(jù)標準的過程中,必定會遇到很多困難,例如一些老舊系統(tǒng)無法改造或者改造成本過高。需結合實際情況,采取差異性的推行策略。對目前的業(yè)務系統(tǒng),首先分析和整理其中存在不符合標準的問題,評估與整改相關的投入成本、潛在風險、時間周期等因素,制定科學合理的整改方案。易于整改的應該立即整改,一時難以整改的可通過邏輯轉換方式實現(xiàn)與標準的兼容,即將更換淘汰的老舊系統(tǒng)可暫不整改,在替代系統(tǒng)中推行數(shù)據(jù)標準。對新建立的業(yè)務系統(tǒng),可統(tǒng)一要求執(zhí)行數(shù)據(jù)標準,作為系統(tǒng)規(guī)劃、實施、驗收的組成部分,上線前進行數(shù)據(jù)標準評估,不合格要求的整改后再上線。
(三)加強數(shù)據(jù)質量控制。實現(xiàn)有效的質量控制是數(shù)據(jù)治理的主要目標,數(shù)據(jù)質量是檢驗數(shù)據(jù)治理成效的核心指標。在落實數(shù)據(jù)責任的基礎上,伴隨數(shù)據(jù)規(guī)范的建設,建立數(shù)據(jù)質量相關制度,規(guī)范數(shù)據(jù)采集、處理、存儲、使用等環(huán)節(jié)的質量控制要求,完善數(shù)據(jù)質量的評估、糾錯機制,保障數(shù)據(jù)準確、真實、完整和規(guī)范。實現(xiàn)數(shù)據(jù)過程可視化和質量可視化管理,便于管理者實時掌握數(shù)據(jù)質量的整體情況,及時發(fā)現(xiàn)數(shù)據(jù)質量面臨的各類問題,促進數(shù)據(jù)質量的不斷提升。
數(shù)據(jù)質量評估是分析數(shù)據(jù)綜合特征、量化數(shù)據(jù)質量的過程。在高校數(shù)據(jù)治理的實踐中,通常將數(shù)據(jù)質量和規(guī)則維度相結合,根據(jù)已經(jīng)定好的數(shù)據(jù)標準以及業(yè)務特性對數(shù)據(jù)質量配置相應的監(jiān)控規(guī)則,及時發(fā)現(xiàn)有問題的數(shù)據(jù)并針對問題數(shù)據(jù)進行重點排查,形成數(shù)據(jù)質量報告,指明數(shù)據(jù)缺失、異常、錯誤等各類問題并提供詳細列表,便于協(xié)同相關部門對問題數(shù)據(jù)進行處理。
數(shù)據(jù)質量的提升離不開長期的投入,需要形成持續(xù)監(jiān)測和錯誤反饋的機制,及時將數(shù)據(jù)質量問題反饋給數(shù)據(jù)源部門處理,建立數(shù)據(jù)修改審核機制,向師生用戶開放數(shù)據(jù)修改申請服務,經(jīng)數(shù)據(jù)源部門審核后及時修改完善??梢詮囊韵聨讉€方面對數(shù)據(jù)質量問題進行反饋和跟進:通過事先定義好的規(guī)則、時間,自動完成數(shù)據(jù)質量檢查,對數(shù)據(jù)存在的問題及時反饋給數(shù)據(jù)源部門;面向業(yè)務部門提供全生命周期的數(shù)據(jù)管理工具,包括數(shù)據(jù)的規(guī)范標準、檢索查詢、質量檢查和異常監(jiān)測等功能;建立師生個人數(shù)據(jù)中心,對師生開放其個人相關的數(shù)據(jù),對不正確、不完整的數(shù)據(jù)進行有針對性的數(shù)據(jù)糾錯、補錄,啟動反饋機制,通知數(shù)據(jù)源單位及時數(shù)據(jù)審核和更新。
(四)優(yōu)化數(shù)據(jù)共享交換。高效數(shù)據(jù)治理的最終目的是實現(xiàn)數(shù)據(jù)資源在全校范圍內(nèi)高效率流轉和高水平共享。數(shù)據(jù)共享交換是實現(xiàn)整個學校的系統(tǒng)集成、解決信息孤島和信息共享問題的重要手段。通過數(shù)據(jù)共享交換,實現(xiàn)跨業(yè)務系統(tǒng)的數(shù)據(jù)集成、共享與協(xié)同。優(yōu)化數(shù)據(jù)供需系統(tǒng)的流程環(huán)節(jié),完善數(shù)據(jù)供需的溝通渠道和協(xié)調機制,充分發(fā)揮數(shù)據(jù)共享交換平臺的數(shù)據(jù)通道作用,消除數(shù)據(jù)共享交換的斷點、堵點,實現(xiàn)數(shù)據(jù)“找得著、拿得到、用得上”。
近年來,不同數(shù)據(jù)源之間通過API 接口進行數(shù)據(jù)的共享交換成為主流。實現(xiàn)高性能、高可靠、開放性強的數(shù)據(jù)采集、集成和共享交換平臺,有效整合校內(nèi)各類數(shù)據(jù)資源,提供開放的應用接入能力,打通不同業(yè)務數(shù)據(jù)共享,實現(xiàn)數(shù)據(jù)資源的一體化管理和科學治理,成為高校數(shù)據(jù)共享交換平臺建設的主要目標。平臺需兼容常見的結構化數(shù)據(jù)源,提供豐富的數(shù)據(jù)集成能力,支持對數(shù)據(jù)共享交換任務的配置和調度,實現(xiàn)自動化、定時化、可視化的數(shù)據(jù)共享。
高校數(shù)據(jù)治理要取得實際成效,需要有效解決數(shù)據(jù)管理上存在的主要問題,形成數(shù)據(jù)產(chǎn)生、維護、應用、收益的良性循環(huán)。按照“誰產(chǎn)生數(shù)據(jù),誰負責管理”的原則,推動業(yè)務部門充分參與數(shù)據(jù)治理,加強跨部門協(xié)同,不斷完善質量反饋與監(jiān)督機制,健全數(shù)據(jù)質量提升體系,逐步推進不同層次和不同維度的數(shù)據(jù)共享,為師生提供更優(yōu)質的信息化服務,以信息化促進學校治理體系與治理能力的現(xiàn)代化。