中圖分類號:TP391 文獻標志碼:A
0 引言
在信息技術深度重塑教育生態的背景下,高校信息化建設正在向現代化轉型的戰略核心轉變。數據作為新型關鍵生產要素,其治理能力已成為高校教育數字化轉型工作的重要驅動力,直接影響高校核心職能的實現效能。當前高校數據治理的理論研究多聚焦數據中心構建與頂層制度設計,對基層業務場景驅動數據質量提升關注不足,數據治理過程中存在“重架構規劃、輕場景驅動”的不足。在高校數據治理的實踐中,隨著信息系統數量的增加,數據孤島林立、權威數據源模糊、跨部門數據流轉壁壘等長期存在的問題難以徹底破解,持續制約著數據價值的釋放。本研究以某高校為例,針對其數據確權不清、質量不高、流轉不足等典型問題,建立數據治理機制,采取了基層應用驅動數據質量提升的路徑,將智慧學院平臺作為數據治理入口,開發基于業務需求及數據核驗的分布式治理工具,與基層業務場景緊密關聯,由此形成基層使用、糾錯、反饋、優化的協同機制,從而有效推進了數據確權與質量提升工作。本研究通過實證驗證基層業務場景反饋對數據治理成效提升的價值,為破解高校數據治理難題提供新的視角和案例,也為高校數據治理提供新的思路。
1高校數據治理的國內外研究與實踐
1. 1 國內研究進展與局限
國內數據治理在理論研究與實踐探索方面均取得了一定成果。理論研究方面,國內學者對數據治理的概念、體系、內容等進行了持續、深入的探討,梳理了相關理論[1]。在實踐探索方面,相關研究比較薄弱,缺乏成熟的模型與框架應用研究[2],多集中在理論探究。北京大學自2018年起構建人(X)—事(Y)一時(Z)的三維立體數據互動結構模型,實現了數據治理和應用的全流程智能化管理[3]。在標準規范方面,2024年5月,國家標準《信息技術大數據數據治理實施指南》(GB/T44109—2024)正式發布,明確了數據標準、數據質量、數據應用等方面的要求[4]在數據治理責任體系方面,張輝等[5]研究認為要基于高校機構實際,自上而下劃分為決策層、控制層、執行層、開發層,建立數據治理責任體系。在數據治理政策方面,王楠等[在研究中發現,僅有部分高校在數據治理政策中提及數據共享辦法,僅5所高校提及了數據使用的目標和要求。此外,國內高校數據治理在跨部門協作、數據質量提升以及技術應用等方面面臨挑戰,鮮見基層數據治理角色和跨部門業務協同的文獻,須進一步加強實踐探索與理論研究的結合,以推動數據治理的進一步發展。
基金項目:中國高校產學研創新基金——騰訊科技創新教育專項;項目名稱:基于技術中臺的新一代智慧校園建設關鍵問題研究;項目編號:2022TX034。2023年江蘇高校教育信息化研究課題;項目名稱:全評價驅動的數字時代高校青年教師成長路徑研究。
作者簡介:郭衛兵(1983—),男,工程師,博士;研究方向;信息資源建設與信息化管理。
1.2國外理論貢獻與實踐挑戰
國外數據治理雖在理論與實踐層面取得了一定的成果,但也面臨諸多挑戰。理論貢獻方面,國外學者構建了較為豐富的數據治理模型與框架,如Weber[7]提出的權變模型,強調根據組織特性定制數據治理方案,通過角色、決策域和責任矩陣設計獨特治理格局。 DGI[8] 和DAMA[9框架則從不同角度指導數據治理工作,前者關注數據治理的獨立性,后者側重數據管理與治理的結合。這些理論為數據治理提供了系統性的指導思路。在實踐層面,國外高校積極開展數據治理探索[10]。如牛津大學通過創建數據治理框架和實施數據戰略,明確各方角色和職責,利用工具和技術確保數據質量;昆士蘭大學構建全面的數據管理框架,涵蓋數據治理、架構、建模、安全等多個方面,優化數據使用;密歇根大學啟動科研數據管理計劃,提供豐富資源和業務指導,促進科研數據的管理與共享。這些實踐有效提升了高校的數據管理能力和決策質量。然而,國外數據治理也面臨諸多挑戰,數據質量問題普遍存在,數據的準確性、完整性、一致性等難以保障,影響決策的可靠性。在數據治理組織與管理方面,涉及多個部門和利益相關者,協調難度高且缺乏專業技術人才,制約了數據治理的進展。
1.3 存在的不足
綜上所述,目前數據治理領域的理論研究和實踐探索中存在3個主要矛盾:技術研究較為豐富,但制度創新相對不足;頂層設計較多,而基層實際操作經驗較少;單一方面的突破較多,但系統性的協同較少。為了解決這些問題,本研究提出三階式閉環數據治理方法,旨在從以下3個方面尋求突破:首先,從職能分工與場景化治理2個角度出發,明確數據治理的責任與權利,以優化數據治理各參與主體與之間的協作。其次,有效結合動態校驗和激勵機制,以緩解數據質量保障與共享需求之間的矛盾。最后,有機結合制度規范、技術支持以及業務流程,為系統性數據治理提供初步的實證依據。
2高校數據治理的閉環邏輯
2.1 數據治理的核心矛盾
在高等教育數字化轉型背景下,高校數據治理面臨數據確權不清、數據質量不高、業務協同不暢三重矛盾,其本質是科層制管理架構與數據跨部門流轉需求的系統性沖突。
2.1.1數據確權矛盾
在數據治理過程中,多部門業務系統存在的“數據孤島”現象體現出較為嚴重的數據確權矛盾。以學生學籍信息為例,因缺乏數據確權規則,教務系統與學工系統對同一數據項進行維護與更新,進而造成數據一致性異常。在科層制治理結構下,部門將數據視為行政權力的延伸,成為強化管理話語權的工具,導致跨系統數據協同時須耗費大量一致性校驗成本。破解此矛盾須重構數據確權機制,建立基于“責任清單”的唯一權威數據源認定規則,從而明確不同數據管理部門,從制度層面消除數據確權矛盾。
2.1.2數據質量矛盾
傳統“重采集輕治理”的思維導致數據質量不高。業務部門為降低信息系統建設和管理成本,在信息系統建設時不注重數據標準的執行,在信息系統使用時將數據錄入視為部門內事務性工作,缺乏數據質量控制動力與執行力;“數據煙肉”現象使得跨系統數據準確性、一致性校驗無法發揮作用,低質數據持續沉淀;低質數據甚至會引發交叉污染,進一步帶來數據負向循環,數據使用部門因數據質量問題減少使用,數據管理部門因缺乏有效反饋而不提升數據質量。因此,構建全流程動態數據校驗機制,將質量檢驗規則嵌入數據生產環節,建立異常數據溯源機制,形成數據生產即治理的閉環管控。
2.1.3業務協同矛盾
業務協同矛盾主要源于學校管理要求與業務部門實際需求的錯位。學校管理要求業務部門投入一定的資源進行數據質量管控,業務部門卻難以直接得到數據共享帶來的價值,而數據標準不統一、更新不及時等問題使得數據共享更加困難。解決路徑在于構建數據流轉驅動的業務協同機制,通過明確數據管理權、所有權和使用權,將數據治理要求嵌人各部門業務流程;同時開發輕量化的數據應用和數據服務工具,使數據使用部門能便捷地獲取跨部門數據,使數據管理部門的數據共享行為和部門價值正向關聯,實現數據管理與業務發展的有機統一。
2.2高校數據治理閉環模型構建
高校數據治理閉環模型通過制度層、技術層與應用層3個層次的協同設計,構建制度規范、技術支撐與業務驅動的動態數據治理體系,破解科層制架構下數據確權、數據治理和業務協同三重矛盾。
2. 2. 1 制度層
基于數據權責體系,構建責任清單、需求清單、問題清單等“三張清單”,明確數據全生命周期的權責歸屬。責任清單依據職能相關性劃分數據所有權、使用權與管理權以及數據生產、維護、使用各環節主體的職責,例如教務部門對學生學籍數據具有管理權、教職工個人對科研數據真實性承擔主體責任等。問題清單和需求清單厘清數據需求和問題,使數據治理過程中各環節、各主體能夠基于需求和問題驅動,高效協同開展數據管理工作。
2.2.2 技術層
依托校級大數據中心實現多源異構數據的標準化與整合,開發能夠根據部門業務場景自適應調整的數據清洗平臺,集成了數據標準校驗和一致性維護功能模塊[],嵌入業務流程,同時可以根據業務場景需求設定合適的數據質量控制標準。這樣能夠在實際操作中有效地落實數據治理策略,既有助于提高數據的完整性、一致性和準確性,又能夠很好地適應不同的業務需求。
2.2.3 應用層
以學科評估、績效考核等數據應用場景為驅動,建立數據質量與治理效能的聯動機制。當數據質量問題導致業務出現偏差時,相關業務部門通過數據治理底座平臺發起數據溯源流程,從而在數據源頭進行數據質量優化。通過“問題識別 $$ 質量溯源 $$ 效能提升”的反饋過程,將數據質量問題被動響應轉變為主動改進,實現數據質量提升的正向循環。有利于數據價值在人才培養、學科建設等領域的釋放,從而支持更加高效和精準的管理決策。
2.3“智慧學院”的數據治理價值體現
在高校治理重心向院系下移的趨勢下,以“智慧學院”為代表的院系治理現代化是完善高校內部治理結構的關鍵[12]。基于此,開展校院兩級信息化建設,實現數據橫向互通、縱向流通,驅動數據質量提升。“智慧學院\"依托校級大數據中心,生產數據、核驗數據、使用數據的同時優化數據質量,形成閉環機制,突破科層制管理架構矛盾。
2.3.1治理主體下沉
傳統數據治理模式依賴學校信息化部門集中管控、各業務部門協同,而忽視了基層院系的作用,存在響應滯后、數據利用不足等局限。“智慧學院”重構數據治理運行機制,改變中心化治理模式,將院系從治理旁觀者轉變為治理主體。其中,教職工作為數據責任人,在教學、科研等場景中生產數據,在學科評估、績效考核等場景中使用數據,由此形成院系多節點協同的分布式治理網絡,提升數據治理精度[13]
2.3.2節約治理成本
傳統數據質量提升依賴學校信息化部門集中處理,存在驗證成本高、誤判率高等不足。“智慧學院”通過數據權責下沉,使掌握數據情境的教職工直接參與數據質量提升工作,如:研究生導師核實學生科研數據,實現數據責任主體與信息優勢者的統一,節約了治理成本。這一機制符合威廉姆森通過治理結構創新降低信息驗證成本[4的交易成本理論核心觀點。
2.3.3 質量提升高效
傳統數據治理采用\"采集-清洗-應用”的線性路徑,存在靈活性低、問題識別延遲等不足。“智慧學院”與教職工教學科研工作緊密結合,通過實際數據使用場景,教職工與各類數據密切接觸,進而完成“使用即治理”的數據治理遞歸模型構建。在開展教學科研工作的同時完成數據質量識別、權責確認、錯誤修正等關鍵步驟,使得數據質量管理扁平化,促進了業務價值的創造。
3三階式治理策略與實施
高校數據治理須突破傳統“一刀切”模式,以“按需閉環、分段遞進”策略開展持續數據治理。本研究以某高校為例,在數據治理過程中以問題導向、場景驅動與基層參與為軸線,收集責任清單、需求清單和問題清單“三清單”,“校院處員”協同推進數據治理工作,分為3個階段逐步破解數據流轉效率低、數據共享效能不足、數據孤島長期存在的困局。
3.1第一階段:數據質量診斷
在這一階段,利用制度分析與發展框架(Institutional AnalysisandDevelopment,IAD)及數據治理成熟度模型(Data GovernanceMaturityModel,DGMM),全面摸排了全校數據家底,診斷了大數據中心的存量數據質量。通過跨部門調研與半結構化訪談,識別核心業務部門在數據權責認知方面的不足。例如,教務部門與學工部門分別維護學生學籍信息和獎懲記錄,數據標準缺失,導致學生家庭住址、聯系方式等基礎字段重復維護率達 42% 。通過構建學生數據集,明確教務部門為學籍數據權威源,學工部門通過標準化接口調用基礎字段并補充業務屬性,實現學生數據的“一數一源、多元擴展”。技術層面,通過構建覆蓋了1.2億條數據的血緣圖譜,發現近 70% 的字段未明確數據源;近 30% 的字段存在唯一性問題,約40% 的字段存在完整性缺陷,如“教師聘用日期”字段空缺率達 22% ,學籍、職稱、獎懲等數據在不同部門間表現不一致。學校核心指標數據的健康度評估結果顯示,僅組織管理數據達到“優秀”水平。這些診斷結果為下一步數據治理提供了精準的改進方向。
3.2第二階段:大數據中心建設
本階段通過縱向確權和橫向協同推進數據治理范式轉型。
3.2.1 縱向確權
依據業務部門職能制定權威數據源認定標準,修訂校級數據標準,構建數據責任清單、數據需求清單和數據問題清單,明確數據管理權和數據共享需求。信息化部門承擔校級大數據中心的建設與運維責任,通過校級大數據中心歸集多源異構數據,各業務部門管理和維護各自的部門數據中心并在信息化部門的指導下促成數據跨部門流通。由此建立“一處一庫”治理范式,業務部門按責任清單維護權威數據源,技術部門通過標準化接口實現跨部門數據流動,打破“數據孤島”。
3.2.2 橫向協同
建立數據質量看板,按確權部門統計數據完整性、一致性和準確性等指標,如科研數據的獲獎成果數據完整度 69% ,教務數據的教室信息數據一致性95% 。在大數據中心嵌入數據校驗引擎,執行字段格式標準化、跨系統一致性檢測等規則。例如,職稱晉升數據須與科研成果庫自動匹配,財務支付狀態與項目結題信息實時校驗。實施后,數據糾錯耗時縮短75% ,跨部門數據沖突減少 82% 。
3.3第三階段:價值閉環構建
本階段將數據治理嵌入院系核心業務流,形成閉環管控。
3.3.1分布式治理機制
院系基于業務需求開發個性模塊驅動教職工主動參與數據生產與使用,例如某學院“學科評估數據大屏”自定義KPI權重,教師在填報和確認績效考核表時觸發數據核驗流程,及時發現存在錯誤并立即修正。
3.3.2 場景驅動規則更新
修正數據經審核后同步至校級大數據中心,驅動數據責任清單與校驗規則更新。例如,某學院修正的科研成果數據使學校人才報表錯誤率從 22% 降至13% ,使校級大數據中心新增交叉學科項目。
3.3.3治理效能轉化
通過閉環管控機制,基層業務場景驅動治理體系優化,教職工月均糾錯耗時從 3h 降至 0.5h ,數據驅動的業務協同數量增長 23% ,形成了數據質量與業務
價值共同提升的正向反饋機制。
4實證分析
4.1治理成效分析
基于“智慧學院”的閉環數據治理模式顯著提升了數據治理效能。量化分析顯示,其一,數據確權率實現突破,核心業務數據權威源覆蓋率達 100% ,跨部門數據沖突減少 82% ;其二,數據質量得到改善,核心業務的關鍵字段空缺率下降 30% ,一致性誤差從 18% 降低至 5% ;其三,數據交換率有效提升,校級大數據中心月均數據交換量增長2倍,“智慧學院”平臺覆蓋30% 的院系,支撐了學科評估、人才引進等12類核心業務場景。質性研究發現, 83% 的部門認為數據質量與績效考核綁定后,主動維護數據的意愿顯著增強;教職工問卷調查( N=420 )顯示, 85% 的受訪者認可數據核驗流程的必要性與效率,較治理前提升 22% 。
4.2 治理深化挑戰
治理深化面臨三重阻力。在技術性成本方面,歷史數據質量提升成本較高,近5年存量數據中仍有28% 冗余條目,人工核對費時費力且誤判率高,須引入AI技術降低糾錯成本。在制度層面,仍有不少部門“選擇性共享”以規避核心數據開放,須制定數據開放清單。在實施成本方面,部門老舊信息系統缺乏維護,接口改造投資高,部分院系因技術能力不足而推遲數據治理進程。
4.3 可持續優化的路徑
針對挑戰提出漸進式優化策略。首先,建立動態績效激勵制度,將數據完整率、及時性等指標納入部門績效考核范疇,與信息化經費分配動態聯動。其次,開發輕量化數據治理工具,預設學科評估、智能填表等通用模塊,支持“零代碼”配置,降低院系信息化接入門檻。最后,設立“一處一庫”專項基金,優先處理核心部門數據以及高頻調用數據,分階段化解存量數據問題。
5結語
基層業務場景是數據治理成效的天然“質檢器”。本研究通過智慧學院模式達成“以用促治”,教職工在績效考核、學科評估等場景中使用數據時,同步完成數據核驗與修正,使數據質量管控從信息化部門的單向治理轉向基層業務場景驅動。同時,數據確權與激勵機制協同,通過績效激勵、質量考核等制度設計,將部門利益與治理效能綁定,避免治理淪為純技術工程。本研究突破了傳統“頂層設計”思維,挖掘分布式基層場景的價值,通過即時反饋,有效彌補了中心化數據治理的盲區。進一步而言,學校層面通過數據確權、大數據中心確保數據規范,院系部門層面則依托個性化模塊滿足業務場景需求,通過基層驅動的閉環反饋實現治理體系持續進化,形成統分結合的治理架構。其經驗為高校數據治理提供普適路徑,對破解數據孤島、提升數據流轉效率和治理效能具有借鑒意義。
參考文獻
[1]張寧,袁勤儉.數據治理研究述評[J].情報雜志,2017(5) :129-134,163.
[2]劉桂鋒,錢錦琳,盧章平.國內外數據治理研究進展:內涵、要素、模型與框架[J].圖書情報工作,2017(21):137-144.
[3]蔣廣學.高校校務數據治理的實踐探索與理論探討:以北京大學為例[J].北京教育(高教),2021(4):8-11.
[4]國家市場監督管理總局,中國國家標準化管理委員會.信息技術大數據數據治理實施指南:GB/T44109—2024[S].北京:中國標準出版社,2024.
[5]張輝,李健明,楊強.大數據視角下高校數據治理體系研究與實踐[J].中國高等教育,2022(增刊2):16-18.
[6]王楠,杜月.數字時代我國一流高校數據治理政策的文本研究[J].中國教育信息化,2024(5):45-54.
[7]WEBERK,OTTO B,OSTERLE H. One size does notfit all - a contingency approach to data governance[J].Journal of Data and Information Quality,20O9(1) :1-27.
[8]Data Governance Institute. DGI data governanceframework[EB/OL].(2017-03-28)[2025-05-15].https://www. datagovernance.com/the-dgi-framework/.
[9]DAMA International. The DAMA guide to the datamanagement body ofknowledge[M]. New York:TechnicsPublications,2009.
[10]陳茜.全球高校:數據治理政策新藍圖[EB/OL].(2024-09-24)[2025-05-15].https://www.sohu.c0m/a/811193648_100189681.
[11]劉雪芳.高校信息資源異構數據源整合的技術方案分析[J].無線互聯科技,2023(22):75-77.
[12]王戰軍,肖紅纓.大數據背景下的院系治理現代化[J].高等教育研究,2016(3):21-27,38.
[13]OSTROM E. Beyond markets and states : polycentricgovernance of complex economic systems[J].AmericanEconomic Review,2010(3) :641-672.
[14]WILLIAMSON O E.The economic institutions ofcapitalism: firms,markets,relational contracting[M].New York:FreePress,1985.
(編輯 王雪芬)
Design and implementation of a closed-loop pathway for university data governance: a data quality improvement model based on “Smart College\"
GUO Weibing (Institute for Digital Economy,Nanjing University of Science and Technology,Nanjing 210094,China)
Abstract:Addressing thechallngesofambiguousauthority,dataqualitydeficiencies,andsharing barriersin university data governance,this studyproposes agrassroots-driven data governance approach based on the“Smart College”model.By employing a thre-phase strategy,baseline assssment,quality enhancement,and closed-loop feedback,itestablishes acollaborative framework integrating policies,technologies,and application scenarios to improve data quality. Empirical results demonstrate 100% coverage of authoritative data sources in core business functions,an 82% reduction in cross-departmental data conflicts,a twofold increase in the monthly data exchange volume at the university-level big data center, and a 52% improvement in faculty data verification efficiency. The findings indicate that leveraging“Smart Collge”operational scenariosto drive data governance,coupled with dynamic performance incentivesfordepartmental engagement,effectivelyresolveskeydatagovernancechallengesinhigher education institutions.
Key words: data governance; Smart Colege; data rights confirmation; data quality; closed-loop feedback