文/盧蓓蓉 沈富可
如何讓數據真正說話
文/盧蓓蓉 沈富可
建立有效的數據分析體制機制,借鑒商業智能的技術方法和院校研究的管理模式,發展院校智能,需要技術人員與管理人員的緊密合作, 更需要變革大學管理體制,才能真正實現基于數據的決策。
隨著各類業務數據的不斷積累,如何加強數據管理,保證數據的準確性和完整性、并讓積累的大量數據在服務教學科研、改善管理水平、提供決策依據等方面發揮作用,成為高校信息化部門和業務部門共同關注的問題。高校決策機構也有以數據為依據、增加學校決策的科學化要求。不少高校信息化部門已經或正在建設數據倉庫,力求通過數據分析為學校決策提供有效依據。
當前高校數據分析的問題主要表現在:數據的完整性和一致性程度不高;適用于高校的數據分析模型不多,使用的數據分析方法比較單一。很多的數據分析還停留在簡單數據報表的層面,展示層面可視化程度較淺,不能有效說明業務問題和改善的切入點,更不能對高校業務提出可行性的改造方案和結果驗證,數據分析的價值無從體現。這些問題皆非單一的技術解決方案可以破解,需要在高校信息化不斷融合和創新的過程中逐步加以解決。
筆者認為,當前高校數據分析的主要問題表現在尚未形成分工明確、高效協同的數據分析體制機制。
1. 體制層面,誰來負責數據分析?當前在大多數高校內,信息化部門負責數據倉庫的建設和運維,并從技術層面不斷加強數據管理,但對高校的決策環節缺乏了解,同時也不直接為決策提供數據分析。發展規劃部門需要全局掌握學校基礎數據并直接服務于宏觀決策,本身卻不參與數據管理并缺乏利用數據的專業能力。學校的各業務部門雖然對自身業務系統的建設投入了很大精力,然而往往只關注本部門的業務運行,處于學校數據供應鏈上游的部門,往往對處于數據供應鏈下游的要用數據的部門業務支持力度不夠,數據流轉的效率不高,數據分析時數據不完整和不一致依舊存在。
2. 機制層面,如何做好數據分析?數據分析的目的是什么,是服務于宏觀決策,還是監控學校的日常運行并及時預警;數據分析的內容涵蓋哪些,是提供展示報表,還是要在對數據定量分析的基礎上提出具有操作性的工作建議;數據分析的數據在哪里,是依靠學校數據倉庫的數據,還是引入外部數據,豐富數據分析的數據來源?
借鑒國外大學院校研究的經驗,在學校層面上建立完善的數據分析體制機制,將為上述問題提供可行的解決方案。
在美國高校,數據分析往往由院校研究辦公室(Office of Institutional Research)擔任,美國的院校研究辦公室源于以數據為基礎(data -based )的思維方式和決策機制, 院校研究早期定位于為學校行政管理決策層服務, 現在其功能和領域在不斷拓展,已經擴大到院校教學、研究和社會服務的多個方面。院校研究作為一項重要工作職能,已經被正式納入高等學校內部的組織結構和管理框架之中。美國眾多高校都成立了院校研究辦公室,其部分工作職能與我國高校校辦(如對外統計報告)、發展規劃辦(如院校發展規劃)相對應,但其職能更加豐富(研究內容還包括學生生活與學習,學術項目、課程和教師問題,院校管理, 高等教育協作、政策和院校的社會責任,院校研究實踐: 理論、方法、技術、工具和倫理等),其研究著眼于院校內部管理的實際問題,是以問題及問題的解決為指向。遵循的研究路徑是:“問題(現象)——原因——方法”的邏輯路徑。其基本職責是規范、收集和完善院校數據,為院校管理和發展提供信息和咨詢服務。專業院校研究者必須掌握定量和定性兩類研究范式和多種具體研究方法,具備“按需”研究的素質。美國大學院校研究辦公室的從業人員主要是由具有數據庫專業背景的IT 人員和具有統計學等學科背景的高等教育專業博士( Ed. D) 組成。他們稱自己為院校研究員( IRer) 。
目前國內的院校研究也已起步,但尚停留在學術研究層面,高校內鮮有帶有行政管理職能的院校研究機構成立。其功能定位、研究范疇和研究方法與國外院校研究相比,尚有較大差距。其研究人員多是高等教育學專業背景的人員,雖從美國引進、傳播了院校研究的概念,并嘗試推動了院校研究的實踐,但數據分析作為現代院校研究的基礎和重要內容,尚未引起我國大多數致力于院校研究的學者的重視。
以美國紐約大學為例,其數據管理體制中有兩個重要角色:數據管理員(Data Steward)和院校研究辦公室。數據庫管理員負責數據開發和數據訪問計劃;負責創建和執行捕捉及修復不一致或錯誤的數據的工作流程,保證學校數據的可靠性;負責核實公開的報告和分析,保證學校數據的一致性和有效性;負責確保數據保存在學校數據倉庫內,保證學校數據的完整性;與院校研究辦公室和大學財務辦公室一起研究定義、計算大學評測指標的算法和常用術語;參與數據安全接入審計,保證學校數據的安全。院校研究辦公室則負責和數據管理員一起,根據大學外部報告的要求和標準,研究定義計算大學評測指標的算法和常用術語,此外,在其工作過程中,院校研究辦公室通常會發現數據不符和不一致的地方,將及時報告給數據管理員去解決。院校研究辦公室需要定義的大學術語如:教師(faculty),大學里符合什么樣條件的人可以統計為教師,大學測評指標如何計算每名學生的空間,什么類型的空間可以計算(所有空間,學術空間等)。
由紐約大學的例子可以看到,在數據分析的層面,是由院校研究辦公室自上而下地開展工作,院校研究辦公室直接從學校數據倉庫獲取數據,信息化部門密切與之配合,雙方協同確保學校數據的準確性和完整性。

數據挖掘需要技術人員與管理人員的緊密合作, 更需要變革大學管理體制,才能真正實現基于數據的決策。
1. 明確數據分析的負責部門。建立專門的院校研究機構或者強化發展規劃部門的職能,使其切實承擔起學校數據管理和數據分析的職責。
2. 健全數據分析機制。切分院校研究機構和信息化部門的工作界面,充分發揮部門優勢,高效協同地工作。加強院校研究機構或者發展規劃的隊伍建設,增加具有數據庫專業和統計學等學科背景的專業人員,并通過有效的培訓使其逐步專業化。
3. 讓數據說話。首先,讓數據及時說話,改變數據分析一定要海量積累數據的觀點,數據分析也可以有輕量級的應用,而且輕量級的數據分析更能讓業務部門敏捷改善和改進業務模式。如,每次學生選課后,及時對學生跨專業選課的數據進行分析,并對下學期的跨專業課程設置、選修條件限制等提出建議。其次,讓外部數據一起說話,引入外部數據,并與校內數據有效結合,增加數據分析的有效性。如,通常高校在分析教師科研情況時,科研系統中的論文數量和期刊性質成為核心指標。引入外部數據,開展教師所發表科研成果學術影響力的評價工作,對教師發表論文的被引情況(H指數等)等進行數據分析,將其作為學術成就或學術影響力的評價指標之一,可增加數據分析的可信度。 第三,讓數據為多方說話。數據分析的目的是為學校決策服務,但不僅僅是為決策服務,還要提升數據分析工作中的服務意識,為學校管理部門、院系、研究機構、教師和學生提供相應服務。如,利用學生系統、教務系統、課程學習平臺、實習系統、圖書館系統等多個系統中學生個人的各類相關數據,對學生個人的學習情況進行分析,并及時給予預警和指導幫助。第四,在適當的條件限定下,高校可以通過一定形式,對外逐步開放本校數據倉庫的部分數據,并為其他校外相關者利用本校數據提供支持。
(作者單位為華東師范大學信息化辦公室)