黃勁榮
(廣州醫科大學信息與現代教育技術中心,廣東廣州 511436)
隨著國家政策的支持、高校信息化建設的深入發展,高校在管理過程中產生了大量的數據,如何對這些數據進行有效管理和利用,已成為高校當前面臨的一個重要問題。由于高校內部業務系統多,各系統間的數據不一致,導致無法共享和利用,進而影響了數據資源的價值。因此,如何從根本上解決高校信息化建設過程中存在的數據問題,實現數據資源的有效管理和利用,為學校各項工作提供決策依據,是目前高校迫切需要解決的問題。在這一背景下,本文以“數據治理”為切入點,將“數據治理”應用于高校信息系統中,通過數據治理實現高校各業務系統間數據的共享和利用。
數據治理的概念源于數據管理,它是指對數據進行合理、有效的管理,使其能夠更好地為組織所用,其基本內容包括以下幾個方面。
數據標準。即數據在采集、存儲、交換、清洗、加工等各環節所采用的標準,該標準是確保數據質量和一致性的基本依據。
數據質量。即對數據質量進行監控和評估,明確數據質量問題并加以解決,提高數據準確性、完整性和可用性。
數據安全。即通過建立健全的安全體系,保證業務系統運行過程中所產生的數據不被非法竊取和使用,確保系統的穩定性。
數據挖掘。即利用專業分析工具從海量的數據中挖掘出有價值的信息和知識,并通過對挖掘出來的信息進行分析和建模,為企業提供決策支持。
流程管理。即對企業業務流程進行梳理,將業務流程中涉及的人、財、物等相關要素進行整合,使其能夠更好地服務于企業業務活動,進而提高企業運營效率。
組織文化。即通過建立完善的組織文化體系,樹立正確的價值觀和理念,使全體員工統一思想,提高認識,自覺維護組織的整體利益和長遠利益。
技術手段。即采用先進、高效、可靠、安全的技術手段來對數據進行管理和分析。
以上七個方面是數據治理基本理論的核心內容,具體包括標準、質量、安全和流程管理等內容,在實際工作中可以將這七個方面結合起來綜合運用于高校信息化建設過程中,從而提高高校信息系統在管理過程中產生的數據質量及數據價值。
數據標準從不同角度可以劃分為不同類型,主要包括元數據標準、業務流程標準等,其中元數據標準是指對有關元數據進行定義和說明的規范,是一種比較基礎的內容,在實際工作中很容易就能實現。
1.業務流程標準。業務流程是指某一特定業務活動中所涉及的有關人員、資源和職責等要素,其核心是對業務活動進行描述和規定。
2.系統功能標準。系統功能是指系統所具備的各種功能,其核心是對系統所涉及的數據進行描述和說明。
3.統一數據庫結構。數據庫結構指數據庫中存儲的所有記錄類型及其所屬關系。
數據質量是指數據在采集、存儲、交換、清洗、加工等各環節中所表現出的準確性、一致性和完整性等要求,它是保證數據使用價值的前提,也是開展數據治理工作的基礎。數據質量的高低直接影響到數據分析和挖掘的效果,甚至會影響到整個數據治理工作的效果。因此,高校在開展數據治理工作時,應以“質量第一”為指導思想,通過制訂明確的質量標準,對各業務系統所產生的數據進行統一審核、檢查和清理,保證所采集到的所有數據均符合相關要求。同時,針對存在問題的業務系統應建立相應的監控和評價機制,對存在問題的業務系統進行整改和完善,從而不斷提高高校信息系統產生的數據質量。
高校的信息化建設中,數據安全是必須要考慮的重要問題,必須保證系統的數據安全,才能有效地保障業務系統運行的穩定性。通常情況下,高校信息化建設過程中涉及的數據安全主要包括以下幾個方面:一是信息系統建設時必須保證數據在采集、存儲、處理、傳輸等過程中的安全;二是在數據開發階段,要對數據進行嚴格的管理和控制,防止非法人員對數據進行篡改、刪除、竊取等操作;三是在數據應用階段,要采取有效措施來避免病毒及黑客對數據進行攻擊,保證數據的完整性和保密性。在高校信息化建設過程中,必須按照國家相關法律法規的要求,建立健全科學有效的安全管理機制和操作流程,從多個層面保障信息系統數據安全。具體包括以下幾個方面:一是要建立嚴格的訪問控制機制;二是要建立完善的備份機制;三是要建立健全的系統監控機制;四是要建立安全審計機制。
近年來,我國高等教育事業取得了長足發展,高校規模不斷擴大,辦學條件不斷改善。但隨著學校規模的擴大,原有的信息系統逐漸不能滿足學校發展的需要,不僅給師生帶來了諸多不便,也給學校管理工作帶來了巨大挑戰。目前高校主要使用的信息系統包括:教務管理系統、后勤保障系統、科研成果轉化與獎勵平臺等。在這些信息系統中,存在以下現狀。
第一,數據孤島。各個業務系統中存在大量重復或冗余的數據,導致數據共享困難。例如,教務管理中,學生成績在教務系統和學工系統中是完全相同的,但學工系統中查成績時需要輸入學號和身份證號才能查到成績;科研成果轉化平臺中涉及很多重復的數據。
第二,數據質量不高。各業務系統的數據標準不統一,存在數據不一致、不準確的現象。例如,學生管理中的學籍信息不一致,在學信網上查學生信息時,學生學籍狀態顯示為“退學”;科研成果轉化平臺中涉及很多重復的數據。
第三,數據無法共享。由于各業務系統之間缺少統一的接口標準和規范,導致不同業務部門之間無法共享數據。例如,教務管理中存在大量學生成績數據、學號及身份證號等基礎信息需要與學工系統進行共享;科研成果轉化平臺中涉及大量的基礎科研資料及成果需要與人事管理部門進行共享。
以上現狀都會為高校信息化建設帶來巨大的挑戰,影響學校各項工作的順利開展。
高校在數據管理過程中存在的問題主要有以下幾個方面。
第一,由于對數據重視不夠,缺乏數據治理理念,造成數據質量差、利用率低的局面。由于沒有形成一套完整的數據治理體系,沒有從規劃、制度、標準等方面對數據質量進行嚴格控制,造成了大量的冗余數據和無效數據,數據價值不高。
第二,不重視平臺建設。由于缺乏統一規劃和頂層設計,高校業務系統繁多,造成大量的系統分散建設,在建設過程中由于缺乏統一的規劃、標準和管理規范,造成了大量的重復建設。此外,由于各業務系統沒有統一的信息模型,各業務系統之間缺乏集成和共享,使得跨系統之間無法實現數據交換、共享和業務協同。
第三,信息化人員缺乏相關知識和技能。由于缺乏專業人才,高校信息化建設往往由信息技術人員或者軟件開發人員承擔。由于缺乏相應的知識儲備,也就不能很好地對現有的信息化系統進行分析、設計、開發、部署和維護等工作。
第四,對數據治理認識不足。雖然高校在信息化建設中已經進行了較長時間的探索和實踐,但對于數據治理工作還缺乏深刻認識和全面理解,導致高校在信息化建設中出現了很多問題。例如,沒有完善的制度規范、沒有形成良好的文化氛圍、沒有專業的技術團隊等。
第五,信息系統建設不夠規范。由于高校信息化建設起步較晚、發展時間較短、投入較大、信息化程度相對較低等原因,導致高校在信息化建設方面存在一定的差距。由于各業務系統是通過業務流程驅動開發的,缺乏相應的規范性和規范性操作指引;缺乏統一規劃和標準化建設;缺乏有效管理機制等因素均可能導致系統建設出現混亂、標準不一致等情況。
第六,由于高校信息化發展歷史較短、業務系統多、業務種類復雜等原因,造成高校在信息化建設中存在著大量的重復建設現象。這些重復建設不僅造成了人力資源浪費和成本增加,而且也不利于數據共享和利用,阻礙了高校管理效率和服務質量的提升。
第七,數據孤島問題嚴重。由于沒有從戰略高度對高校業務系統進行規劃設計、統一管理和有效治理,造成各業務系統之間缺乏有效整合、數據難以共享;由于缺乏有效治理機制和標準規范體系,導致各業務系統難以統一化管理。
第八,高校信息化建設中對數據質量控制沒有給予足夠的重視,缺乏相應的制度規范和流程指引;由于缺少相關專業技術團隊,導致對數據質量控制不到位;由于缺乏有效治理機制和標準規范體系,導致無法進行有效管理。
數據治理的目標是通過一系列技術手段和管理機制,來確保數據的質量,為各業務系統提供可靠、高質量的數據,并通過對數據的充分利用來促進學校管理和服務水平的提升。高校數據治理主要應包括兩個方面的內容:一是通過規范管理制度、標準和流程等手段,實現數據在全校范圍內的共享和利用;二是通過建立起有效的管理機制,確保數據質量和數據安全。
在開展數據治理時,應遵循以下原則:一是堅持總體規劃、分步實施;二是堅持“誰主管誰負責”原則,明確職責,強化責任意識;三是堅持統一標準、統一管理,逐步規范;四是堅持“統一采集、集中存儲、集中管理”原則;五是堅持分級授權、分級管理原則。
數據治理是一個長期的、持續的過程,高校的數據治理應從業務發展和管理需求出發,對學校整體數據治理工作進行整體規劃。應從業務發展戰略、組織結構、人員能力和IT 基礎設施等方面進行深入分析,明確學校未來數年的總體發展目標和主要工作方向,在此基礎上進行數據治理總體規劃。
總體規劃應遵循以下原則:一是堅持頂層設計,構建完善的數據管理制度體系;二是堅持統一標準,建立統一的數據標準規范體系;三是堅持分步實施,按照“統一采集、集中存儲、集中管理”的原則,逐步規范數據采集、存儲和使用;四是堅持“分級授權,分級管理”的原則,明確職責分工;五是堅持統籌規劃、分步實施、突出重點、循序漸進。
高校應在總體規劃的基礎上制定并發布學校數據治理的相關制度、標準和規范等,以指導學校業務系統的數據采集和存儲工作。同時,各業務系統也要根據自身實際情況制定相應的數據治理制度和標準規范。以此為基礎,逐步建立起符合自身業務特點和發展戰略的數據治理體系。
根據數據治理的總體目標,從數據需求、數據標準、數據質量、數據安全和技術架構五個方面考慮,可將高校的數據治理分為五個階段。
1.確定總體目標。首先,在分析學校各業務系統和應用系統現狀的基礎上,對學校的數據需求進行分析,確定各業務系統和應用系統的數據標準和采集方案。其次,根據學校實際情況,確定各業務系統和應用系統的主要應用領域、系統類型、業務流程等。
2.建立數據標準。按照“統一采集、集中存儲、集中管理”的原則,建立學校的統一元數據管理標準,并將這些標準應用于各業務系統中。
3.制定數據采集方案。在建立統一元數據管理標準后,根據學校實際情況制定具體的采集方案,包括各業務系統采集接口規范、采集頻率等。
4.實施數據治理。按照規劃好的方案進行實施,逐步推進元數據管理標準和采集方案的落地,實現對學校各業務系統和應用系統中各類原始數據和基礎信息的統一管理。
5.開展效果評估。在實施過程中對治理效果進行評估,及時發現問題并解決問題,持續改進。
在開展數據治理工作時,還應遵循以下幾個原則。
1.統一標準、統一管理。高校數據治理工作應遵循國家和地方標準規范,實現標準的落地實施。以標準為基礎,結合實際情況,制定數據標準和數據質量管理辦法,規范數據管理,形成統一的數據字典和元數據目錄。
2.統一采集、集中存儲。高校應按照國家有關標準規范建立并完善學校基礎信息數據庫,建立基礎信息數據庫的目錄體系,并通過組織機構代碼、人事、財務等信息系統的采集來獲取和更新基礎信息數據。
3.集中管理、分級授權。高校應明確各部門在數據采集、存儲、管理和使用等方面的職責權限,明確各級部門在數據治理工作中的職責和權力范圍。采取分級授權、分級管理等方式,對全校范圍內的數據進行統一采集、存儲、使用和管理。
4.分級授權、分級管理。高校應根據學校發展戰略和業務實際需求,對相關部門的數據治理職責進行授權,明確各部門在學校層面的數據治理工作中所具有的管理權限,以及部門間協作分工機制。
根據數據治理相關理論,高校應從組織架構、制度流程、人員、工具等方面著手,構建一套完整的數據治理體系,制定相應的管理策略,通過管理策略來規范業務系統數據輸入、數據輸出和數據共享,確保數據治理體系的實施。
組織架構是數據治理體系建設的核心,負責統籌推進高校數據治理工作。結合高校自身實際情況,可采用職能部門式的組織架構。
在組織架構中,可設置數據管理委員會(以下簡稱“數委會”),由高校主要領導任主任,各職能部門主要負責人任副主任。數委會負責制定數據治理體系建設總體規劃、政策規范、規章制度,協調解決數據治理工作中的重大問題,統籌推進各項工作,確保各項數據治理目標的實現。同時,數委會下設辦公室(以下簡稱“數辦”),負責統籌協調各職能部門開展數據治理工作。數辦負責制定具體實施方案和計劃并組織實施;同時負責具體事務的協調工作以及監督、評估、考核等。各職能部門按職責分工開展相關工作。
高校的數據治理工作應建立在制度流程之上,其基本原則包括以下幾個方面。
第一,制度流程是一套規范,要求各部門按照該流程進行相關的業務活動;第二,制度流程是一個整體,應在執行過程中不斷優化;第三,制度流程需要協調各方利益,在實施過程中也需要不斷完善。
在此基礎上,還應明確各部門的職責范圍,以確保各部門履行好自身的職責;明確數據治理過程中的工作流程和工作環節,確保各部門能夠按照正確的流程開展相關工作;明確數據治理的時間節點及工作要求,確保數據治理工作有序開展;明確各部門的數據質量責任,以保證數據質量。
通過建立健全數據質量管理體系,以合理有效的管理方式來提高數據質量,保障信息系統正常運行和用戶對信息的使用。同時,建立科學規范的工作流程,以有效地保證數據質量。
數據質量管理流程主要包括:(1)制定標準規范;(2)建立工作小組;(3)確定審核方案;(4)執行審核方案;(5)反饋結果;(6)總結反思。在這個過程中,需要有相關部門參與到工作流程中來。通過制定標準規范來保證信息系統間的統一性和協調性;通過建立工作小組來監督各部門職責的履行情況;通過確定審核方案來確保各部門所提交數據的真實性和準確性。
本文通過對數據治理進行深入分析,闡述了高校數據治理的必要性和重要性,并從數據采集、數據管理、數據應用等多個方面分析了目前高校數據管理過程中存在的問題,并針對這些問題提出了相應的解決方法。同時,在對數據治理相關理論研究分析的基礎上,提出了將數據治理應用于高校信息系統中的思路,并在實際應用過程中取得了一定成效。通過建立一個規范、標準、統一、高效的數據治理體系,能為學校發展提供有力保障。當前國家正在大力推進“互聯網+”行動計劃,數據作為“互聯網+”行動計劃的重要組成部分和關鍵要素之一,將成為未來經濟發展最重要的資源。通過數據治理能為高校提供一個開放、共享、協同、高效的大數據平臺,使其成為學校可持續發展的重要動力。