劉 鵬,李 丹,孫思邈,黃 新,閆朝升
(1.黑龍江中醫藥大學人事處,黑龍江哈爾濱 150040;2.黑龍江中醫藥大學現代教育技術與信息中心,黑龍江哈爾濱 150040;3.黑龍江中醫藥大學醫學信息工程學院,黑龍江哈爾濱 150040)
教育大計,教師為本。全面加強教師隊伍建設已成為一項重大政治任務和根本性民生工程[1]。高校師資管理工作在教師隊伍建設中占有極其重要的地位。面對知識經濟時代,對于高校師資管理,應積極運用現代信息技術,探尋師資管理決策支持的有效實現途徑,為教師隊伍建設提供科學依據。隨著數據分析、數據挖掘、大數據等前沿信息技術的飛速發展及其應用日趨廣泛,我國加大了師資管理信息化的重視度,為師資的管理工作及其隊伍建設提出了更高要求[2]。目前,高校紛紛開展了人事管理信息化建設,應用了人事管理信息系統,提高了師資隊伍管理工作水平,積累了大量歷史性、細節性的師資建設數據[3-8]。在此基礎上,面對師資管理決策支持需求,將數據倉庫、數據挖掘等前沿信息技術應用于高校師資管理工作,旨在發現隱藏的、有價值的師資隊伍信息,為科學決策提供可靠依據[9-12]。
聯機分析處理(On-Line Analytical Processing,OLAP)利用上卷、下鉆、切片、切塊、旋轉等操作,從數據倉庫(或數據集市)中,快速、一致和交互地獲取多維度、多層次的觀測指標(即度量)數值,為用戶提供隱藏的、有價值的信息,進一步為數據挖掘、機器學習等過程提供數據預處理結果,以便發現更深層次、更有價值的知識[13]。目前,一些研究者已將OLAP 技術應用到教學質量、學生行為、教學狀況、招生就業等領域,驗證了基于OLAP 數據分析處理的快速性、便捷性和互動性[13-18]。如何有效地利用OLAP 技術,從大量的師資管理事務數據中,快速、便捷地發現隱藏的、有價值的師資隊伍信息,深度、全面、準確地把握師資隊伍建設狀況,支持科學、及時、準確的師資隊伍建設決策,成為高校師資管理工作的重要任務。因此,文中提出了基于OLAP 的高校師資數據分析處理系統。該系統具有開發周期短、開發成本低、運行維護便捷等特點,為其他職能部門的OLAP 系統設計與實現提供一種可行高效的方案與途徑。
該系統采用C/S(客戶機/服務器,Client/Server)模式,設計了高校師資數據聯機分析處理系統的體系結構,如圖1 所示。選擇C/S 模式的原因主要包括四方面。其一,系統用戶范疇主要界定為校領導、人事管理部門領導以及師資管理干事等三類人員,重點解決師資數據的多維分析需求。其二,基于C/S 模式的系統具有開發周期短、調試容易、網絡依賴度低等優勢。其三,系統的數據存儲環境易在局域網內進行部署。其四,系統屬于分析型系統,其使用的頻繁度低于操作型事務系統。

圖1 系統體系結構
由圖1 可知,系統的體系結構包括3 個層次,即客戶端、應用服務端和數據服務端。作為用戶與系統交互的前臺接口,客戶端提供前端界面,調用應用服務端的功能模塊。其中,多維分析界面用于生成和發送多維分析要求以及顯示分析結果信息,主要包括分析要求生成和分析結果顯示兩個子區域。上述兩個子區域分別對應著“維度和度量”選擇區和“多維數據表”顯示區。用戶利用多維分析要求生成子區域,選定維度、層次和度量,生成分析要求并將其發送給應用服務端。分析結果顯示子區域能夠多維多層地顯示應用服務端返回的結果信息,并進一步生成和發送分析要求(即用戶可以在分析結果顯示子區域中,通過鼠標的單擊操作,快速生成新的分析要求)。應用服務端是后臺數據服務端和前端界面之間的溝通橋梁,主要包括多維分析、結果輸出、數據加載和系統維護等功能模塊。作為系統的后臺數據存儲環境,數據服務端存儲著數據集市,為應用服務端提供多維度、綜合、緊湊的數據源。另外,為了支持系統管理,數據集市存儲著系統維護的相關數據,如用戶基本信息、數據加載日志等。
系統功能模塊主要包括多維分析模塊、結果輸出模塊、數據加載模塊和系統維護模塊等。
1)多維分析模塊:用于接收客戶端的分析要求,調用上卷、下鉆、切片、切塊、旋轉等OLAP 操作子模塊,生成查詢要求并將其發送給數據服務端,以及接收數據服務端返回的結果(即多維數據集)并將其發送至客戶端,顯示多維分析結果。
2)數據加載模塊:用于將外部數據源(如人事管理系統的后臺數據庫、Excel 數據文件等)的數據,通過抽取、轉換和載入(Extract-Transform-Load,ETL)過程,生成多維度、多層次的聚合數據,存入數據服務端的數據集市,生成數據加載日志。
3)結果輸出模塊:用于接收客戶端的輸出要求,生成Excel 文件,導出分析結果。
4)系統維護模塊:用于管理用戶基本信息、查閱數據加載日志、備份與恢復后臺數據等。
作為決策支持后臺的兩類數據存儲環境,數據倉庫(Data Warehouse)和數據集市(Data Mart)在信息需求和開發方法等方面存在著區別[13]。文中采用獨立數據集市,構建系統的后臺數據環境。上述選擇的主要原因在于:一方面,數據集市的多維結構能夠保證OLAP 操作與后臺數據存儲環境之間的有效銜接[19];另一方面,獨立數據集市可以由特定部門直接創建,而無需以數據倉庫為前提,降低了數據存儲環境構建費用,縮短了系統開發周期,有助于快速、高效地構建后臺數據存儲環境。
為了保障師資(尤其專任教師)隊伍建設決策的科學性、合理性和可行性,高校師資管理決策者所需進行的多維分析主要包括以專任教師數量和比例為目標值(即度量值),在年齡、學歷、職稱、學緣等基本要素維度上的分布情況分析以及多維組合分析,在教師狀態、學科、系列、性別等開放性維度上的變化情況分析以及多維組合分析,在時間維度上的多層次(如近1 年、3 年、5 年等)變化情況分析以及基于基本要素維度、開放性維度和時間維度的組合分析。依據上述的高校師資管理決策多維分析特點,文中設計了3 類維度,如表1 所示。

表1 高校師資數據分析的維度設計表
在上述的維度設計基礎上,該系統設計了基于星形模型的師資數據集市多維數據結構,如圖2 所示。該模型以事實表為中心,包含職稱、學歷、系列、學緣、年齡、學科、狀態、性別、時間9 個維度表。每一個維度表對應一個維度。事實表由每個維度表的外鍵(包括職稱碼、學歷碼、系列碼、學緣碼、年齡碼、學科碼、狀態碼、性別碼、時間碼等)和度量(包括人數和百分比)組成,支撐師資數據分析的多維性、多層性和快速性。其中,外鍵能夠連接維度表和事實表,支撐多維度、多層次的師資數據訪問。

圖2 數據集市的星形模型
圖3 給出了部分維度的層次設計情況。以“學科”維度為例,該維度分為三層,依次為頂層(即學科維度)、學科門類層和一級學科層。“系列”、“性別”和“時間”維度未進行分層處理。其中,“系列”維度具體包括教師、衛生、研究、實驗技術、工程技術、圖書資料、出版、檔案、會計、審計、統計等成員;“性別”維度包括男和女兩個成員;“時間”維度包括近10 年的具體年份。

圖3 部分維度的層次設計
通過上述設計,師資數據集市能夠支持9 個維度及其不同層次的度量值存儲和訪問,滿足多維度、多層次的數據分析需求。
為降低系統存儲空間消耗和系統維護復雜度,數據服務端不負責存儲細節性師資歷史數據。根據數據集市的多維數據模型,該系統利用人事管理系統的后臺數據庫、Excel 數據文件等外部數據源,通過數據抽取、轉換和載入,完成數據集市的數據加載。
針對職稱、學歷、系列、學緣、年齡、學科、狀態、性別、時間9 個維度,該系統調用與人事管理系統之間的接口程序,訪問人事管理系統的后臺數據庫,獲取相應字段的師資數據(見表2),生成細節性數據集,完成數據抽取。之后,根據維度表的內容以及事實表的外鍵和度量,聚合細節性數據,生成多維度、多層次的匯總性數據集,完成數據轉換。最后,將上述匯總性數據集存入數據集市的事實表,完成數據載入。

表2 維度與源字段的對應關系表
上述數據加載可以采用定期增量加載和事件觸發加載兩種模式。前者是指在特定時間(如一年)自動(或管理員手動)調用數據加載功能,利用外部數據源生成匯總性數據,并載入數據集市。后者是指通過在人事管理系統后臺數據庫的關系上定義觸發器,針對數據更新和插入操作(分別對應著更新觸發器和插入觸發器),在職稱晉升、新教師入職等事務發生時,執行數據加載,更新數據集市。后一種模式需要完善現有人事管理系統。因此,該系統采用定期增量加載模式。
該系統的實現采用了Visual Basic 6.0和Microsoft SQL Server 2008。
圖4 給出了“師資數據多維分析”界面,包含“維度和度量”選擇區和“多維數據表”顯示區。用戶在“維度和度量”選擇區,選定維度層次以及度量,并單擊【分析】按鈕。之后,系統將調用“維度顯示順序設置”界面,用于確定所選維度在多維數據表中的先后次序,如圖5 所示。根據顯示順序的選定情況,多維數據表將依次顯示學歷維、職稱維以及人數、百分比。最后,用戶單擊【確定】按鈕,獲取多維分析結果,詳見圖4 所示的多維數據表。該多維數據表呈現了“學歷維的一級層次→職稱維的二級層次”、近1年的專任教師人數和百分比情況。其中,在多維數據表的度量值中,“—”用于表示0 和0%狀態下的人數和百分比。通過圖4 所示的多維數據表,用戶可以獲取“研究生學歷→具體職稱級”的人數與百分比情況,如近1 年的“研究生→正高”和“研究生→副高”專任教師人數226 和326 以及百分比20.58%和29.69%。

圖4 系統多維分析界面(1)

圖5 維度顯示順序設置界面
在多維數據表中,維度項前面的“+”和“-”表征用戶可以在該維度項上進行下鉆和上卷操作,獲取更為豐富的分析結果。例如,在圖4 所示的多維數據表中,用戶可以分別單擊“+研究生”和“+非研究生”項,進行“學歷”維的下鉆操作,獲取“學位→具體職稱”的人數和百分比結果,如圖6 所示;或者用戶可以分別單擊“-高級”和“-非高級”,進行“職稱”維的上卷操作,獲取“研究生”和“非研究生”學歷維度層次上的“高級”和“非高級”職稱的人數與百分比匯總情況。

圖6 系統多維分析界面(2)
通過圖4 和圖6 對比,用戶可以根據近1 年的“研究生→正高”專任教師人數226 進一步發現,近1年的“博士→正高”、“碩士→正高”專任教師人數分別為158 和68,且前者是后者的兩倍以上。借助圖6 用戶可以發現,百分比居前三的分別是“博士→副高”(22.22%)、“碩士→中級”(21.31%)、“博士→正高”(14.39%)。
另外,“維度顯示順序設置”界面可以用于實現旋轉操作。在“維度和度量”選擇區結果未變化情況下,用戶可以利用“維度顯示順序設置”界面,調整維度先后次序,形成旋轉要求。例如,針對圖6 的多維數據表,用戶能夠發現“博士→正高”、“碩士→正高”、“學士→正高”的專任教師人數分布差異。鑒于上述的多維分析順序導致三項度量值過于分散而不利于結果的觀察,用戶可以利用“維度顯示順序設置”界面,調整維度顯示順序(即“職稱→學歷”),集中“正高→博士”、“正高→碩士”、“正高→學士”的度量值,提高多維度、多層次分析結果觀察的便捷性,有助于發現更有價值的師資隊伍信息。
師資隊伍建設是高校高質量發展的基石。文中針對高校師資管理決策支持工作,提出了基于C/S 模式和獨立數據集市的高校師資數據聯機分析處理系統設計方案,形成了實現途徑。該系統能夠快速、便捷地發現隱藏的、有價值的師資隊伍信息,為高校師資隊伍建設提供可靠的科學決策依據,并為部門級的聯機分析處理系統及其分析型數據環境的構建提供有益借鑒。