文/林鐄
我校教務管理系統實現了學生管理、師資管理、教學計劃管理、智能排課、網上選課、考試管理、成績管理、教學評價、畢業審核等各項教務管理工作,提高了教務管理的效率,功能多停留在日常事務處理階段,運行數據只是堆積在系統中,沒有得到有效利用,數據的統計分析功能大多局限于對學分、績點、成績分段的統計上,挖掘隱藏在數據背后的有用信息的功能還很欠缺。本文構建數據倉庫,利用OLAP技術進行多維數據分析,為用戶提供切塊、切片、鉆取、旋轉等多種分析手段,對數據進行多角度的統計分析,提供有用的信息幫助教學決策。
管理系統通常是對一個或一組記錄進行查詢或修改操作,提供特定的數據管理和應用服務,隨著數據庫中數據的不斷增長,人們已經不滿足于簡單的事務處理,而是對累積的大量數據進行分析,利用各種工具對數據進行多種方式的處理,以更好地支持決策分析,從而形成了數據倉庫技術(Data Warehousing,簡稱DW)。數據倉庫是一個面向主題的、集成的、相對穩定的、隨時間變化的數據集合,支持管理決策的數據集合。
A(維度1,維度2,...維度n;變量1,變量2,...變量n)是一個名稱為A的n維數組,稱A為多維數據模型。“維”是人們觀察變量(度量指標、事實)的一個特定角度,是考慮問題時的一類屬性,最能反映分析意圖和角度,觀察數據需要的粒度稱為維的層次,維一般包含著層次關系,如時間維的層次可以有日、周、月、季、年等不同的維層次。
維表和事實表的設計是構建數據倉庫的關鍵問題,其設計的好壞直接影響到數據倉庫的響應時問和分析的效果。事實表至少包含兩部分:
(1)多維數據模型的度量指標值;
(2)主鍵和若干與維度表主鍵連接的外鍵。
維表是存放維度信息的基本表,包含維度名稱和維層次等細節信息。
ETL是Extract(提取)-Transform(轉換)-Load(加載)的縮寫,從源數據庫抽取出來相關數據,對進入數據倉庫的數據進行檢查、排錯和處理,是源數據轉化為分析數據最重要的一步,提取和加載是轉化的輸入和輸出,這個過程其核心是數據的轉換,包括數據類型轉換、格式轉化、字段解碼和數據清洗等。
聯機分析處理 (Online Analysis Processing,簡稱OLAP)利用存儲在數據倉庫中的數據進行切片、切塊、聚合、鉆取、旋轉等各種分析動作,使分析人員、管理人員或執行人員能夠從多種角度進行深入觀察,并以直觀易懂的形式將分析結果返回給用戶。
教務分析系統以教務系統的數據為基礎,經過數據提取、轉換、加載等操作,整合數據并將其轉化為按照主題組織的信息,這些信息經過OLAP技術的分析后,可以表達出數據內部的各種關聯。體系結構圖如圖1所示。
根據業務需求分析,教學數據倉庫各主題幾乎都與學生、教師、課程、專業相關,所以將這些教學管理中的實體作為維表來處理。教學數據倉庫中包含的維表有學生維表、教師維表、課程維表、專業維表、地區維表、民族維表、部門維表,職稱維表,學歷維表等。實現的分析功能包括招生信息分析、學籍異動分析、英語四六級成績分析、選退課分析、教師信息分析和學評教分析。
分析近年來生源結構的變化,通過分析性別(男、女)、省份(省內、省外)、民族(漢族、少數民族)、報到率、分數(最高分、最低分、平均分)不同專業招生數據的變化,了解不同因素隨時間的變化趨勢,判斷生源合理性,為招生決策提供支持。
分析各學院和各專業的轉專業情況,通過轉入人數、轉出人數、凈轉出人數、轉入率和轉出率,為學校專業開設提供依據。對在校生的學籍異動類別進行多維分析,了解學生學籍異動的主要原因、異動人數與專業人數的比例,為學籍管理提供參考依據。

圖1:體系結構圖
分析英語四六級考試各年級、各專業的通過人數和通過率,成績與生源地、高考成績等的關系,為英語分層次分班教學合理的建議。
分析各學院開設課程的課程預設容量、選課人數、課程性質(選修、必修、課外、實踐)、退課人數、教師職稱、教師學歷等屬性,為在選課期間及時調整課程容量、課程開設、課程停開提供依據,同時對教師起到督促作用。
分析專任教師的職稱結構(正高、副高、中級及以下)、學位結構(博士、碩士、學士及以下)、年齡結構(56歲以上、45-55歲、36-45歲、35歲及以下)、學緣結構(本校、外校境外、外校境內)等,為學校人才引入、隊伍建設提供數據支撐。
分析教師學歷(本科、碩士、博士)、職稱(中級、副高、正高)、性別(男、女)、課程性質(選修、必修等)與教學評價結果之間的關系,發現這些因素跟教學評價結果好壞是否有直接的關系;以及不同時間段同一個教師學評教數據的變化并將結果反饋給教師,促進其反思提高自身的教學水平。
利用數據倉庫和 OLAP技術建立的教學管理系統可使教學管理走上系統化、科學化的軌道。該系統可以從積累的海量歷史數據中提取出有價值的信息,為教學部門決策者和管理者提供了多角度、多層次查詢分析數據的功能。