嚴衛
(常熟理工學院計算機科學與工程學院,江蘇常熟 215500)
基于數據倉庫的高校就業信息管理系統
嚴衛
(常熟理工學院計算機科學與工程學院,江蘇常熟 215500)
在現有的高校學生就業信息管理系統基礎上,增設了就業信息數據分析模塊,該模塊具有基本信息管理、后臺信息管理、維度分析、就業趨勢預測等功能.利用SQL Server 2005數據倉庫技術創建多維數據模型,實現多維分析.
就業;模塊;數據倉庫
原就業信息管理系統作為就業平臺,主要是獲取信息和發布信息,功能比較簡單.筆者在現有的系統上開發了一個數據分析模塊,運用數據倉庫及OLAP技術對高校就業信息數據進行分析和處理,增強高校就業信息管理系統處理分析數據的功能.
1.1 高校就業信息管理系統的功能結構
現有的高校就業信息管理系統由角色權限管理,單位信息管理,招聘信息管理,學生信息管理,供需見面會管理,校園專場招聘管理,信息發布新聞管理,專家庫管理等部分構成.增設就業信息數據分析模塊后的高校就業信息管理系統功能結構如圖1所示.
1.2 就業信息數據分析模塊的功能結構
高校就業信息分析模塊的功能包括基本信息管理、后臺信息管理,維度分析以及就業趨勢四部分(如圖2).
(1)基本信息管理:主要包括單位性質、就業行業信息、就業分布信息、教育情況信息、學生基本情況等信息的管理操作.
(2)后臺信息管理:主要是管理員對于已審核通過的用戶做權限增加或減少的設置以及賬號管理等操作.
(3)維度分析:按照實際需求情況,對數據進行多方位的維度分析,最后以報表的形式展現出來.
(4)就業趨勢預測:詳細分析就業信息,通過數據導航和靈活的OLAP分析對其進行趨勢預測.

圖1 高校就業信息管理系統功能結構圖
1.3 就業信息數據分析模塊的數據處理流程
就業信息數據分析模塊的處理流程是:把需要處理的數據庫和外部數據通過數據整理,進入ODS數據庫元數據,然后運用OLAP的多角度分析后,最后以報表形式提供給決策者.數據處理流程如圖3所示.
操作數據源是整個系統的數據基礎也是系統體系結構的最底層.一般來說,其來源是基于OLTP(On-Line Transaction Processing)的操作性數據.
ODS(Operational Data Store)數據庫維持著一個分析型的環境,具有面向主題的特征,它由操作型環境中分散的DB記錄經過濾后形成ODS系統的記錄系統,向ODS系統中提供數據.
OLAP分析服務器是一個經過特殊設計,用于支持和管理多維數據結構的高性能、多用戶的數據處理引擎.多維數據結構是將原始數據按維度進行整理后所得的結果,其中的數據項訪問需根據定義該項的維度成員來訪問.該多維數據結構能夠靈活、快速地處理原始數據,且對各種查詢具有一致的響應速度. OLAP的應用過程就是“數據一信息一知識一計劃一行動”的過程.
1.4 就業信息數據分析模塊的邏輯模型設計
就業信息數據分析模塊的邏輯模型采用星型模型.星型模型是由中心向外輻射的結構,一個主題對應一個星型模型,模型中心的對象稱為事實表(Fact Table),與之相連的對象稱為維度表(Dimen?sion Table).一個簡單的星型模型由一個事實表和若干個維度表組成,如圖4所示.
事實表是由維度表的主鍵和度量值組成的,在做事實表時要注意兩點:第一、事實表中要記錄數據分析用到的所有基本數據.第二、數據的記錄方式要以業務需求為準,有什么樣的主題就要做什么樣的事實表.事實表中除了包括那些用于分析的數據外,還有一個或多個外鍵,他們是聯系事實表和數據維度表之間的紐帶.表1是畢業生事實表.
維度表中存放的是對事實表中度量的描述,里面的信息包括字段名稱、數據類型、長度、主鍵、是否允許空、字段說明.每張維度表除包含每一維的主鍵,還有說明該維的一些屬性字段,維度表中的數據由維度表主鍵和描述實體的文本數據組成.
在就業信息分析模塊(圖5中)的邏輯模型結構中,“畢業生”事實表位于模型連接的中心,存儲了大量的數據,在“畢業生”事實表的周圍分別是“性別”、“專業”、“民族”、“畢業去向”、“單位名稱”、“學歷”、“培養方式”、“政治面貌”、“單位所在地”、“學籍變動”、“畢業生”等11個維度表.

圖2 就業信息數據分析模塊的功能結構圖

圖3 數據處理流程

圖4 星型模型結構示意圖

圖5 就業信息分析模塊的邏輯模型

表1 畢業生事實表
通過就業信息數據分析模塊,可以實現數據導航和靈活的OLAP分析,包括切片、切塊、上鉆、下鉆和交互式圖表,為決策者提供了友好的圖形界面,為數據探查和決策制定提供了一個直觀的環境,使得各個層次的分析數據都可以流暢的在決策者面前呈現.并可提供多種可視化方式來展示分析結果.數據分析效果如圖6、圖7.
本文對高校就業信息管理系統進行了改進設計,增加了一個就業信息分析模塊,將數據倉庫與OLAP技術應用于高校就業信息數據分析中.和原來的系統相比,功能更加完善實用,尤其是對海量數據可以進行多維分析,為高校管理層提供準確的信息.

圖6 學科專業數據分析效果圖

圖7 圖形報表
參考文獻:
[1]InmonW H.數據倉庫[M].北京:機械工業出版社,2006:20-24.
[2]胡耀民,余明輝.商務智能系統模型的研究和應用[J].計算機與現代化,2010(3):58-61.
[3]陳京民.數據倉庫與數據挖掘技術[M].北京:電子工業出版社,2007:93-100.
[4]Ralph K,Joe C.The DataWarehouse ETL Toolkit:Practical Techniques for Extracting,Cleanin[M].W iley,2004:29-48.
[5]張中平,徐佑軍.OLAP技術在電信領域中的應用[J].計算機工程與設計,2005,26(7):1950-1952.
[6]吳遠紅.ETL執行過程的優化研究[J].計算機科學,2007,34(1):81-83.
[7]朱德利.SQLServer 2005數據挖掘與商業智能完全解決方案[M].北京:電子工業出版社,2007:77-80.
[8]陳文偉,黃金才.數據倉庫與數據挖掘[M].北京:人民郵電出版社,2004:54-55.
[9]李紅良.智能決策支持系統的發展現狀及應用展望[J].重慶理工大學學報:自然科學版,2009,23(10):140-144.
[10]金芳.淺談數據倉庫技術在電信行業中的應用[J].長春大學學報:自然科學版,2009,19(6):68-69,75.
An Analysis of College Employment Information Data Based on the Data Warehouse Management System
YANWei
(School of Computer Science and Engineering,Changshu Institute of Technology,Changshu 215500,China)
Based on the study of College Employment Information Management System,the employment informa?tion analysismodule is added,which is capable ofmanaging basic information and background programs,analyz?ing data in various dimensions as well as forecasting career trends.Multi-dimensional analyses are realized by means of SQL Serve 2005 data warehouse technology ofmulti-dimensional datamodel.
employment;module;data warehouse
TP311.13
A
1008-2794(2012)08-0114-04
2012-05-21
嚴衛(1980—),男,江蘇常熟人,助理實驗師,碩士,研究方向:計算機技術、數據挖掘.