王 妍
(滄州醫學高等專科學校,061000)
當前計算機技術快速發展,信息時代的大潮已經迎面而來。在此背景下,教育信息化的程度也在不斷加深,教育機構的信息化建設水平也不斷提高,各級教育機構也都相應建立了教育信息管理系統,來提高教育的管理水平。但是在各級教育機構目前運行中的教育信息管理系統也存在著諸多問題,如各級管理部門均設有自己的管理系統,各系統之間缺乏聯系;信息化程度仍然有限,手工作業的業務仍占很大比例。各級教育系統內產生的大量的數據也不能夠進一步加以利用,來為上級教育管理部門的決策提供相應的支持。教育管理部門往往在進行決策前,要對各級教育機構的數據系統進行查詢并進行分析。這樣的結果導致增加了教育管理部門的工作量,并且容易造成計算錯誤,對決策的質量也造成了不利影響。
由此,本文提供了基于數據倉庫的教育決策支持系統的模型,建立這一系統模型,就是希望能給教育管理部門提供一個能夠有效滿足其開展各項業務需求,使教育管理部門能夠對管轄范圍內的教育動態及時進行掌握,并據此制定相關的發展政策,探討發展趨勢,提出對策建議等提供有效的數據信息支持,使政策的制定依據更加可靠。
運用數據倉庫的數據挖掘技術構建的教育決策支持系統,主要是考慮層次結構的模型。模型中的教育資源庫分為五層:以各地的教育資源數據庫為基礎的數據庫層;將各地傳送過來的教育信息進行加工與處理的轉換層;儲存所有信息的基礎層;對數據進行綜合分析的分析處理層;將分析結果向用戶進行展示的展示層。
數據源是整個系統的分析對象,也是系統運行的基礎部分,一般是將教育信息系統的內部信息以及傳送過來的外部信息一同包括在內。
這一部分主要是對數據進行重新的清理,以確定數據的儲存方向和儲存模式,同時對分類的數據開展組織存儲工作。根據數據的來源和歸屬范圍,可以將數據倉庫分為教委級和各部門級兩級數據倉庫。在日常的管理工作中,主要負責數據的安全保障,歸檔、備份等一系列基礎性工作。
OLAM與OLAP模塊,也就是實時聯機發掘和實時聯機分析部分。這兩種服務器均以數據分析和展現作為工作基礎,根據設定的不同主題方向而發展起來的數據集市部分。這一模塊采用數學運算與分析的形式,來匯總存儲在數據庫中的相關數據,并通過采用清晰直觀的匯報形式,便于用戶了解分析的結果。
前端工具主要提供數據分析,生成報表和為用戶提供查詢等功能,以及根據數據特點而需要使用的其他數據處理工具。數據工具在工作中對應OLAP服務器進行使用,而數據挖掘工具與報表工具形結合,可以基于數據倉庫和OLAP服務器提供服務。
數據倉庫是為用戶提供數據支持的數據集合。在原有的教育信息管理工作中,不同級別的教育管理部門都擁有屬于自己的數據庫,在運行過程中,還產生了大量的數據,由于系統不同,其數據結構也不一致,這樣就嚴重影響了數據的管理和信息的交流過程。通過建立一個統一的數據倉庫進行管理,為決策前的數據分析提供了技術上的便利。但是在數據統一之前,需要通過對數據進行重組整合的方式,來保障數據的有效發揮。教育分析需求會隨著時間的變化而不斷發生變化,因而在數據倉庫中,數據存儲應選擇分域的形式,數據組織和存儲單元的規模不應過大,以滿足數據倉庫運行對靈活性的需求。常見的信息系統中具有的多種特性,在系統的設計中都要有所體現。例如在教育管理系統中可以將相關的業務根據不同的主題進行分類,如設備、人員、賬務、產業等。人員信息的管理要對人員的各項基礎信息與附加信息等進行記錄管理。
教育知識發現是從原有的教育知識管理基礎上發展而來的,其含義是指從原來的大量不完整模糊教育數據中,將其中有效的、可以潛在利用的、新鮮的數據進行理解的一個思維過程。教育知識發現也是通過利用分析形式,通過在大規模的數據中進行分析計算,從而發現數據間關系,并通過這種關系做出相應的決策或預測的進程。教育知識發現中的步驟有著相互影響,并不斷變化的特征。教育知識發現的發展形態是一種螺旋上升形態。而教育知識發現的進程中,主要有以下幾個步驟:
第一,教育背景理解。教育的背景理解是指在開展知識發現這一流程之前,理解的實施者對這一領域與目標進行的自身深化理解過程。預選知識和學習的目標對象是實施者需要了解的主要內容部分。這一步驟能夠為接下來的知識發現過程進行有效的指導。
第二,選擇目標數據集。該步驟是要選出與運算中相關的數據,并通過聚焦的模式在教育數據庫尋找相關的數據集進行查詢調取。
第三,數據預處理。數據預處理的目的是使獲取數據的質量得到有效保證,并提高數據挖掘的效率與準確性,因此數據預處理要對數據進行清洗、集成、抽取、轉換與裝載等處理。
第四,確定合適的功能與算法。要通過確定系統任務的目標,并根據數據所反映出的特征,選擇出相匹配的計算方式以保證數據處理的準確性、合理性。一般的算法包括決策樹法等多種方式。
第五,知識發現過程。這一步驟是對已經經過加工的信息進行提取,根據特殊要求進行匹配選擇,并且將相匹配的數據進行集合的過程。
第六,模式評估。OLAM和OLAP的過程中模式紛繁復雜,但并不是每個模式都能夠適應實際使用的需要,因而就要對模式的基礎進行相應的評估,選擇適用的模式,將不需要的模式去除。
第七,知識表達。將通過分析得到的結果以易于理解的方式展現給用戶,例如圖表報表等形式。
在教育知識的發現過程中,用戶在評價相關的教育信息時,要嚴格遵守相關流程,并保證數據的準確性。不遵守相關流程的評價結果會導致決策不準確,甚至導致評價過程失敗,需要重新進行評價流程。
OLAP的技術核心是“維”的概念,也就是人們觀察數據的角度。這一技術可以有效的幫助教育決策者在分析觀察數據時,能夠從多個角度進行出發,以期更加全面的從多角度來理解數據信息,為決策提供有效的支持。這一系統還能夠有效的對各個主題實時計算與分析,從而更好的為決策服務。
第一,數據統計。在這一部分的操作過程中,系統能夠實現在在各種統計字段上進行各項基本的統計操作,并得出相關結果,通過這一功能,可以對需要研究的問題做出基本問題分析。
第二,建立智能函數。通過建立相應的函數體系,能夠對在時間上較為敏感的數據進行相關的分析,以便通過變化規律進行相關決策的制定。
第三,概念類描述、特征化與區分。實施這一步驟,能夠有效的對實現對數據分類匯總分析結果的精確化描述,最終使管理部門進行查閱時,能夠通過簡介與描述更加清晰的找到數據之間的對比關系,進而為決策提供有效的支持。
第四,關聯分析。這一步驟的目標是通過找到關聯規則,將屬性以及屬性值在數據中出現的條件揭示出來,并通過系統的分析功能,發現并且體現出教學活動與現象之間的內在關聯,并通過這一聯系,對發生的現象進行下一步推測,并根據推測結果進行相關策略的制定。
第五,分類與預測。這一步驟是通過預定的數據挖掘算法對數據進行自動分析,這一分析活動受到的人工影響非常小,主要是為了獲得建立在數據挖掘基礎上的預測服務,從而為接下來的教育活動方向進行相關的預測。
第六,孤立點分析。這一步驟是對在數據集中發現的與其它數據特征不同的數據進行分析。通過進行分析,能夠有效的發現異常情況與事件,從而對即將發生的情況及時采取應對策略。
第七,演變分析。這一分析模式適用于根據時間、序列或周期等因素進行的數據分析過程,并在其中發現相關規律,來對接下來管理方向的發展進行有效預測。進行這些因素的深入分析,可以有效找出數據變化的規律,從中得到能夠對決策產生重要影響的因素與信息,來發現相關問題的產生原因,并對癥下藥,制定相關的解決方案。
這一功能通過多種服務方式,幫助用戶展現、提取相應信息,并且幫助用戶進行不同程度的分析,為用戶的使用提供了便利。
隨著時代的發展,教育管理的內容不斷增加,對于信息化的要求也在不斷提高。本文為提高教育管理信息化提供了一個可以供各級教育決策部門迅速提取信息,及時掌握各級學校運行情況,并據此制定相應決策,從而提高教育信息化管理能力的數據庫系統模型,并希望其為教育管理部門不斷提高決策水平,最終實現教育管理現代化,提高教育發展水平提供有力的技術支持。
[1]馮霞,陳朝東.數據倉庫在教育管理中的應用探討[J].教育信息化,2003(7)
[2]李艷艷.數據倉庫與高校教育管理信息化[J].中國教育信息化·高職高教,2008(8)
[3]林琳.基于數據挖掘的教育管理決策支持系統模型[J].計算機光盤軟件與應用,2011(3)