摘 要:數據挖掘技術已經在多個領域取得令人滿意的應用。在教育領域里隨著數據信息的不斷增長,把數據挖掘技術應用到高校信息管理中,可以促進教育體制的進一步改革、完善和發展。數據挖掘不僅可以發現教師自身素質與教學評價結果之間的內在聯系,還能應用在高校教育教學、考試評估的各個方面。還能應用在高校教育教學、考試評估的各個方面。
關鍵詞:教學質量管理數據挖掘粗糙集關聯規則
中圖分類號:TP311.13文獻標識碼:A文章編號:1674-098X(2011)07(b)-0167-01
1 引言
教學質量是職業院校賴以生存和發展的基礎,因此,教學質量的保證和提高是學校發展的永恒主題。目前,隨著教育管理信息化的不斷發展,如何充分有效地利用好數據資源也成為了高校教學管理的重要研究熱點。將數據挖掘技術應用于職業教育中,可從大量的教育數據中發現隱藏的、有用的知識來指導教育、發展教育,改善職業教育中的教學效果,從而有效提高職學生的職業與文化素質。
2 數據挖掘概念與技術
2.1 什么是數據挖掘
數據挖掘(Data Mining)是20世紀90年代以來發展起來的數據庫系統和數據庫應用領域一個欣欣向榮的前沿學科,是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的但又是潛在有用的信息和知識的過程。通過數據挖掘可以幫助決策者尋找規律,發現被忽略的要素,預測趨勢,進行決策。它是對數據內在和本質的高度抽象與概括,是對數據從感性認識到理性認識的升華,是建立在數據庫、人工智能、機器學習、神經網絡、統計學、模式識別、高性能計算等技術基礎上的一門新興技術。
2.2 數據挖掘的過程
數據挖掘過程一般由三個主要的階段組成:數據準備、挖掘操作、結果表達和解釋,整個挖掘過程是一個不斷反復的過程。比如,用戶在挖掘途中發現選擇的數據不太好。或使用的挖掘技術產生不了期望的結果。這時,用戶需要重復先前的過程。甚至從頭重新開始。
2.3 常用的數據挖掘方法
數據挖掘是從人工智能領域的一個分支,機器學習發展而來的,因此機器學習、模式識別、人工智能領域的常規技術,如聚類、決策樹、統計等方法經過改進,大都可以應用于數據挖掘。人工神經網絡方法、粗糙集理論方法、關聯規則方法、遺傳算法方法、決策樹方法及統計分析方法都是數據挖掘的常用方法。
3 高職教學質量管理中的數據挖掘技術
3.1 粗糙集理論在教學質量管理中的應用
粗糙集(Rough set)理論是由波蘭數學家Z.Pawlak在1982年提出的一種處理模糊和不確定信息的數據分析工具,它能有效地分析和處理不精確、不一致、不完整等多種不完備信息,并從其中發現隱含的知識,揭示潛在的規律。它的一個重要特點是具有很好的定性分析能力,即無需預先給定某些特征或屬性的數量描述(如統計學中的概率分布、模糊理論中的隸屬函數等),而直接從給定問題的描述集合出發,通過不可分辨關系和不可分辨類來確定問題的近似域,從而找出問題的潛在規律,此方法被證明特別適合于數據相關性、相似性的查找,發現數據模式,從數據中提取規則等。在教學質量管理系統中,為了得出教學質量評價的規律,必須對采集的眾多數據進行處理,有些數據是關鍵的,獲取這些數據有助于管理的成效,在實際教學管理中有很大的價值。將粗糙集理論應用到教學質量管理中,主要針對的是教學質量評價主體的指標體系不合理,一般由人為確定或參考其它院校的指標,而這樣得到的結果并不能真實反映本校教學質量的實際情況。現在有部分高校已經開始利用一些數據挖掘技術對教學質量評價進行研究,這種評價研究是雙向的,既要評價學生的學習,也要評價教師的教學質量。采用的技術手段是數據挖掘,方法是數據挖掘技術的粗糙集算法。根據模糊集的FCM聚類方法,對教學質量評價中的數據進行了聚類分析,然后利用粗糙集的數據挖掘功能挖掘出了教學質量評價中各個評價指標的不同權重,這兩種理論的結合為提出的教學質量指標體系提供了理論依據。
3.2 關聯規則在教學質量評價中的應用
關聯規則是描述數據庫中數據項之間某種潛在關系的規則,其目的是找出數據庫中隱藏的關聯網。決策者可以通過對支持度和置信度的設置,感興趣模式以及算法的選取,有效地加以利用。常用的關聯規則算法有Apriori算法,多層次關聯規則挖掘,多維關聯規則挖掘,基于約束的關聯規則挖掘等。關聯規則在教學質量評價中是應用最多的一種方法,經常被應用到教學質量中的各個方面。由于教學質量評價中所涉及的內容定性的多而定量的少,只能給出定性的標準,并且標準彈性較大,加之評價者因對標準把握上存在偏差及主觀原因,這就給教學質量評估工作帶來一定的難度。運用關聯規則對課堂教學評價進行挖掘,挖掘信息倉庫中一些隱含的、事先未知的、具有潛在用途的信息,對提高教學管理和教學質量能起到很好的指導作用。在對教師的教學質量評價中,運用數據挖掘中的關聯規則分析高校教學管理中教師信息之間的隱藏關系,對數據進行了標準化處理,采用優化的Apriori算法進行數據挖掘。通過事例分析教師的教學工作量和發表論文之間的隱含關系,可為教學管理提供決策支持,用戶可以通過自制的數據挖掘系統指定自己感興趣的挖掘項目范圍,系統經過過濾事務數據庫,來縮小數據庫中要挖掘的事務數量。系統采用經典Apriori算法進行教學評價數據挖掘幾乎不會出現算法的瓶頸問題,同時能夠達到很好的挖掘目的,并最終用于決策支持。將關聯規則應用于教師教學評價系統中,探討教學效果的好壞與老師的年齡、職稱、學歷之間的聯系,課堂教學效果與教師整體素質關系,合理配置班級的上課教師,使學生能夠較好的保持良好的學習態度,從而為教學部門提供了決策支持信息,促使更好地開展教學工作,提高教學質量。
4 結語
教學質量高低是教學活動的成效性外在表現形式,而良好的教學評價對教學質量有導向、促進、激勵及調控功能,是學校教學管理工作的重要組成部分,是評價教學的主要手段。隨著數據挖掘理論的研究和應用的不斷深入,教學評價的公平、公正、合理、高效離不開數據挖掘理論的支持。利用數據挖掘方法對教學評價數據進行數據挖掘,保證了教學評價的科學性。如何從評價教師課堂教學質量的大量數據中挖掘出數據間的關系,對改革教學方式,優化培養模式,為教學決策提供科學依據及有效的支持都具有重要的意義。
參考文獻
[1] 楊曉,張迎新.Apriori算法在消費市場價格分析中的研究與應用[J].北京工商大學學報(自然科學版),2009(3).
[2] 焦亞冰.數據挖掘中關聯規則Aprioir算法的改進[J].西安文理學院學報(自然科學版),2008(3).
[3] 丁衛平,王杰華,管致錦.基于數據挖掘技術的教學評估智能輔助決策平臺的設計與實現[J].電化教育研究,2009(4).