[摘 要]關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘中一個(gè)飛速發(fā)展的領(lǐng)域,不斷得到發(fā)展和創(chuàng)新,而如何將這一技術(shù)應(yīng)用于教學(xué)管理和評(píng)價(jià)中, 需要做更深一步的開(kāi)發(fā)與研究。本文將關(guān)聯(lián)規(guī)則與高校課堂教學(xué)評(píng)價(jià)相結(jié)合,從評(píng)價(jià)信息庫(kù)中挖掘得出教師性別、年齡、職稱、學(xué)歷等因素和教學(xué)效果之間的內(nèi)在聯(lián)系,使關(guān)聯(lián)規(guī)則為教學(xué)提供理論支持。
[關(guān)鍵詞]關(guān)聯(lián)規(guī)則 教學(xué)評(píng)價(jià) 數(shù)據(jù)挖掘
一、引言
數(shù)據(jù)挖掘是當(dāng)前人工智能數(shù)據(jù)庫(kù)和信息決策研究的熱門領(lǐng)域[1-2],即從海量數(shù)據(jù)中用相關(guān)的理論和方法挖掘出有用的規(guī)律,關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘研究、開(kāi)發(fā)和應(yīng)用領(lǐng)域最重要研究方向之一,它用于確定數(shù)據(jù)集中不同領(lǐng)域或?qū)傩灾g的聯(lián)系,找出可信的、有價(jià)值的多個(gè)域之間的依賴關(guān)系。對(duì)當(dāng)前數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘大致包括:定義業(yè)務(wù)對(duì)象,即在經(jīng)驗(yàn)豐富的行業(yè)專家的指導(dǎo)下,明確實(shí)際業(yè)務(wù)的要求、數(shù)據(jù)的需要、目標(biāo)的要求以及算法的需要;數(shù)據(jù)準(zhǔn)備,即對(duì)數(shù)據(jù)進(jìn)行選擇、預(yù)處理和轉(zhuǎn)換;數(shù)據(jù)挖掘,即用適當(dāng)?shù)耐诰蛩惴ㄕ页鲭[藏于數(shù)據(jù)內(nèi)部的容易理解、預(yù)測(cè)性的知識(shí)和規(guī)則;結(jié)果評(píng)估,即采用可視化技術(shù)對(duì)模式進(jìn)行評(píng)估,剔除冗余或無(wú)關(guān)的模式,多次調(diào)整,使效果達(dá)到最佳;最后進(jìn)行分析決策。
二、關(guān)聯(lián)規(guī)則的基本模型
關(guān)聯(lián)規(guī)則反映一個(gè)事物與其他事物之間的相互依存性和關(guān)聯(lián)性[4-5]。如果兩個(gè)或者多個(gè)事物之間存在一定的關(guān)聯(lián)關(guān)系,那么,其中一個(gè)事物就能夠通過(guò)其他事物預(yù)測(cè)到。
(1)設(shè)I={i1,i2,…,im}為所有項(xiàng)目的集合,D為事務(wù)數(shù)據(jù)庫(kù),事務(wù)T是一個(gè)項(xiàng)目子集(T?哿I)。每一個(gè)事務(wù)具有唯一的事務(wù)標(biāo)識(shí)TID。設(shè)A是一個(gè)由項(xiàng)目構(gòu)成的集合,稱為項(xiàng)集。事務(wù)T包含項(xiàng)集A,當(dāng)且僅當(dāng)A?哿T。如果項(xiàng)集A中包含k個(gè)項(xiàng)目,則稱其為k項(xiàng)集。項(xiàng)集A在事務(wù)數(shù)據(jù)庫(kù)D中出現(xiàn)的次數(shù)占D中總事務(wù)的百分比叫做項(xiàng)集的支持度。如果項(xiàng)集的支持度超過(guò)用戶給定的最小支持度閾值,就稱該項(xiàng)集是頻繁項(xiàng)集(或大項(xiàng)集)。
(2)關(guān)聯(lián)規(guī)則是形如X?圯Y的邏輯蘊(yùn)含式,其中X?奐I,Y?奐I,且X∩Y=?覫。如果事務(wù)數(shù)據(jù)庫(kù)D中有s%的事務(wù)包含X∪Y,則稱關(guān)聯(lián)規(guī)則X?圯Y的支持度為s%,實(shí)際上,支持度是一個(gè)概率值。若項(xiàng)集X的支持度記為support(X),規(guī)則的信任度為support(X∪Y)/support(X)。這是一個(gè)條件概率P(Y|X)。即:
support(X?圯Y)=P(X∪)
confidence(X?圯Y)=P(Y|X)
(3)查找所有的規(guī)則 XY?圯Z具有最小支持度和可信度。
> 支持度,s,一次交易中包含{X、Y、Z}的可能性。
> 可信度,c,包含{X、Y}的交易中也包含Z的條件概率。
三、關(guān)聯(lián)規(guī)則的應(yīng)用
(1)關(guān)聯(lián)規(guī)則在學(xué)校教學(xué)評(píng)價(jià)中的應(yīng)用
1.選取數(shù)據(jù)。為了能發(fā)現(xiàn)教師本身的素質(zhì)與教學(xué)評(píng)價(jià)結(jié)果之間的內(nèi)在聯(lián)系,我們可以提取可能與評(píng)估結(jié)果相關(guān)的數(shù)據(jù),如教師的工號(hào)、職稱、學(xué)歷、年齡、教齡、教師的評(píng)價(jià)結(jié)果,建立數(shù)據(jù)挖掘庫(kù)。
2.預(yù)處理數(shù)據(jù)。由于選取的數(shù)據(jù)中可能包含噪聲、缺失值、無(wú)效數(shù)據(jù)等,所以必須先清理。
3.數(shù)據(jù)轉(zhuǎn)換。由于要挖掘的數(shù)據(jù)來(lái)自于不同的數(shù)據(jù)庫(kù)如教學(xué)管理系統(tǒng)、人事管理系統(tǒng) 。其信息的表示方式可能各不相同,如編碼、屬性、屬性度量等不一致,所以在這些數(shù)據(jù)進(jìn)入數(shù)據(jù)挖掘庫(kù)時(shí)需要進(jìn)行轉(zhuǎn)換。同時(shí),如果采用的是Apriori算法,還要將關(guān)系表轉(zhuǎn)換為相應(yīng)的事務(wù)庫(kù)。
4.數(shù)據(jù)挖掘。利用一種數(shù)據(jù)挖掘工具。如SQLServer2005的數(shù)據(jù)挖掘功能,可完成對(duì)數(shù)據(jù)的挖掘。
(2)關(guān)聯(lián)規(guī)則在課程設(shè)置中的應(yīng)用
學(xué)校中的課程設(shè)置是有規(guī)律的、循序漸進(jìn)的、即先基礎(chǔ)后專業(yè),但由于受到學(xué)校教學(xué)條件、師資不足等因素的影響,課程設(shè)置仍然存在相關(guān)課程的前趨后繼關(guān)系不清專業(yè)課程劃分不合理等許多問(wèn)題。那么如何合理地設(shè)置每個(gè)專業(yè)每個(gè)學(xué)期的課程是值得我們?nèi)パ芯康恼n題。利用關(guān)聯(lián)規(guī)則分析的挖掘技術(shù),我們可以從教學(xué)管理系統(tǒng)中選取各專業(yè)歷屆學(xué)生選課的數(shù)據(jù) 課程成績(jī)、授課教師、學(xué)生信息等相關(guān)數(shù)據(jù),經(jīng)過(guò)數(shù)據(jù)預(yù)處理和轉(zhuǎn)換后通過(guò)專門的數(shù)據(jù)挖掘工具挖掘出具有實(shí)用價(jià)值的信息找到影響學(xué)生成績(jī)的原因,并在此基礎(chǔ)上對(duì)課程設(shè)置做出合理安排除此之外,關(guān)聯(lián)規(guī)則分析還可應(yīng)用在學(xué)生成績(jī)預(yù)測(cè)學(xué)生生源分布、課程相關(guān)性、學(xué)生就業(yè)核心因素、心理問(wèn)題等方面。
四、結(jié)論
關(guān)于關(guān)聯(lián)規(guī)則的研究和應(yīng)用比較廣泛,把現(xiàn)有的關(guān)聯(lián)規(guī)則挖掘算法與教學(xué)評(píng)價(jià)問(wèn)題緊密結(jié)合起來(lái)是高校信息系統(tǒng)中重要的研究方向之一。從評(píng)教信息數(shù)據(jù)庫(kù)中挖掘得出教師性別、年齡、職稱、學(xué)歷等因素和教學(xué)效果間的內(nèi)在聯(lián)系,使關(guān)聯(lián)規(guī)則為教學(xué)提供理論支持。
參考文獻(xiàn):
[1] 教育部高教司.教學(xué)相長(zhǎng)—高等職業(yè)教育教師基礎(chǔ)知識(shí)讀本[M].北京:高等教育出版社,2005.
[2] 王朝莊.高職教育改革與發(fā)展應(yīng)解決的五個(gè)基本問(wèn)題[J]. 教育與職業(yè),2005,(35).
[3] 姜大源.職業(yè)教育學(xué)研究新論[M].北京:教育科學(xué)出版社,2007.
[4] JiaweiHan,數(shù)據(jù)挖掘概念與技術(shù) [M ] 范明, 孟小峰等譯,北京: 機(jī)械工業(yè)出版社,2005。
[5]魏萍萍,王翠茹,王保義,張振興。數(shù)據(jù)挖掘技術(shù)及其在高校教學(xué)系統(tǒng)中的應(yīng)用[J]計(jì)算機(jī)工程,2003, 7 ( 29) : 11 – 14。