999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于葉貝斯分類的個性化學(xué)習(xí)風(fēng)格研究

2014-11-19 13:25:06繆廣寒
電子技術(shù)與軟件工程 2014年20期
關(guān)鍵詞:數(shù)據(jù)挖掘

繆廣寒

摘 要 利用數(shù)據(jù)挖掘技術(shù)中的貝葉斯分類技術(shù)可以對大量學(xué)習(xí)數(shù)據(jù)進行分析,確定其學(xué)習(xí)風(fēng)格,完善個性化特征提取,為系統(tǒng)進一步的學(xué)習(xí)推薦與教學(xué)引導(dǎo)提供有效依據(jù),進一步的提高學(xué)習(xí)質(zhì)量與效率。

【關(guān)鍵詞】葉貝斯分類 數(shù)據(jù)挖掘 個性化學(xué)習(xí) 學(xué)習(xí)風(fēng)格

網(wǎng)絡(luò)環(huán)境下的個性化學(xué)習(xí)是以學(xué)生作為教育系統(tǒng)的中心與教育服務(wù)主體。在個性化的教育系統(tǒng)中我們在營造數(shù)字學(xué)習(xí)氛圍的同時要強調(diào)并堅持學(xué)生的主體地位,開展個性化學(xué)習(xí),把它看作是一種探索式性、實踐性、創(chuàng)造性的學(xué)習(xí)。實現(xiàn)網(wǎng)絡(luò)個性化學(xué)習(xí)的關(guān)鍵在于根據(jù)學(xué)習(xí)者的信息數(shù)據(jù)分析提取個性化特征,進而實現(xiàn)對學(xué)習(xí)者的個性化推薦或教學(xué)指導(dǎo)。

本文針對目前網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)中存在的個性化單一與實現(xiàn)難度大的問題,利用葉貝斯分類算法解決學(xué)習(xí)風(fēng)格分類問題,讓學(xué)生更深入的了解自己的學(xué)習(xí)模式與需求,實現(xiàn)真正自主式、個性化學(xué)習(xí)。

1 數(shù)據(jù)挖掘與分類

1995年,美國計算機學(xué)會(Association for Computing Machinery ,簡稱ACM)組織提出了數(shù)據(jù)挖掘(Data Mining)概念。數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先未知的、但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘又稱為數(shù)據(jù)庫中知識挖掘(Knowledge Discovery in Databases)、知識提取(Knowledge Extraction)、數(shù)據(jù)采礦等。

數(shù)據(jù)挖掘是一個跨學(xué)科技術(shù)領(lǐng)域,它是數(shù)據(jù)庫技術(shù)、統(tǒng)計學(xué)、人工智能、數(shù)據(jù)可視化、信息提取、并行計算和分布式計算等多個學(xué)科結(jié)合的產(chǎn)物。發(fā)現(xiàn)潛在未知的規(guī)則,是數(shù)據(jù)挖掘的重要特征也是它的目標(biāo),它與數(shù)據(jù)分析的差別在于數(shù)據(jù)分析通常從一個假設(shè)出發(fā),通過建立方程、模型來驗證假設(shè)是否成立,而數(shù)據(jù)挖掘則是直接挖掘信息之中隱藏的規(guī)律,發(fā)現(xiàn)新的知識。

分類是常用的數(shù)據(jù)挖掘手段之一。它是將一組組個體分門別類的歸入預(yù)先設(shè)定的幾個類中。分類的目的是建立一個分類模型,該模型能把數(shù)據(jù)庫中的數(shù)據(jù)項映射到類別中的某一個類別。常用的分類方法有:決策樹分類方法、貝葉斯分類方法和規(guī)則歸納方法。

2 應(yīng)用葉貝斯分類算法判定學(xué)習(xí)風(fēng)格

學(xué)習(xí)風(fēng)格是指學(xué)習(xí)者一貫持續(xù)的帶有個性特征的學(xué)習(xí)方式,它是學(xué)習(xí)傾向和學(xué)習(xí)策略的總和。學(xué)習(xí)風(fēng)格是個體在長期的學(xué)習(xí)過程中逐漸形成的,受特定的家庭、教育和社會文化的影響,通過個體自身長期的學(xué)習(xí)活動而形成,具有鮮明的個性特征。心理學(xué)認(rèn)為人有七種學(xué)習(xí)風(fēng)格:Linguistic(語言)、Logical(邏輯)、Visual(視覺)、Musical(音樂)、Kinesthetic(動覺)、Intrapersonal(內(nèi)省)與Interpersonal(人際)。使用葉貝斯分類算法我們可以通過分析學(xué)習(xí)記錄,獲得學(xué)生的學(xué)習(xí)風(fēng)格。 葉貝斯分類算法基于貝葉斯定理,應(yīng)用于文本分類時,通過計算文本屬于每個類別的概率.將該文本歸為概率最大的一類中。

2.1 樸素貝葉斯分類和貝葉斯網(wǎng)絡(luò)

貝葉斯定理是關(guān)于隨機事件A和B的條件概率和邊緣概率的一則定理。

P(A|B) = P(A^B) / P(B) = P(A)*P(B|A) / P(B)

其中P(A|B)表示在B發(fā)生的情況下A發(fā)生的可能性。其中P(A)是A的先驗概率或邊緣概率。(A|B)是已知B發(fā)生后A的條件概率, P(B|A)是已知A發(fā)生后B的條件概率, P(B)是B的先驗概率或邊緣概率,也作標(biāo)準(zhǔn)化常量。由此,貝葉斯定理可表述為:

后驗概率 = (相似度*先驗概率)/標(biāo)準(zhǔn)化常量

由于,比例P(B|A)/P(B)也有時被稱作標(biāo)準(zhǔn)相似度,所以貝葉斯定理又可表述為:

后驗概率 = 標(biāo)準(zhǔn)相似度*先驗概率

貝葉斯分類方法是基于貝葉斯定理的,樸素貝葉斯(Naive Bayes)和貝葉斯網(wǎng)絡(luò)(Bayesian Networks)看作是兩種不同情形下的分類方法。

2.1.1 樸素貝葉斯分類

樸素貝葉斯分類方法是一個基于概率的分類方法,它通過計算后驗證概率的方法來確定所屬類別的概率。

Vj屬于V集合, 其中Vmap是給定一個example,得到的最可能的目標(biāo)值。其中a1...an是這個example里面的屬性。這里面,Vmap目標(biāo)值,就是后面計算得出的概率最大的一個.所以用max 來表示。

樸素貝葉斯分類默認(rèn)基于一個簡單的假定:給定目標(biāo)值時屬性之間相互條件獨立。因此,該假定說明給定實力的目標(biāo)值情況下。觀察到聯(lián)合的a1,a2...an的概率正好是對每個通過概率計算,從待分類的樣本數(shù)據(jù)的屬性 a1,a2,...,an 中求出最可能的分類目標(biāo)值,即計算各類 Vj∈ V對于這組屬性的條件概率 P(Vj|al,a2,...,an),其中j=1,2,...m(類別標(biāo)識數(shù)),并輸出條件概率最大的類別標(biāo)識作為該樣本數(shù)據(jù)的所屬類別。這個假設(shè)是樸素貝葉斯不同于貝葉斯網(wǎng)絡(luò)等其它貝葉斯分類算法的根本,也是樸素貝葉斯這個名稱的由來。

2.1.2 貝葉斯網(wǎng)絡(luò)

在實際應(yīng)用中,大多數(shù)情況下不支持樸素貝葉斯的假設(shè),即各特征并非彼此獨立,此情況下可以使用貝葉斯網(wǎng)絡(luò)進行分類。

貝葉斯網(wǎng)絡(luò)是根據(jù)變量之間的依賴關(guān)系,使用圖論方法表示變量集合的聯(lián)合概率分布的圖形模型,它引入了一個有向無環(huán)圖(Directed Acyclic Graph)和一個條件概率表集合。DAG的結(jié)點v包括隨機變量(類別和特征),有向連接E(A->B)表示結(jié)點A是結(jié)點B的parent,且B與A是有依賴關(guān)系的。同時引入了一個條件性獨立(conditional independence)概念:即圖中任意結(jié)點v在給定v的parent結(jié)點的情況下,與圖中其它結(jié)點都是獨立的,也就是說P(v|par(v),x1,x2...,xn) = P(v|par(v))。這里par(v)表示v的parent結(jié)點集,x1,x2,...,xn表示圖中其它結(jié)點。如果已知所有聯(lián)合概率值(joint distribution),那么就可以解決任何形式的概率問題。但現(xiàn)實中的特征集合數(shù)量過多(>10),幾乎無法通過統(tǒng)計得到。所以,這個問題要通過條件獨立的概念來對各條件概率值進行優(yōu)化來解決。貝葉斯網(wǎng)絡(luò)的建模有兩個步驟:創(chuàng)建網(wǎng)格結(jié)構(gòu)與估計每一個結(jié)點的概率表中的概率值。endprint

2.2 貝葉斯分類過程

在本學(xué)習(xí)系統(tǒng)中,主要使用樸素貝葉斯分類方法對網(wǎng)絡(luò)學(xué)習(xí)某一體育課程的學(xué)習(xí)者的學(xué)習(xí)風(fēng)格進行分類。

2.2.1 建立樣本數(shù)據(jù)

根據(jù)體育學(xué)科的學(xué)習(xí)特點,我們可以把學(xué)習(xí)者的學(xué)習(xí)風(fēng)格簡要概括為視覺型(V)、語言型(L)和動覺型(K)。把每一個學(xué)習(xí)者看作一個矢量 S,學(xué)習(xí)者的每一次學(xué)習(xí)記錄作為屬性 Ai,學(xué)習(xí)者的風(fēng)格(視覺型、聽覺型和動覺型)作為可能的類別 C,對于隨機分類向量S={a1,a2,…,an},由此知道 s對每個類別的概率P( Ci|S)分布,其中P( Ci|S) 由貝葉斯公式P( Ci|S)=P( S|Ci)P(Ci )/P(S ) 計算得到,概率最大的那個就是 s的預(yù)測類別。

當(dāng)學(xué)生登入系統(tǒng)時,系統(tǒng)首先根據(jù)學(xué)號查看學(xué)習(xí)風(fēng)格數(shù)據(jù)庫中是否有該生的學(xué)習(xí)風(fēng)格類型記錄,如果有,系統(tǒng)則推薦學(xué)生適合其風(fēng)格的學(xué)習(xí)內(nèi)容,如果無,則系統(tǒng)將學(xué)習(xí)者這次學(xué)習(xí)的學(xué)習(xí)記錄保存在學(xué)生學(xué)習(xí)記錄庫的學(xué)習(xí)過程數(shù)據(jù)表中。

經(jīng)過數(shù)據(jù)預(yù)處理,我們可以確保建模的數(shù)據(jù)是正確有效的。分析處理中我們需要得到分類模型需要的訓(xùn)練樣本集的相關(guān)屬性,包括文本學(xué)習(xí)次數(shù)(T)、視頻學(xué)習(xí)次數(shù)(V)、活動次數(shù)(A)、文本學(xué)習(xí)平均成績(TS)、視頻學(xué)習(xí)平均成績(VS)、活動成績(AS)、學(xué)習(xí)風(fēng)格類型(S)。當(dāng)學(xué)生登錄次數(shù)達到某值時,系統(tǒng)自動將這些屬性值計算并存儲。在分析訓(xùn)練樣本時我們把學(xué)習(xí)次數(shù)屬性值分為<5、5-10、>10 三個區(qū)間,將成績分為 A(90-100) 、B(75-89)、 C(60-74)、 D(< 60)。樸素貝葉斯分類法對于學(xué)習(xí)次數(shù)和學(xué)習(xí)成績這類連續(xù)屬性的類條件概率計算,一是把連續(xù)的屬性用相應(yīng)的離散區(qū)間替換進而離散化,或是通過訓(xùn)練數(shù)據(jù)估計分布的參數(shù)。

2.2.2 建立學(xué)習(xí)風(fēng)格建模

根據(jù)貝葉斯的最大后驗準(zhǔn)則,對任一未知樣本 s={a1,a2,…,an},確定后驗概率 P(Cj| a1,a2,…,an),把最大的類確定為該樣本的學(xué)習(xí)風(fēng)格。具體步驟為:

(1)計算得到每一種學(xué)習(xí)風(fēng)格類型的先驗概率P(Ci )。

(2)相對于每個類別的概率 P(aj|ci),訓(xùn)練樣本集計算得出各屬性的所有取值。

(3)計算出未知樣本對三種類別的概率,選取概率最大的類別為學(xué)生的學(xué)習(xí)風(fēng)格類型。

其中,建立學(xué)習(xí)風(fēng)格分類模型最關(guān)鍵的步驟就是建立訓(xùn)練樣本集。見表2-1。

2.2.3 建立算法

根據(jù)上述分析,設(shè)計算法如下:

初始化訓(xùn)練集D;計算每個學(xué)習(xí)風(fēng)格類型的先驗概率

由上述算法得出概率最大的類別為學(xué)生的學(xué)習(xí)風(fēng)格類型。

3 結(jié)論

本文將葉貝斯算法應(yīng)用在判定學(xué)習(xí)者的學(xué)習(xí)風(fēng)格中,發(fā)現(xiàn)了學(xué)生的學(xué)習(xí)成績、學(xué)習(xí)興趣與學(xué)習(xí)風(fēng)格之間的潛在聯(lián)系。經(jīng)過實際應(yīng)用發(fā)現(xiàn)當(dāng)樸素貝葉斯分類的假定條件成立時,它是一種非常精確的分類方法。 使用貝葉斯分類對系統(tǒng)中的學(xué)習(xí)者的學(xué)習(xí)風(fēng)格進行分類,其特點主要有:

(1)它結(jié)合了概率與貝葉斯網(wǎng)絡(luò)的分類方法,可以利用領(lǐng)域知識和其它先驗信息,計算假設(shè)概率。

(2)可以把所有的屬性都參與分類。

(3)針對離散屬性的對象進行分析。

(4)數(shù)據(jù)樣本可以增加也可以減少,這樣可以進行增量學(xué)習(xí)。

(5)利用有向圖的表示方式非常直觀,弧表示變量之間的關(guān)系。

參考文獻

[1]田文詩.基于學(xué)習(xí)者行為的序列模式挖掘算法研究與實現(xiàn)[D].碩士學(xué)位論文,吉林:吉林大學(xué),2011(05).

[2]鄧暉、徐梅林.網(wǎng)絡(luò)學(xué)習(xí)環(huán)境之個性化屬性調(diào)查及啟示[J].現(xiàn)代教育技術(shù),2003.13(1):49-54.

[3]凌江榮.在e_Learning中建立自適應(yīng)學(xué)習(xí)路徑的研究[D].碩士學(xué)位論文,湖南:湘潭大學(xué),2007.

[4]田曉輝.基于Web的個性化學(xué)習(xí)系統(tǒng)在遠程教育中的應(yīng)用研究[D].碩士學(xué)位論文,西安:陜西師范大學(xué),2007.

[5]史春秀.基于數(shù)據(jù)挖掘的個性化學(xué)習(xí)系統(tǒng)的研究[D].碩士學(xué)位論文,天津:天津大學(xué),2007.

[6]王志平.基于數(shù)據(jù)挖掘技術(shù)的個性化學(xué)習(xí)系統(tǒng)的研究[D].碩士學(xué)位論文,重慶:重慶大學(xué),2007.

作者單位

1.無錫高等師范學(xué)校 江蘇省無錫市 214000

2.無錫城市職業(yè)技術(shù)學(xué)院 江蘇省無錫市 214000endprint

2.2 貝葉斯分類過程

在本學(xué)習(xí)系統(tǒng)中,主要使用樸素貝葉斯分類方法對網(wǎng)絡(luò)學(xué)習(xí)某一體育課程的學(xué)習(xí)者的學(xué)習(xí)風(fēng)格進行分類。

2.2.1 建立樣本數(shù)據(jù)

根據(jù)體育學(xué)科的學(xué)習(xí)特點,我們可以把學(xué)習(xí)者的學(xué)習(xí)風(fēng)格簡要概括為視覺型(V)、語言型(L)和動覺型(K)。把每一個學(xué)習(xí)者看作一個矢量 S,學(xué)習(xí)者的每一次學(xué)習(xí)記錄作為屬性 Ai,學(xué)習(xí)者的風(fēng)格(視覺型、聽覺型和動覺型)作為可能的類別 C,對于隨機分類向量S={a1,a2,…,an},由此知道 s對每個類別的概率P( Ci|S)分布,其中P( Ci|S) 由貝葉斯公式P( Ci|S)=P( S|Ci)P(Ci )/P(S ) 計算得到,概率最大的那個就是 s的預(yù)測類別。

當(dāng)學(xué)生登入系統(tǒng)時,系統(tǒng)首先根據(jù)學(xué)號查看學(xué)習(xí)風(fēng)格數(shù)據(jù)庫中是否有該生的學(xué)習(xí)風(fēng)格類型記錄,如果有,系統(tǒng)則推薦學(xué)生適合其風(fēng)格的學(xué)習(xí)內(nèi)容,如果無,則系統(tǒng)將學(xué)習(xí)者這次學(xué)習(xí)的學(xué)習(xí)記錄保存在學(xué)生學(xué)習(xí)記錄庫的學(xué)習(xí)過程數(shù)據(jù)表中。

經(jīng)過數(shù)據(jù)預(yù)處理,我們可以確保建模的數(shù)據(jù)是正確有效的。分析處理中我們需要得到分類模型需要的訓(xùn)練樣本集的相關(guān)屬性,包括文本學(xué)習(xí)次數(shù)(T)、視頻學(xué)習(xí)次數(shù)(V)、活動次數(shù)(A)、文本學(xué)習(xí)平均成績(TS)、視頻學(xué)習(xí)平均成績(VS)、活動成績(AS)、學(xué)習(xí)風(fēng)格類型(S)。當(dāng)學(xué)生登錄次數(shù)達到某值時,系統(tǒng)自動將這些屬性值計算并存儲。在分析訓(xùn)練樣本時我們把學(xué)習(xí)次數(shù)屬性值分為<5、5-10、>10 三個區(qū)間,將成績分為 A(90-100) 、B(75-89)、 C(60-74)、 D(< 60)。樸素貝葉斯分類法對于學(xué)習(xí)次數(shù)和學(xué)習(xí)成績這類連續(xù)屬性的類條件概率計算,一是把連續(xù)的屬性用相應(yīng)的離散區(qū)間替換進而離散化,或是通過訓(xùn)練數(shù)據(jù)估計分布的參數(shù)。

2.2.2 建立學(xué)習(xí)風(fēng)格建模

根據(jù)貝葉斯的最大后驗準(zhǔn)則,對任一未知樣本 s={a1,a2,…,an},確定后驗概率 P(Cj| a1,a2,…,an),把最大的類確定為該樣本的學(xué)習(xí)風(fēng)格。具體步驟為:

(1)計算得到每一種學(xué)習(xí)風(fēng)格類型的先驗概率P(Ci )。

(2)相對于每個類別的概率 P(aj|ci),訓(xùn)練樣本集計算得出各屬性的所有取值。

(3)計算出未知樣本對三種類別的概率,選取概率最大的類別為學(xué)生的學(xué)習(xí)風(fēng)格類型。

其中,建立學(xué)習(xí)風(fēng)格分類模型最關(guān)鍵的步驟就是建立訓(xùn)練樣本集。見表2-1。

2.2.3 建立算法

根據(jù)上述分析,設(shè)計算法如下:

初始化訓(xùn)練集D;計算每個學(xué)習(xí)風(fēng)格類型的先驗概率

由上述算法得出概率最大的類別為學(xué)生的學(xué)習(xí)風(fēng)格類型。

3 結(jié)論

本文將葉貝斯算法應(yīng)用在判定學(xué)習(xí)者的學(xué)習(xí)風(fēng)格中,發(fā)現(xiàn)了學(xué)生的學(xué)習(xí)成績、學(xué)習(xí)興趣與學(xué)習(xí)風(fēng)格之間的潛在聯(lián)系。經(jīng)過實際應(yīng)用發(fā)現(xiàn)當(dāng)樸素貝葉斯分類的假定條件成立時,它是一種非常精確的分類方法。 使用貝葉斯分類對系統(tǒng)中的學(xué)習(xí)者的學(xué)習(xí)風(fēng)格進行分類,其特點主要有:

(1)它結(jié)合了概率與貝葉斯網(wǎng)絡(luò)的分類方法,可以利用領(lǐng)域知識和其它先驗信息,計算假設(shè)概率。

(2)可以把所有的屬性都參與分類。

(3)針對離散屬性的對象進行分析。

(4)數(shù)據(jù)樣本可以增加也可以減少,這樣可以進行增量學(xué)習(xí)。

(5)利用有向圖的表示方式非常直觀,弧表示變量之間的關(guān)系。

參考文獻

[1]田文詩.基于學(xué)習(xí)者行為的序列模式挖掘算法研究與實現(xiàn)[D].碩士學(xué)位論文,吉林:吉林大學(xué),2011(05).

[2]鄧暉、徐梅林.網(wǎng)絡(luò)學(xué)習(xí)環(huán)境之個性化屬性調(diào)查及啟示[J].現(xiàn)代教育技術(shù),2003.13(1):49-54.

[3]凌江榮.在e_Learning中建立自適應(yīng)學(xué)習(xí)路徑的研究[D].碩士學(xué)位論文,湖南:湘潭大學(xué),2007.

[4]田曉輝.基于Web的個性化學(xué)習(xí)系統(tǒng)在遠程教育中的應(yīng)用研究[D].碩士學(xué)位論文,西安:陜西師范大學(xué),2007.

[5]史春秀.基于數(shù)據(jù)挖掘的個性化學(xué)習(xí)系統(tǒng)的研究[D].碩士學(xué)位論文,天津:天津大學(xué),2007.

[6]王志平.基于數(shù)據(jù)挖掘技術(shù)的個性化學(xué)習(xí)系統(tǒng)的研究[D].碩士學(xué)位論文,重慶:重慶大學(xué),2007.

作者單位

1.無錫高等師范學(xué)校 江蘇省無錫市 214000

2.無錫城市職業(yè)技術(shù)學(xué)院 江蘇省無錫市 214000endprint

2.2 貝葉斯分類過程

在本學(xué)習(xí)系統(tǒng)中,主要使用樸素貝葉斯分類方法對網(wǎng)絡(luò)學(xué)習(xí)某一體育課程的學(xué)習(xí)者的學(xué)習(xí)風(fēng)格進行分類。

2.2.1 建立樣本數(shù)據(jù)

根據(jù)體育學(xué)科的學(xué)習(xí)特點,我們可以把學(xué)習(xí)者的學(xué)習(xí)風(fēng)格簡要概括為視覺型(V)、語言型(L)和動覺型(K)。把每一個學(xué)習(xí)者看作一個矢量 S,學(xué)習(xí)者的每一次學(xué)習(xí)記錄作為屬性 Ai,學(xué)習(xí)者的風(fēng)格(視覺型、聽覺型和動覺型)作為可能的類別 C,對于隨機分類向量S={a1,a2,…,an},由此知道 s對每個類別的概率P( Ci|S)分布,其中P( Ci|S) 由貝葉斯公式P( Ci|S)=P( S|Ci)P(Ci )/P(S ) 計算得到,概率最大的那個就是 s的預(yù)測類別。

當(dāng)學(xué)生登入系統(tǒng)時,系統(tǒng)首先根據(jù)學(xué)號查看學(xué)習(xí)風(fēng)格數(shù)據(jù)庫中是否有該生的學(xué)習(xí)風(fēng)格類型記錄,如果有,系統(tǒng)則推薦學(xué)生適合其風(fēng)格的學(xué)習(xí)內(nèi)容,如果無,則系統(tǒng)將學(xué)習(xí)者這次學(xué)習(xí)的學(xué)習(xí)記錄保存在學(xué)生學(xué)習(xí)記錄庫的學(xué)習(xí)過程數(shù)據(jù)表中。

經(jīng)過數(shù)據(jù)預(yù)處理,我們可以確保建模的數(shù)據(jù)是正確有效的。分析處理中我們需要得到分類模型需要的訓(xùn)練樣本集的相關(guān)屬性,包括文本學(xué)習(xí)次數(shù)(T)、視頻學(xué)習(xí)次數(shù)(V)、活動次數(shù)(A)、文本學(xué)習(xí)平均成績(TS)、視頻學(xué)習(xí)平均成績(VS)、活動成績(AS)、學(xué)習(xí)風(fēng)格類型(S)。當(dāng)學(xué)生登錄次數(shù)達到某值時,系統(tǒng)自動將這些屬性值計算并存儲。在分析訓(xùn)練樣本時我們把學(xué)習(xí)次數(shù)屬性值分為<5、5-10、>10 三個區(qū)間,將成績分為 A(90-100) 、B(75-89)、 C(60-74)、 D(< 60)。樸素貝葉斯分類法對于學(xué)習(xí)次數(shù)和學(xué)習(xí)成績這類連續(xù)屬性的類條件概率計算,一是把連續(xù)的屬性用相應(yīng)的離散區(qū)間替換進而離散化,或是通過訓(xùn)練數(shù)據(jù)估計分布的參數(shù)。

2.2.2 建立學(xué)習(xí)風(fēng)格建模

根據(jù)貝葉斯的最大后驗準(zhǔn)則,對任一未知樣本 s={a1,a2,…,an},確定后驗概率 P(Cj| a1,a2,…,an),把最大的類確定為該樣本的學(xué)習(xí)風(fēng)格。具體步驟為:

(1)計算得到每一種學(xué)習(xí)風(fēng)格類型的先驗概率P(Ci )。

(2)相對于每個類別的概率 P(aj|ci),訓(xùn)練樣本集計算得出各屬性的所有取值。

(3)計算出未知樣本對三種類別的概率,選取概率最大的類別為學(xué)生的學(xué)習(xí)風(fēng)格類型。

其中,建立學(xué)習(xí)風(fēng)格分類模型最關(guān)鍵的步驟就是建立訓(xùn)練樣本集。見表2-1。

2.2.3 建立算法

根據(jù)上述分析,設(shè)計算法如下:

初始化訓(xùn)練集D;計算每個學(xué)習(xí)風(fēng)格類型的先驗概率

由上述算法得出概率最大的類別為學(xué)生的學(xué)習(xí)風(fēng)格類型。

3 結(jié)論

本文將葉貝斯算法應(yīng)用在判定學(xué)習(xí)者的學(xué)習(xí)風(fēng)格中,發(fā)現(xiàn)了學(xué)生的學(xué)習(xí)成績、學(xué)習(xí)興趣與學(xué)習(xí)風(fēng)格之間的潛在聯(lián)系。經(jīng)過實際應(yīng)用發(fā)現(xiàn)當(dāng)樸素貝葉斯分類的假定條件成立時,它是一種非常精確的分類方法。 使用貝葉斯分類對系統(tǒng)中的學(xué)習(xí)者的學(xué)習(xí)風(fēng)格進行分類,其特點主要有:

(1)它結(jié)合了概率與貝葉斯網(wǎng)絡(luò)的分類方法,可以利用領(lǐng)域知識和其它先驗信息,計算假設(shè)概率。

(2)可以把所有的屬性都參與分類。

(3)針對離散屬性的對象進行分析。

(4)數(shù)據(jù)樣本可以增加也可以減少,這樣可以進行增量學(xué)習(xí)。

(5)利用有向圖的表示方式非常直觀,弧表示變量之間的關(guān)系。

參考文獻

[1]田文詩.基于學(xué)習(xí)者行為的序列模式挖掘算法研究與實現(xiàn)[D].碩士學(xué)位論文,吉林:吉林大學(xué),2011(05).

[2]鄧暉、徐梅林.網(wǎng)絡(luò)學(xué)習(xí)環(huán)境之個性化屬性調(diào)查及啟示[J].現(xiàn)代教育技術(shù),2003.13(1):49-54.

[3]凌江榮.在e_Learning中建立自適應(yīng)學(xué)習(xí)路徑的研究[D].碩士學(xué)位論文,湖南:湘潭大學(xué),2007.

[4]田曉輝.基于Web的個性化學(xué)習(xí)系統(tǒng)在遠程教育中的應(yīng)用研究[D].碩士學(xué)位論文,西安:陜西師范大學(xué),2007.

[5]史春秀.基于數(shù)據(jù)挖掘的個性化學(xué)習(xí)系統(tǒng)的研究[D].碩士學(xué)位論文,天津:天津大學(xué),2007.

[6]王志平.基于數(shù)據(jù)挖掘技術(shù)的個性化學(xué)習(xí)系統(tǒng)的研究[D].碩士學(xué)位論文,重慶:重慶大學(xué),2007.

作者單位

1.無錫高等師范學(xué)校 江蘇省無錫市 214000

2.無錫城市職業(yè)技術(shù)學(xué)院 江蘇省無錫市 214000endprint

猜你喜歡
數(shù)據(jù)挖掘
基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識別方法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費中的應(yīng)用淺析
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數(shù)據(jù)挖掘研究
利用數(shù)據(jù)挖掘技術(shù)實現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實踐
主站蜘蛛池模板: 国产91九色在线播放| 国产女主播一区| 一级毛片不卡片免费观看| 日韩精品无码免费专网站| 亚洲国产精品一区二区高清无码久久| 第一区免费在线观看| 国产一级做美女做受视频| 欧美三级视频网站| 欧美在线中文字幕| 一区二区三区四区精品视频 | 日韩中文精品亚洲第三区| 色国产视频| 国产农村精品一级毛片视频| 婷婷午夜天| 日本不卡在线播放| 第九色区aⅴ天堂久久香| 亚洲成在线观看 | 99在线视频免费观看| 亚洲综合片| 国产在线精品人成导航| 视频一区亚洲| 91色老久久精品偷偷蜜臀| 久久不卡精品| 国产jizzjizz视频| 国产啪在线| 国产精选自拍| 国产成人综合久久精品尤物| 97在线观看视频免费| 国产在线观看成人91| 高清码无在线看| 思思热精品在线8| a天堂视频在线| 国产精品密蕾丝视频| 欧美国产视频| 国产精品自在在线午夜区app| 亚洲精品天堂自在久久77| 久久99国产视频| 精品自拍视频在线观看| 无码丝袜人妻| 亚洲无限乱码| 日韩欧美中文在线| 中字无码精油按摩中出视频| 国产精品免费久久久久影院无码| 欧美日韩国产成人在线观看| 亚洲永久色| 日本欧美中文字幕精品亚洲| 精品人妻AV区| 久久久精品无码一区二区三区| 亚洲天堂.com| 亚洲性色永久网址| 国产精品极品美女自在线| 在线免费亚洲无码视频| 丁香五月激情图片| 欧美日韩国产高清一区二区三区| av无码一区二区三区在线| 日韩精品高清自在线| 亚洲欧美不卡中文字幕| 亚洲福利视频网址| 国产流白浆视频| 国产天天射| 久久无码av三级| 99精品视频九九精品| 国产成人亚洲无吗淙合青草| 青青草原国产一区二区| 国产成人精品2021欧美日韩| 欧美日韩北条麻妃一区二区| 国产精品亚洲专区一区| 女人18毛片一级毛片在线 | 一级毛片在线播放| 国产日本欧美在线观看| 国产一二三区视频| 人人澡人人爽欧美一区| 国产精品制服| 色亚洲成人| 亚洲人成网站在线观看播放不卡| 毛片基地美国正在播放亚洲 | 欧美午夜网站| 丝袜久久剧情精品国产| 2019年国产精品自拍不卡| 26uuu国产精品视频| 视频一区视频二区日韩专区| 精品91视频|