999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

樸素貝葉斯分類法在考試管理中的應用

2018-06-14 05:47:00梅曉晴
數字技術與應用 2018年3期
關鍵詞:分類模型

梅曉晴

(天津市學位與研究生教育發展中心,天津 300381)

機器學習是人工智能及模式識別領域的共同研究熱點,其理論和方法已被廣泛應用于解決工程應用和科學領域的復雜問題。分類算法是機器學習中的重要部分,其基本思想是首先知道大量的樣本對象,并且知道這些樣本對象的“特征”和所屬類別,把這些數據告訴計算機,讓計算機總結分類的原則,形成一個分類模型,再把新的待分類或者未知分類的樣本交給它,讓它完成分類過程。也就是說,先用一部分有種種特征的數據和每種數據歸屬的標識來訓練分類模型,當訓練完畢后,再讓計算機用這個分類模型來區分新的沒有類別標識的樣本,從而完成該樣本的分類。

貝葉斯分類是統計學中一種利用概率知識進行分類的方法,它可以預測一個未知類別的樣本屬于各個類別的可能性,并且選擇其中可能性最大的一個類別作為該樣本的最終類別。樸素貝葉斯算法(NBC)是簡單常用的統計學分類算法[1],樸素貝葉斯分類器是在機器學習中應用最廣泛的一種分類器,其分類算法包括兩個過程:訓練過程和測試過程[2]。在人們生產生活中,使用樸素貝葉斯分類器的思維解決問題比直接套用公式的機會多。本文通過樸素貝葉斯分類方法,探索利用已有經驗數據來判斷考生行為的規律,從而有針對的加強監考,提高考試管理效率。

1 貝葉斯定理

貝葉斯分類的理論基礎是貝葉斯定理,貝葉斯定理將事件的先驗概率與后驗概率聯系起來,它在后驗推理、參數估計、模型檢測等諸多統計機器學習領域方面有廣泛而深遠的應用[3]。

設 D1、D2、……、Dn為樣本空間S的一個劃分,如果以 P ( Di)表示 Di發生的概率,且 P ( Di)>0(i=1,2,…,n)。對于任何一個事件x,P( x)>0,則有:

在一個樣本空間里有很多事件發生, Di就是指不同的事件劃分,并且用 Di可以把整個空間劃分完畢,在每個 Di事件發生的同時都記錄事件x的發生,并記錄 Di事件發生下x發生的概率。等式右側的分母部分就是 Di發生的概率和 Di發生時x發生的概率的加和,所以分母這一項其實就是在整個樣本空間里x發生的概率。P (Djx)這一項是指x發生的情況下, Dj發生的概率。因此,左側和右側分母項相乘得到的是在全樣本空間里,在x發生的情況下又發生 Dj的情況的概率。右側分子部分的含義是 Dj發生的概率乘以 Dj發生的情況下又發生x的概率。

所以最后等式兩邊就化簡為:

在全樣本空間下,發生x的概率乘以在發生x的情況下發生 Dj的概率,等于發生 Dj的概率乘以在發生 Dj的情況下發生x的概率。

貝葉斯分類通常基于這樣一個假定:給定目標值時屬性之間相互條件獨立,基于這種“樸素”的假定,貝葉斯公式一般簡寫為:

上式也成為樸素貝葉斯公式,P( A)叫做A事件的先驗概率,就是一般情況下,認為A發生的概率。P ( BA)叫做似然度,是A假設條件成立的情況下發生B的概率。P( AB)叫做后驗概率,在B發生的情況下發生A的概率,也就是要計算的概率。P ( B)叫做標準化常量,和A的先驗概率定義類似,就是一般情況下,B的發生概率。

2 樸素貝葉斯分類器

樸素貝葉斯分類器是一個簡單有效而且在實際使用中很成功的一個分類器[4]。設有變量集 U ={X1, X2,…,Xn,C},其中, X1, X2,…,Xn是實例的屬性變量,C是m個值的類變量。假設所有的屬性都條件獨立于類變量C,即每一個屬性變量都以類變量作為唯一的節點,而屬性變量之間是完全獨立的,就會得到樸素貝葉斯模型。

使用樸素貝葉斯分類器進行分類的方法是:通過概率計算,從待分類的實例的屬性值 x1, x2,… ,xn中求出最可能的分類目標值。即計算各類 cj∈C對于這組屬性的條件概率P (cjx1,…, xn),其中j=1,2,…,m,并輸出條件概率最大的類標簽作為目標值。應用貝葉斯定理和條件獨立性假設[5]:

其中α是正規化常數。以后驗概率作為分類指示,即輸出具有最大后驗概率 f( x)。

表1 訓練樣本集

圖1

其中 f( x)表示樸素貝葉斯網絡輸出的目標值,常數α可以省略。通常式(5)也作為樸素貝葉斯分類器的定義[6]。

關于 P ( cj)和P ( xicj)的求解,有以下三種常見的模型高斯模型、多項式模型、伯努利模型,當特征是連續變量的時候,運用多項式模型就會導致很多P ( xicj)=0,此時即使做平滑,所得到的條件概率也難以描述真實情況。所以處理連續的特征變量,應該采用高斯模型,即:

其中μcj表示類別為c的樣本中,第j維特征的均值,σcj表示類別為c的樣本中,第j維特征的方差[6]。

3 基于樸素貝葉斯分類預測考生行為

3.1 分析評價指標

數據樣本用一個7維特征向量X=(x1,x2,……x7)表示,分別描述性別、年齡、考生類別、學科類別、參加考試次數、參加工作情況,有無違紀行為記錄等對考生行為產生的影響。

性別(x)=(x=1男;x=2女);

年齡(n)=(n=1,年齡<18;n=2,18≤年齡<22;n=3,年齡≥22);

考生類別(l)=(l=1成人在籍本科生;l=2自考在籍本科生);

學科類別(k)=(x=1管理學,經濟學;x=2工學,理學;x=3醫學,教育學);

參加考試次數(s)=(s=0;s>=1);

參加工作情況(g)=(g=1已參加;g=0未參加);

有無違紀行為記錄(w)=(w=1有記錄;w=0無記錄);

行為判斷結果(p)=(p=0正常;p=1疑似異常)。

3.2 訓練數據的選取

以2013-2017年間5次考試的550名考生作為訓練樣本數據,經過加工整理,提取出相關的數據,再對數據進行預處理,除去數據中的冗余信息。數據預處理包括處理缺失值、刪除無效數據等。最后生成包含550個樣本的訓練樣本集,如表1所示。

3.3 構建樸素貝葉斯分類模型

由于采用樸素貝葉斯分類器進行分類是一個龐大且復雜的計算過程,所以這里只根據已有條件進行簡單預測。通過表1的數據,預測25歲男性成人在籍本科生,專業為管理學,參加過考試且已經工作,沒有違紀記錄的評估結果,即未知樣本。

在Python的Scikit-learn庫中,雖然對樸素貝葉斯分類算法做了實現,但是對于建模針對性的問題,分別做了幾種貝葉斯分類的變種模型封裝。分別是高斯樸素貝葉斯;多項式樸素貝葉斯;伯努利樸素貝葉斯。這三種訓練的方式非常相近,引用時所寫的代碼也非常簡短。其中,高斯樸素貝葉斯是利用高斯概率密度公式來進行分類擬合的。多項式樸素貝葉斯多用于高緯度向量分類,最常用的場景是文章分類。伯努利樸素貝葉斯一般是針對布爾類型特征值的向量做分類的過程。

本例使用高斯樸素貝葉斯模型,代碼如圖1:

從計算結果可以看出,樸素貝葉斯分類器預測樣本的評估結果為“正常”,這與實際結果相同。通過分析大量評估結果數據,會發現其中起決定因素的主要是考生年齡、學科類別及工作情況,通過這種潛在聯系的應用,可以為提前預測以及考試過程中判斷考生行為提供合理科學的技術支持。

樸素貝葉斯分類技術在考試管理中的應用,克服了僅憑個人經驗主觀判斷的缺點,它不再是一個簡單的直接套用的公式,而是一種機器學習的思想,對它的靈活運用可以減輕監考人員壓力,提高考試管理效率,相信也會在將來有更廣泛的應用。

[1]鄭煒,沈文,張英鵬.基于改進樸素貝葉斯算法的垃圾郵件過濾器的研究[J].西北工業大學學報,2010,28(4):622-627.

[2]張增偉,吳萍.基于樸素貝葉斯算法的改進遺傳算法分類研究[J].計算機工程與設計,2012,33(2):750-753.

[3]Barber D.Bayesian Reasoning and Machine Learning[M].Cambridge:Cambridge University Press,2012.

[4]RAMONI M,SEBASTIAMI P.Robust bayes classifiers[J].Artificial Intelligence,2001,125(1/2):209-226.

[5]李曉毅,徐兆棣,孫笑微.貝葉斯網絡的參數學習研[J].沈陽農業大學學報,2007,38(1):125-128.

[6]Gelman A,Carlin J,Stern H,et al. Bayesian Data–Analysis [M]Boca Raton: CRC Press,2013.

[7]王雙成,杜瑞杰,劉穎.連續屬性完全貝葉斯分類器的學習與優化[J].計算機學報,2012,35(10):2129-2138.

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 亚洲人成电影在线播放| 欧美午夜小视频| 朝桐光一区二区| 婷婷综合缴情亚洲五月伊| 欧美亚洲激情| 久久久久久高潮白浆| 国产综合精品一区二区| 国产成人一区免费观看| 一级毛片免费的| 国产h视频免费观看| 就去色综合| 一本大道视频精品人妻 | 久久99精品久久久久纯品| 欧美a级在线| 国产95在线 | 婷婷午夜天| 国产成人无码久久久久毛片| 99精品免费欧美成人小视频| 国产一区二区三区免费| 蜜臀AVWWW国产天堂| 亚洲国产精品一区二区高清无码久久| 亚洲黄网视频| 亚洲日韩日本中文在线| 天天做天天爱天天爽综合区| 亚洲视频四区| 污视频日本| 日韩午夜福利在线观看| 亚洲一级毛片免费看| 亚洲国产欧美国产综合久久 | 免费a级毛片18以上观看精品| 国产特级毛片aaaaaaa高清| 亚洲电影天堂在线国语对白| 日韩久久精品无码aV| 香蕉国产精品视频| 国产性精品| 小说区 亚洲 自拍 另类| 无码乱人伦一区二区亚洲一| 欧美色香蕉| 91九色视频网| 天天综合网色| 国产香蕉在线| 四虎综合网| 国产精品开放后亚洲| 日本黄色a视频| 性视频久久| 青青久在线视频免费观看| 亚洲视频色图| 国产成人高清在线精品| 国产毛片片精品天天看视频| 三级国产在线观看| 亚洲最猛黑人xxxx黑人猛交| Aⅴ无码专区在线观看| 五月天久久综合| 香蕉在线视频网站| 女同国产精品一区二区| AV老司机AV天堂| 国产精选自拍| 91福利免费| 这里只有精品在线| 久久精品丝袜| 无码aaa视频| 久久国产精品娇妻素人| 国产chinese男男gay视频网| 黄色网址免费在线| 欧美一级特黄aaaaaa在线看片| h网址在线观看| 无码丝袜人妻| 欧美国产综合色视频| 成人亚洲天堂| 91色爱欧美精品www| 欧美自慰一级看片免费| 91精品国产91久久久久久三级| 一级毛片无毒不卡直接观看| 中文无码伦av中文字幕| 中国成人在线视频| 亚洲欧美日韩中文字幕在线一区| 五月天丁香婷婷综合久久| 熟妇丰满人妻| 国产va欧美va在线观看| 亚洲毛片在线看| 亚洲第七页| 国产不卡网|