999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于判別分析與Logistic回歸組合模型的蠓蟲分類方法

2016-07-31 21:17:08曹昌杰
中國科技信息 2016年14期
關鍵詞:分類方法模型

曹昌杰

成都理工大學管理科學學院

基于判別分析與Logistic回歸組合模型的蠓蟲分類方法

曹昌杰

成都理工大學管理科學學院

蠓蟲分類問題究其本質是一個典型的數據二分類問題。在傳統上采用判別分析或Logistic回歸的方式進行分類判別時,往往因為其算法本身的局限性而出現誤判且無法避免。本文在前人的研究基礎上提出了判別分析修正下的Logistic回歸方法和Logistic修正下的判別分析方法解決蠓蟲分類問題。在通過誤判率的比較和對異常數據的感知等前提下,為蠓蟲避害提供一種較為可靠的篩選方式。

縱觀為數不多的蠓蟲分類問題的研究,何水明為克服傳統BP算法中存在網絡學習速度慢的問題,提出了一種將同倫與BP算法互相結合的改進算法來進行蠓蟲分類;馮增哲等運用支持向量機算法,將蠓蟲分類這一個二分類問題轉化為一個二次規劃及其對偶規劃問題進行求解;王琪運用模糊聚類從而獲得模糊模式,并通過貼進度模式識別判斷蠓蟲的分類情況。但事實上,上述算法總存在著運算時間過長等各類局限性,特別地,是無法得到個體指標及其所屬類別之間的函數解析式,用以滿足簡明的判斷蠓蟲分類這一需求,并且對樣本數據中的異常數據點無法做出異常感知。

針對以上問題,我們采用將Logistic回歸和判別分析相結合的方式,力求簡便有效的找出一種蠓蟲分類方式,為蠓蟲避害找到一條較為便捷的途徑。

判別分析修正下的Logistic回歸方法

由于傳統Logistic回歸方法的局限性,本文提出判別分析修正下的Logistic回歸方法對其進行改進,即對蠓蟲數據采用Logistic回歸方法進行處理,但對易發生誤判的蠓蟲數據引入判別分析進行處理。主要步驟如下:

a)設n為需要進行分類的蠓蟲數據的樣本容量

b)for 1 to n do.

d)對差值的絕對值的大小進行排序,得到差值的中位數M1

f)end for

g)若找到類似的數據點則采用判別分析方法進行分類判別;否則,仍然采用Logistic回歸方法進行分類判別

e)因為蠓蟲分類問題本身是二分類問題的特殊性,在判斷出蠓蟲樣本數據不屬于無害類(Af類)蠓蟲時,即已判定該蠓蟲屬于有害類(Apf類)蠓蟲。

Logistic回歸修正下的判別分析方法

判別分析是通過得到某個樣本數據與各樣本重心之間的馬氏距離確定樣本數據所屬的類別。若某類樣本數據的離散程度過大,與該樣本重心之間馬氏距離較大的一些樣本數據可能會出現誤判的情況。基于這樣的思想,利用Logistic回歸修正判別分析方法,主要步驟如下:

a)設n為需要進行分類的蠓蟲數據的樣本容量

b)根據蠓蟲數據進行馬氏距離判別分析,形成兩類樣本數據

c)for 1 to n do

d)在上述通過分類所得到兩類樣本數據中,分別在各類數據中,計算本類樣本數據與各自樣本重心的馬氏距離,分別記為,我們將它們分別記X1、X2類

e)將X1類和X2類的數據分別進行大小排序,找到兩類數據的中位數,分別記為

g)end for

h)將通過上述過程被記錄下來的數據點進行Logistic回歸方法進行分類,否則,仍然采用判別分析進行分類

實例論證

本文使用的蠓蟲數據是由生物學家W.L.Grongan和W.W.Wirt在1981年根據蠓蟲的觸角長度和翼長加以區分而得到,我們用上述方法將蠓蟲數據進行分類,并將分類數據與原數據進行比較,通過觀察誤判率即可對分類方法做出有效評判。其中,無害蠓蟲用Af標記,有害蠓蟲用Apf標記。

判別分析修正下的Logistic回歸方法

根據蠓蟲數據計算得出Logistic回歸函數模型如下:

并由上式可得各蠓蟲數據分類為無害蠓蟲的概率分別是:

1號: 0.7465,2號:0.8332,3號:0.7365,4號:0.7660,5號:0.6884,6號:0.7515,7號:0.5332,8號:0.3558,9號:0.2361,10號:0.4076,11號:0.4955,12號:0.2605,13號:0.2585,14號:0.1882,15號:0.3915

利用上述數據可得,M1=0.198107.

在判斷出可能得到誤判的誤判點之后,利用判別分析再對這些數據點進行判別分析,并最終得到誤判率為5.56%。即7號蠓蟲的分類出現錯誤。

從該類組合方法模型的判斷過程中,我們一共對6個可能出現誤判的點進行了重新判定,該類組合方法模型感知到蠓蟲數據中的第7點為異常數據,與事實相符。

Logistic回歸修正下的判別分析方法

根據蠓蟲數據可知,各個蠓蟲樣本數據點對其樣本重心的馬氏距離分別是:

表1 1-6號蠓蟲對于Apf類蠓蟲樣本重心的馬氏距離

表2 7-15號蠓蟲對于Af類蠓蟲樣本重心的馬氏距離

則由表1、表2可得,M21=1.2393,M22=1.1345.通過選擇并記錄下的數據點,將其進行Logistic回歸,得到Logistic回歸函數模型如下:

根據最終判別結果可知,該方法的誤判率是13.89%.

結論

通過將兩類組合模型的蠓蟲分類方式分別應用于經典蠓蟲數據,本文得出以下結論:

就兩類組合模型自身比較而言,判別分析修正下的Logistic回歸方法具有更低的誤判率,而誤判率本身也是人為修改數據所致,可見,該組合模型不僅能夠準確的判斷出蠓蟲分類,還能對數據的異常數據做出異常感知。可見,判別分析修正下的Logistic回歸方法是一種較為有效的蠓蟲分類方法。

曹昌杰(1995-)男,現主要從事數據分析學習。

猜你喜歡
分類方法模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 国产青青草视频| 久久99国产乱子伦精品免| 国产精品美乳| 色成人综合| 黄色网址免费在线| 成人日韩视频| 国产精品亚洲五月天高清| 国产色婷婷| 欧美亚洲国产精品久久蜜芽| 日韩毛片在线视频| 91精品伊人久久大香线蕉| 国产精品分类视频分类一区| 国产xxxxx免费视频| 999国内精品视频免费| 国产成人久久综合777777麻豆| 亚洲成a人片| 国产91av在线| 亚洲另类第一页| 欧美特黄一免在线观看| 狼友视频国产精品首页| 国产乱子伦一区二区=| 日韩天堂视频| 久久6免费视频| 啪啪啪亚洲无码| 日韩欧美在线观看| 国产亚洲现在一区二区中文| 91小视频在线播放| 91国内在线视频| 国产午夜一级淫片| 一级成人欧美一区在线观看| 无码电影在线观看| 欧美国产在线看| 一本久道热中字伊人| 91精品国产综合久久香蕉922 | 国产亚洲精| 97亚洲色综久久精品| 欧美无遮挡国产欧美另类| 精品国产电影久久九九| 91精品人妻互换| 国产日韩欧美黄色片免费观看| 亚洲视频免| 在线精品视频成人网| 亚洲午夜福利精品无码| www.亚洲一区| 色婷婷亚洲综合五月| 亚洲va欧美va国产综合下载| 高清大学生毛片一级| 亚洲精品国产首次亮相| 影音先锋亚洲无码| 伊人激情久久综合中文字幕| 午夜激情婷婷| 国产亚洲现在一区二区中文| 久草视频一区| 日韩精品免费一线在线观看| 久久国产拍爱| 国产一级裸网站| 色135综合网| 黄色网站在线观看无码| 天天躁狠狠躁| 美女扒开下面流白浆在线试听| 一级看片免费视频| 欧美激情视频一区| 国产精品中文免费福利| 免费国产高清视频| 亚洲国产精品无码AV| 亚洲国产成人超福利久久精品| 日本不卡在线播放| 免费在线成人网| 国产精欧美一区二区三区| 毛片基地视频| 色婷婷电影网| 亚洲视频免| 亚洲大学生视频在线播放| 国产成本人片免费a∨短片| 谁有在线观看日韩亚洲最新视频| 视频一区视频二区中文精品| 国产高清在线观看91精品| 国产三级成人| 制服丝袜国产精品| 欧美激情第一区| 国产精品久久久久久搜索| 日韩大乳视频中文字幕|