999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于判別分析與Logistic回歸組合模型的蠓蟲分類方法

2016-07-31 21:17:08曹昌杰
中國科技信息 2016年14期
關鍵詞:分類方法模型

曹昌杰

成都理工大學管理科學學院

基于判別分析與Logistic回歸組合模型的蠓蟲分類方法

曹昌杰

成都理工大學管理科學學院

蠓蟲分類問題究其本質是一個典型的數據二分類問題。在傳統上采用判別分析或Logistic回歸的方式進行分類判別時,往往因為其算法本身的局限性而出現誤判且無法避免。本文在前人的研究基礎上提出了判別分析修正下的Logistic回歸方法和Logistic修正下的判別分析方法解決蠓蟲分類問題。在通過誤判率的比較和對異常數據的感知等前提下,為蠓蟲避害提供一種較為可靠的篩選方式。

縱觀為數不多的蠓蟲分類問題的研究,何水明為克服傳統BP算法中存在網絡學習速度慢的問題,提出了一種將同倫與BP算法互相結合的改進算法來進行蠓蟲分類;馮增哲等運用支持向量機算法,將蠓蟲分類這一個二分類問題轉化為一個二次規劃及其對偶規劃問題進行求解;王琪運用模糊聚類從而獲得模糊模式,并通過貼進度模式識別判斷蠓蟲的分類情況。但事實上,上述算法總存在著運算時間過長等各類局限性,特別地,是無法得到個體指標及其所屬類別之間的函數解析式,用以滿足簡明的判斷蠓蟲分類這一需求,并且對樣本數據中的異常數據點無法做出異常感知。

針對以上問題,我們采用將Logistic回歸和判別分析相結合的方式,力求簡便有效的找出一種蠓蟲分類方式,為蠓蟲避害找到一條較為便捷的途徑。

判別分析修正下的Logistic回歸方法

由于傳統Logistic回歸方法的局限性,本文提出判別分析修正下的Logistic回歸方法對其進行改進,即對蠓蟲數據采用Logistic回歸方法進行處理,但對易發生誤判的蠓蟲數據引入判別分析進行處理。主要步驟如下:

a)設n為需要進行分類的蠓蟲數據的樣本容量

b)for 1 to n do.

d)對差值的絕對值的大小進行排序,得到差值的中位數M1

f)end for

g)若找到類似的數據點則采用判別分析方法進行分類判別;否則,仍然采用Logistic回歸方法進行分類判別

e)因為蠓蟲分類問題本身是二分類問題的特殊性,在判斷出蠓蟲樣本數據不屬于無害類(Af類)蠓蟲時,即已判定該蠓蟲屬于有害類(Apf類)蠓蟲。

Logistic回歸修正下的判別分析方法

判別分析是通過得到某個樣本數據與各樣本重心之間的馬氏距離確定樣本數據所屬的類別。若某類樣本數據的離散程度過大,與該樣本重心之間馬氏距離較大的一些樣本數據可能會出現誤判的情況。基于這樣的思想,利用Logistic回歸修正判別分析方法,主要步驟如下:

a)設n為需要進行分類的蠓蟲數據的樣本容量

b)根據蠓蟲數據進行馬氏距離判別分析,形成兩類樣本數據

c)for 1 to n do

d)在上述通過分類所得到兩類樣本數據中,分別在各類數據中,計算本類樣本數據與各自樣本重心的馬氏距離,分別記為,我們將它們分別記X1、X2類

e)將X1類和X2類的數據分別進行大小排序,找到兩類數據的中位數,分別記為

g)end for

h)將通過上述過程被記錄下來的數據點進行Logistic回歸方法進行分類,否則,仍然采用判別分析進行分類

實例論證

本文使用的蠓蟲數據是由生物學家W.L.Grongan和W.W.Wirt在1981年根據蠓蟲的觸角長度和翼長加以區分而得到,我們用上述方法將蠓蟲數據進行分類,并將分類數據與原數據進行比較,通過觀察誤判率即可對分類方法做出有效評判。其中,無害蠓蟲用Af標記,有害蠓蟲用Apf標記。

判別分析修正下的Logistic回歸方法

根據蠓蟲數據計算得出Logistic回歸函數模型如下:

并由上式可得各蠓蟲數據分類為無害蠓蟲的概率分別是:

1號: 0.7465,2號:0.8332,3號:0.7365,4號:0.7660,5號:0.6884,6號:0.7515,7號:0.5332,8號:0.3558,9號:0.2361,10號:0.4076,11號:0.4955,12號:0.2605,13號:0.2585,14號:0.1882,15號:0.3915

利用上述數據可得,M1=0.198107.

在判斷出可能得到誤判的誤判點之后,利用判別分析再對這些數據點進行判別分析,并最終得到誤判率為5.56%。即7號蠓蟲的分類出現錯誤。

從該類組合方法模型的判斷過程中,我們一共對6個可能出現誤判的點進行了重新判定,該類組合方法模型感知到蠓蟲數據中的第7點為異常數據,與事實相符。

Logistic回歸修正下的判別分析方法

根據蠓蟲數據可知,各個蠓蟲樣本數據點對其樣本重心的馬氏距離分別是:

表1 1-6號蠓蟲對于Apf類蠓蟲樣本重心的馬氏距離

表2 7-15號蠓蟲對于Af類蠓蟲樣本重心的馬氏距離

則由表1、表2可得,M21=1.2393,M22=1.1345.通過選擇并記錄下的數據點,將其進行Logistic回歸,得到Logistic回歸函數模型如下:

根據最終判別結果可知,該方法的誤判率是13.89%.

結論

通過將兩類組合模型的蠓蟲分類方式分別應用于經典蠓蟲數據,本文得出以下結論:

就兩類組合模型自身比較而言,判別分析修正下的Logistic回歸方法具有更低的誤判率,而誤判率本身也是人為修改數據所致,可見,該組合模型不僅能夠準確的判斷出蠓蟲分類,還能對數據的異常數據做出異常感知。可見,判別分析修正下的Logistic回歸方法是一種較為有效的蠓蟲分類方法。

曹昌杰(1995-)男,現主要從事數據分析學習。

猜你喜歡
分類方法模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 国产精品部在线观看| 激情综合网激情综合| 久久人体视频| 欧美激情一区二区三区成人| 亚洲中文字幕日产无码2021| 波多野结衣一级毛片| 国产区免费精品视频| 欧类av怡春院| 国产精品专区第1页| 亚洲天堂区| 国产精品99一区不卡| 国产成人超碰无码| 亚洲国产无码有码| 国产精品55夜色66夜色| 日韩在线观看网站| 毛片免费网址| 亚洲精品麻豆| 亚洲毛片网站| 91九色最新地址| 精品国产一区二区三区在线观看| 久夜色精品国产噜噜| 久久久久国产精品嫩草影院| 亚洲男人在线| 亚洲人成影院在线观看| 国产综合日韩另类一区二区| 国产人碰人摸人爱免费视频| 国产成人精品日本亚洲| 中文精品久久久久国产网址| 伊人精品成人久久综合| 亚洲中久无码永久在线观看软件| AV不卡无码免费一区二区三区| 亚洲精品少妇熟女| 手机成人午夜在线视频| 99热这里只有精品国产99| 好久久免费视频高清| 99人妻碰碰碰久久久久禁片| 漂亮人妻被中出中文字幕久久 | 狂欢视频在线观看不卡| 青草视频网站在线观看| 国产欧美精品午夜在线播放| 日本日韩欧美| 久久久久无码国产精品不卡| 欧美亚洲一区二区三区在线| 亚洲人成网站在线播放2019| 白丝美女办公室高潮喷水视频| 97se亚洲综合不卡| 在线毛片网站| 在线欧美日韩| 国产尤物在线播放| 亚洲综合色婷婷| 一级全黄毛片| 亚洲人成色77777在线观看| 无码av免费不卡在线观看| 国产爽歪歪免费视频在线观看 | 欧美不卡视频在线| 亚洲AV永久无码精品古装片| AV熟女乱| 国产精品无码久久久久久| 日韩区欧美国产区在线观看| 特级aaaaaaaaa毛片免费视频| 国产免费网址| 日韩小视频网站hq| 成人日韩精品| 亚洲无码A视频在线| 欧美亚洲国产日韩电影在线| 欧美精品1区| 国产理论精品| 日本在线欧美在线| 天天躁夜夜躁狠狠躁躁88| 亚洲天堂色色人体| 亚洲精品免费网站| 九色视频一区| 亚洲日韩日本中文在线| 欧美成人精品一级在线观看| 国产va免费精品| 色综合a怡红院怡红院首页| 日韩成人在线一区二区| 国产精品美人久久久久久AV| 国内精品一区二区在线观看| 国产成人高清精品免费5388| 色亚洲成人| 538精品在线观看|