999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于判別分析與Logistic回歸組合模型的蠓蟲分類方法

2016-07-31 21:17:08曹昌杰
中國科技信息 2016年14期
關鍵詞:分類方法模型

曹昌杰

成都理工大學管理科學學院

基于判別分析與Logistic回歸組合模型的蠓蟲分類方法

曹昌杰

成都理工大學管理科學學院

蠓蟲分類問題究其本質是一個典型的數據二分類問題。在傳統上采用判別分析或Logistic回歸的方式進行分類判別時,往往因為其算法本身的局限性而出現誤判且無法避免。本文在前人的研究基礎上提出了判別分析修正下的Logistic回歸方法和Logistic修正下的判別分析方法解決蠓蟲分類問題。在通過誤判率的比較和對異常數據的感知等前提下,為蠓蟲避害提供一種較為可靠的篩選方式。

縱觀為數不多的蠓蟲分類問題的研究,何水明為克服傳統BP算法中存在網絡學習速度慢的問題,提出了一種將同倫與BP算法互相結合的改進算法來進行蠓蟲分類;馮增哲等運用支持向量機算法,將蠓蟲分類這一個二分類問題轉化為一個二次規劃及其對偶規劃問題進行求解;王琪運用模糊聚類從而獲得模糊模式,并通過貼進度模式識別判斷蠓蟲的分類情況。但事實上,上述算法總存在著運算時間過長等各類局限性,特別地,是無法得到個體指標及其所屬類別之間的函數解析式,用以滿足簡明的判斷蠓蟲分類這一需求,并且對樣本數據中的異常數據點無法做出異常感知。

針對以上問題,我們采用將Logistic回歸和判別分析相結合的方式,力求簡便有效的找出一種蠓蟲分類方式,為蠓蟲避害找到一條較為便捷的途徑。

判別分析修正下的Logistic回歸方法

由于傳統Logistic回歸方法的局限性,本文提出判別分析修正下的Logistic回歸方法對其進行改進,即對蠓蟲數據采用Logistic回歸方法進行處理,但對易發生誤判的蠓蟲數據引入判別分析進行處理。主要步驟如下:

a)設n為需要進行分類的蠓蟲數據的樣本容量

b)for 1 to n do.

d)對差值的絕對值的大小進行排序,得到差值的中位數M1

f)end for

g)若找到類似的數據點則采用判別分析方法進行分類判別;否則,仍然采用Logistic回歸方法進行分類判別

e)因為蠓蟲分類問題本身是二分類問題的特殊性,在判斷出蠓蟲樣本數據不屬于無害類(Af類)蠓蟲時,即已判定該蠓蟲屬于有害類(Apf類)蠓蟲。

Logistic回歸修正下的判別分析方法

判別分析是通過得到某個樣本數據與各樣本重心之間的馬氏距離確定樣本數據所屬的類別。若某類樣本數據的離散程度過大,與該樣本重心之間馬氏距離較大的一些樣本數據可能會出現誤判的情況。基于這樣的思想,利用Logistic回歸修正判別分析方法,主要步驟如下:

a)設n為需要進行分類的蠓蟲數據的樣本容量

b)根據蠓蟲數據進行馬氏距離判別分析,形成兩類樣本數據

c)for 1 to n do

d)在上述通過分類所得到兩類樣本數據中,分別在各類數據中,計算本類樣本數據與各自樣本重心的馬氏距離,分別記為,我們將它們分別記X1、X2類

e)將X1類和X2類的數據分別進行大小排序,找到兩類數據的中位數,分別記為

g)end for

h)將通過上述過程被記錄下來的數據點進行Logistic回歸方法進行分類,否則,仍然采用判別分析進行分類

實例論證

本文使用的蠓蟲數據是由生物學家W.L.Grongan和W.W.Wirt在1981年根據蠓蟲的觸角長度和翼長加以區分而得到,我們用上述方法將蠓蟲數據進行分類,并將分類數據與原數據進行比較,通過觀察誤判率即可對分類方法做出有效評判。其中,無害蠓蟲用Af標記,有害蠓蟲用Apf標記。

判別分析修正下的Logistic回歸方法

根據蠓蟲數據計算得出Logistic回歸函數模型如下:

并由上式可得各蠓蟲數據分類為無害蠓蟲的概率分別是:

1號: 0.7465,2號:0.8332,3號:0.7365,4號:0.7660,5號:0.6884,6號:0.7515,7號:0.5332,8號:0.3558,9號:0.2361,10號:0.4076,11號:0.4955,12號:0.2605,13號:0.2585,14號:0.1882,15號:0.3915

利用上述數據可得,M1=0.198107.

在判斷出可能得到誤判的誤判點之后,利用判別分析再對這些數據點進行判別分析,并最終得到誤判率為5.56%。即7號蠓蟲的分類出現錯誤。

從該類組合方法模型的判斷過程中,我們一共對6個可能出現誤判的點進行了重新判定,該類組合方法模型感知到蠓蟲數據中的第7點為異常數據,與事實相符。

Logistic回歸修正下的判別分析方法

根據蠓蟲數據可知,各個蠓蟲樣本數據點對其樣本重心的馬氏距離分別是:

表1 1-6號蠓蟲對于Apf類蠓蟲樣本重心的馬氏距離

表2 7-15號蠓蟲對于Af類蠓蟲樣本重心的馬氏距離

則由表1、表2可得,M21=1.2393,M22=1.1345.通過選擇并記錄下的數據點,將其進行Logistic回歸,得到Logistic回歸函數模型如下:

根據最終判別結果可知,該方法的誤判率是13.89%.

結論

通過將兩類組合模型的蠓蟲分類方式分別應用于經典蠓蟲數據,本文得出以下結論:

就兩類組合模型自身比較而言,判別分析修正下的Logistic回歸方法具有更低的誤判率,而誤判率本身也是人為修改數據所致,可見,該組合模型不僅能夠準確的判斷出蠓蟲分類,還能對數據的異常數據做出異常感知。可見,判別分析修正下的Logistic回歸方法是一種較為有效的蠓蟲分類方法。

曹昌杰(1995-)男,現主要從事數據分析學習。

猜你喜歡
分類方法模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 91香蕉视频下载网站| 免费一级毛片在线播放傲雪网 | 日本免费a视频| 国产黄色视频综合| 国产成人麻豆精品| 精品无码一区二区在线观看| 免费无码AV片在线观看中文| 亚洲国产理论片在线播放| 国产流白浆视频| 黄色一级视频欧美| 亚洲区欧美区| 国产第二十一页| 91福利在线观看视频| 精品人妻系列无码专区久久| 免费国产无遮挡又黄又爽| 日本不卡免费高清视频| 人妻一区二区三区无码精品一区| 国产香蕉在线视频| 99re经典视频在线| 91亚洲精品国产自在现线| 国产成人久视频免费| 色婷婷久久| 国产精品网曝门免费视频| 成人小视频在线观看免费| 国产精品久久久免费视频| 午夜丁香婷婷| 一区二区三区高清视频国产女人| 亚洲黄网在线| 无码专区在线观看| 中国一级特黄视频| 秋霞一区二区三区| 亚洲精品视频在线观看视频| 小13箩利洗澡无码视频免费网站| 国禁国产you女视频网站| 欧美成人区| 九九九久久国产精品| 国产美女免费| 亚洲国语自产一区第二页| 成人免费黄色小视频| 亚洲无码熟妇人妻AV在线| 国产午夜一级淫片| 波多野结衣中文字幕一区| 亚洲国产精品不卡在线 | av在线5g无码天天| 久久www视频| 国产v欧美v日韩v综合精品| 国产精品流白浆在线观看| 亚洲av无码成人专区| 国产另类乱子伦精品免费女| 亚洲成人播放| 欧美亚洲国产一区| 无码内射在线| 国产精品永久久久久| 日本久久久久久免费网络| 91精品免费高清在线| 亚洲美女一区| 亚洲视频免| 免费高清自慰一区二区三区| 国产福利免费视频| 一级爱做片免费观看久久| 国产在线拍偷自揄拍精品| 国产91熟女高潮一区二区| 国产精女同一区二区三区久| 婷婷色一区二区三区| 午夜福利免费视频| 免费jjzz在在线播放国产| 狠狠色婷婷丁香综合久久韩国 | 国产第一页免费浮力影院| 久久鸭综合久久国产| 国产精品毛片一区| 色婷婷视频在线| 色欲综合久久中文字幕网| 91无码国产视频| 日韩黄色大片免费看| 婷婷综合亚洲| 色成人综合| 欧美日韩亚洲国产主播第一区| 婷婷色一二三区波多野衣| 成人国产小视频| AV天堂资源福利在线观看| 国产成人综合在线视频| 午夜福利在线观看成人|