999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于最小分類誤差的閾值優(yōu)化方法設計

2018-10-29 11:09:14張夢婷李星野
軟件導刊 2018年8期

張夢婷 李星野

摘要:傳統(tǒng)Fisher線性判別(FLD)的常用閾值對特定數據集的分類精度存在明顯差異。為提高分類精度,通過最小化貝葉斯誤差對二分類問題的FLD閾值進行了優(yōu)化設計。對UCI中的8個數據集進行驗證,將所得的平均分類精度與常用閾值在這些數據集上所得的平均分類精度進行比較。結果表明,所提出的優(yōu)化閾值分類效果顯著,相比于常用閾值,在平均分類精度上有所提升。

關鍵詞:FLD;閾值;數據集;貝葉斯誤差;平均分類精度

DOIDOI:10.11907/rjdk.173205

中圖分類號:TP301

文獻標識碼:A 文章編號:1672-7800(2018)008-0081-04

英文摘要Abstract:The commonly-used thresholds of the traditional Fisher linear discriminant (FLD) have significant differences in the classification accuracy on particular datasets.In order to improve the classification accuracy,an FLD threshold is optimized in this paper for binary classification problems by minimizing the Bayes error,and validated on the eight datasets in UCI.Then,the obtained average classification accuracy is compared with that obtained by the commonly used thresholds on these datasets.The experimental results show that the proposed optimised threshold has significant effect on the classification.Compared with the commonly-used thresholds,the optimised threshold has significant improvement in the average classification accuracy.This verifies the validity and feasibility of the design.

英文關鍵詞Key Words:FLD; threshold; datasets;bayes error; average classification accuracy

0 引言

線性判別分析(Linear Discriminant Analysis,LDA),也稱作Fisher線性判別(Fisher Linear Discriminant,FLD),是模式識別中分類問題的經典算法,基本思想是將高維樣本數據壓縮到低維矢量空間,找到一個最佳投影方向,使不同類別的數據在這個投影方向上獲得最好的分離,以達到提取分類信息和壓縮特征空間維數效果。使用這種方法能保證投影后的樣本數據在新的投影空間中有最小的類內距離和最大的類間距離,即數據在該空間中有最佳可分離性[1]。

FLD作為一種有監(jiān)督的學習算法,應用于醫(yī)學診斷[2]、人臉識別[3]、信號分類[4]等多個領域。但是,該算法在某些樣本數據上的分類效果并不理想,很多學者對算法本身作了一定優(yōu)化。張振平等[5]針對LDA方法中類內計算常常引起錯誤分類的問題,提出了Bayes錯誤率最小的改進型LDA特征選擇方法,在最小化錯誤率原則下,采用迭代算法求解最優(yōu)特征選擇矩陣,取得了比原LDA更好的分類效果。曹玲玲等[6]提出了基于FLD的貝葉斯分類器算法,對測試樣本先進行投影得出新的樣本數據,再利用經典的貝葉斯算法進行分類,使得分類錯誤率最小。覃志祥等[7]和莊哲民等[8]分別從不同角度重新定義樣本類間離散度矩陣,優(yōu)化了傳統(tǒng)的Fisher準則,實現了更好的分類性能。沈虹等[9]依據貝葉斯決策的最小錯誤率確定了割除指紋背景區(qū)域的閾值,明顯提高了指紋分割效果。李伶俐[10]通過對數據挖掘中分類算法的綜合研究,得出貝葉斯算法相比于其它分類算法精確度高,錯誤率最小的結論,為本文研究提供了理論依據。FLD的目標是確定決策平面的法向量而不是確定最終分類平面位置的閾值[11];李艷芳等[12]針對常用閾值對不平衡數據集分類性能差的問題提出了多個經驗閾值,并依據分類精度對閾值做了優(yōu)化,通過大量實驗證明其方法的有效性。由于閾值不同會對分類結果造成一定偏差,甚至會嚴重影響FLD的分類精度,結合上述文獻,本文在最小化貝葉斯分類誤差的基礎上研究找到一個更佳的分類閾值,使不同類別的數據在該閾值確定的決策平面處實現更精確的分離。

1 分類原理

1.1 Fisher分類原理和常用閾值

對應著取得極小值的分類誤差,此時的y0為在最小化分類誤差的基礎上所求得的優(yōu)化閾值。

2 實驗驗證

為檢驗該優(yōu)化閾值的分類效果,從UCI機器學習存儲庫(http://archive.ics.uci.edu/ml)中選擇8個數據集對其進行驗證,數據集如表1所示。

對表1中的每個數據集采取10折交叉驗證并分別進行10次不同的試驗。由于本文提出的優(yōu)化閾值是建立在二分類問題基礎上的,所以對有K>2個類的數據集,采用一對一(OvO)策略進行分類,每次對數據集中的每一對類別進行分類,而忽略其它K-2個類別。因此,要進行K(K-1)/2次分類,并計算所有K(K-1)/2次分類的平均分類精度作為分類的性能指標。

3 實驗結果

通過使用本文提出的優(yōu)化閾值對表1中的8個數據集進行試驗,并與Fisher線性判別常用閾值在這些數據集上的分類結果進行比較。為簡化起見,將由公式(2)、(3)、(4)表示的閾值分類方法分別表示為FLD-1、FLD-2和FLD-3,利用優(yōu)化閾值式(13)進行分類的方法表示為FLD-4,結果如表2所示(最高的平均分類精度用粗體表示)。

從表2可以看出,除了數據集7和8,使用優(yōu)化閾值進行分類的方法在其它數據集上獲得的平均分類精度都明顯高于利用其它3種常用閾值進行分類所得的平均分類精度,說明使用本文提出的優(yōu)化閾值進行分類方法能在大多數數據集上取得更佳的分類效果,提高了數據集分類的平均分類精度。將表2所測的8個數據集的平均分類精度以折線形式表示如圖1所示。

從圖1可以看出,由FLD-4所表示的優(yōu)化閾值分類方法測得的平均分類精度折線圖大多位于其它3種常用閾值分類方法的上方,只有在數據集7和數據集8上的平均分類精度不是最高,但也與最高的平均分類精度相差不大。所以,在線性判別分析中,可使用此優(yōu)化閾值進行分類。另外還可看出,由FLD-4方法分類所得的平均分類精度在上述所有數據集上都高于由FLD-3方法所得的平均分類精度。由此可見,方法FLD-3中的分類閾值(公式(4))雖然考慮了類概率的影響和作用,但對于兩類間樣本數目差別很大的數據集,如數據集3、數據集7和數據集8,FLD-3不適用。

4 結語

本文主要考慮了傳統(tǒng)線性判別分析中常用閾值對數據集分類精度存在明顯差異的情況,在努力提高平均分類精度的基礎上,通過使貝葉斯分類誤差最小對FLD的分類閾值進行優(yōu)化設計。從UCI機器學習存儲庫中選擇8個數據集進行驗證,然后將所得的平均分類精度與利用常用閾值進行分類所得的平均分類精度進行比較。實驗表明,由優(yōu)化閾值進行分類的方法在大多數數據集上都能取得很好的分類效果,能有效提高FLD的平均分類精度,從而證明了該設計的有效性和可行性。

參考文獻:

[1] 李文斌,陳嶷瑛,張娟,等.使用Fisher線性判別方法的提取分類器[J].計算機工程與應用,2010,46(14):132-134.

[2] COOMANS D,M JONCKHEER,DL MASSART ,et al.The application of linear discriminant analysis in the diagnosis of thyroid Dis- eases [J].Analytica Chimica Acta,1978,103(4):409-415.

[3] 謝永林.LDA算法及其在人臉識別中的應用[J].計算機工程與應用,2010,46(19):189-192.

[4] 趙海濱,顏世玉,于清文,等.采用Fisher線性判別分析進行MEG信號的分類[J].東北大學學報:自然科學版,2013,34(12):1695-1698.

[5] 張振平,宣國榮,鄭俊翔,等.一種基于最小分類錯誤率的改進型LDA特征選擇算法[J].微型電腦應用,2005,21(4):4-6.

[6] 曹玲玲,潘建壽.基于Fisher判別分析的貝葉斯分類器[J].計算機工程,2011,37(10):162-164.

[7] 覃志祥,丁立新,簡國強,等.一種改進的線性判別分析法在人臉識別中的應用[J].計算機工程,2006,32(4):211-213.

[8] 莊哲民,張阿妞,李芬蘭.基于優(yōu)化的LDA算法人臉識別研究[J].電子與信息學報,2007,29(9):2047-2049.

[9] 沈虹,汪劍鳴,苗長云.基于貝葉斯最小錯誤率的一種新的指紋分割算法[J].微計算機信息,2006,22(1):208-210.

[10] 李伶俐.數據挖掘中分類算法綜述[J].重慶師范大學學報:自然科學版,2011,28(4):44-47.

[11] GAO D Q,DING J,ZHU C M .Integrated fisher linear discriminates:an empirical study[J].Pattern Recognition,2014,47(2):789-805.

[12] 李艷芳,高大啟.Fisher線性判別式閾值優(yōu)化方法研究[J].計算機應用與軟件,2016,33(6):141-145.

[13] 孫即祥.現代模式識別 [M].第2版.北京:高等教育出版社,2008.

[14] 邊肇祺,張學工.模式識別 [M].第2版.北京:清華大學出版社,1999.

[15] 陳弋蘭,王鳴,孫書誠.樸素貝葉斯分類器的誤差設計[J].安徽工程科技學院學報,2008,23(4):48-51.

[16] 周德全.離散貝葉斯分類算法及分類誤差估計[J].儀器儀表學報,2004,25(4):345-347.

(責任編輯:杜能鋼)

主站蜘蛛池模板: 国产成人免费| 99国产精品免费观看视频| 久久精品国产精品一区二区| 1769国产精品免费视频| 天天做天天爱夜夜爽毛片毛片| 久久精品亚洲热综合一区二区| 亚洲男人天堂久久| 欧美啪啪一区| 中文字幕 日韩 欧美| 久久婷婷综合色一区二区| 思思99热精品在线| 2021无码专区人妻系列日韩| 国产黄色片在线看| 亚洲欧美日韩成人在线| 国产精品美女免费视频大全| 中文字幕久久精品波多野结| 久久天天躁狠狠躁夜夜躁| 亚洲欧美精品一中文字幕| 97se亚洲综合在线| 亚洲中文字幕久久精品无码一区| 又爽又大又黄a级毛片在线视频 | 欧美亚洲激情| 国产99久久亚洲综合精品西瓜tv| 永久免费AⅤ无码网站在线观看| 一本一本大道香蕉久在线播放| 91久久夜色精品| av在线手机播放| 成人av手机在线观看| 又猛又黄又爽无遮挡的视频网站| 国产h视频在线观看视频| 亚洲欧洲天堂色AV| 一级毛片网| 国产剧情国内精品原创| 日本免费福利视频| 国产精品片在线观看手机版| 视频国产精品丝袜第一页| 久久香蕉国产线| 国产午夜福利片在线观看| 露脸国产精品自产在线播| 亚洲欧美另类中文字幕| 国产乱人伦精品一区二区| 国产在线无码av完整版在线观看| 日韩欧美国产综合| 97视频免费在线观看| 欧美成人午夜在线全部免费| 综合久久久久久久综合网| 99久久国产自偷自偷免费一区| 综合久久久久久久综合网| 日本一本正道综合久久dvd| 伊人婷婷色香五月综合缴缴情| 亚洲va视频| 亚洲经典在线中文字幕| 她的性爱视频| 亚洲毛片网站| 制服丝袜一区| 东京热av无码电影一区二区| 久热re国产手机在线观看| 色天天综合| 幺女国产一级毛片| 毛片一区二区在线看| 日韩经典精品无码一区二区| 亚洲成A人V欧美综合天堂| 婷婷午夜天| 日本在线欧美在线| 欧美色综合网站| 最新国语自产精品视频在| 中文国产成人精品久久| 亚洲色图另类| 午夜啪啪福利| m男亚洲一区中文字幕| 亚洲午夜天堂| yjizz国产在线视频网| 久久77777| 在线免费无码视频| 国产伦片中文免费观看| 色天天综合久久久久综合片| 久久精品一卡日本电影| 日韩精品无码免费专网站| 亚洲欧美不卡| 99在线视频精品| 99视频精品全国免费品| 欧美在线一二区|