999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量機的鳶尾花類別預測

2018-01-12 11:51:50孫萌月張奧麗曾進成
智富時代 2018年12期

孫萌月 張奧麗 曾進成

【摘 要】支持向量機是基于統計學習理論發展起來的一種新的機器學習方法,應用于解決各種小樣本分類問題。經文獻報道,鳶尾花自身的固有屬性可以作為輸入指標用來預測鳶尾花的種類。本文以鳶尾花的屬性數據建立分類模型,結果表明支持向量機分類方法具有很好的泛化性能,為自動判定鳶尾花種類提供了一種有效的方法。

【關鍵詞】支持向量機;分類問題;核函數

鳶尾花屬于鳶尾科,是一類具有較高觀賞價值的草本植物,其萼片是絢麗多彩的,和向上的花瓣不同,花萼是下垂的。通過鳶尾花的屬性來判斷鳶尾花的種類,可以更高效率的培育出相應需要的鳶尾花,來滿足現實需求量。

人工智能的快速發展帶動了基于數據挖掘的人工神經網絡和支持向量機智能分類方法。人工神經網絡具有非線性、自學習、自適應,能夠大規模并行處理等特征,同時內部訓練過程是在黑箱中進行的,只要直接輸入數據即可得出結果[1]。但缺點也很明顯,神經網絡中參數無法解釋,同時訓練過程在黑箱中進行,具有一定的盲目性,由于它是基于經驗風險最小化原則,容易出現“過擬合”現象,即有可能出現陷入局部最優解而無法得到全局最優解的現象。而支持向量機(SVM)借助最優化方法來解決機器學習問題[2],依賴結構風險最小化原則,針對小樣本得到全局最優解,解決了在神經網絡方法中無法避免的局部極值問題。

因此,本文將目標數據集的三種鳶尾花的花萼長度、花萼寬度、花瓣長度、花瓣寬度四個屬性用來做樣本的定量分析,建立模型,通過SVM分類的方法,根據給定的訓練集,通過大量的訓練點,尋找實值函數,由此得到決策函數,以便用決策函數推斷任意模式(輸入指標向量或稱輸入)相對應的輸出指標。

一、基于支持向量機的鳶尾花類別預測

1.支持向量機

支持向量機分類方法是一種基于結構風險最小化的原理,針對一個給定的有限數量訓練集樣本的學習任務,通過在原空間或經投影后的高維空間中構造最佳分類超平面作為決策面。從線性可分模式來看,該決策面不但能夠將所有訓練樣本正確分類,而且使訓練樣本中離分類面最近的點到分類面的距離最大[3]。訓練樣本為非線性時,通過非線性函數φ( x) 將樣本 x 映射到一個高維線性特征空間,在這個維數可能為無窮大的線形空間中構造最優分類超平面,并得到分類器的判別函數。再根據最大間隔思想[4],引入懲罰項 CΣ§i,建立原始最優化問題, 通過強對偶定理對原問題進行求解,利用核函數提高樣本的線性可分性,將線性分類學習機算法推廣到非線性的情況。

2.K重交叉驗證

K重交叉驗證是常用的精度測試方法[5]。驗證方法是將數據集分成 K份,輪流將其中K-1份做訓練,1份做測試,K次結果的最佳值作為對算法精度的估計。本文算法中采用K重交叉驗證方法來計算準確率,進而確定合適的懲罰參數C及核函數。

3.數據

在UCI數據庫,下載得到初始的Iris樣本數據集共計150條。統計各個選項在不同決定指標所占比例對比分析,從而得到合適的指標,這里主要參考各指標的選項在輸出指標鳶尾花類別中所占的比例。經預處理,分別得到三類鳶尾花的四個屬性的平均值數據,

二、建模

鳶尾花的種類有很多,這里我們選取山鳶尾、變色鳶尾、維吉尼亞鳶尾三種比較有名的鳶尾花類別,而鳶尾花類別受其自生屬性影響,經文獻查閱,最終選取較為典型的4個指標作為輸入,以鳶尾花類別作為輸出建立模型。該模型為多類分類問題,以鳶尾花類別作為輸出指標,分為山鳶尾、變色鳶尾、維吉尼亞鳶尾三種。而輸入指標有花萼長度、花萼寬度、花瓣長度、花瓣寬度。

重要指標進行分析:

(1)TP Rate: 簡稱TPR(真正率),即被模型預測為正的正樣本比率。TPR = TP /(TP + FN) 正樣本預測結果數 / 正樣本實際數。以第一條數據為例,TPR=28/30= 0.933。

(2)FP Rate:簡稱FPR(假正率),即被模型預測為正的負樣本比率。FPR = FP /(FP + TN)?被預測為正的負樣本結果數 /負樣本實際數。以第一條數據為例,FPR=2/120= 0.017。

(3) MCC:即Matthews 相關系數。MCC=(TP*TN-FP*TN+FP)*(TN+FN)]^0.FN)/[(TP+FP)*(TP+FN)*(5,同時考慮了 FP和 FN,并適用于不平衡問題(兩個類的比例相差很大)。取值在[-1,1]之間,1 代表完美的預測,0 代表與隨機分類器效果一樣,-1 代表預測結果與實際結果完全不一致。

可知,通過對該訓練模型的訓練與測試,分類準確率可達到95.3%,能夠將鳶尾花的三種類別比較好的分開,具有較高的泛化能力,且MCC均趨近于1,說明該訓練模型的穩定性很好。

三、結論

本文通過實例驗證可以看出鳶尾花的種類受其屬性的影響,根據鳶尾花的屬性及種類分別作為輸入、輸出指標建立模型,應用支持向量機分類的方法進行研究,得到合適的決策函數,可以對已知相關屬性的鳶尾花做出較為準確的分類。為預測鳶尾花種類提供了一種有效的方法,也為鳶尾花種植者選擇種類提升了效率,帶來了方便,同時也通過此實例體現了支持向量機分類應用于解決小樣本分類問題的優越性。

【參考文獻】

[1]蔣林利. 基于支持向量機的電子商務模式下的信用評價模型[J].現代計算機學報,2012.

[2]鄧乃揚,田英杰. 數據挖掘中的新方法——支持向量機[M].北京:科學出版社,2004,49-77,164-223.

主站蜘蛛池模板: 内射人妻无套中出无码| 国产成人亚洲日韩欧美电影| 波多野结衣AV无码久久一区| 成年看免费观看视频拍拍| h网址在线观看| 亚洲天堂视频在线免费观看| 午夜国产不卡在线观看视频| 免费在线a视频| 成人亚洲天堂| 国产成人综合亚洲欧洲色就色| a在线观看免费| 久久久久免费看成人影片| 亚洲一道AV无码午夜福利| 国产精品亚洲一区二区三区在线观看| 亚洲AV成人一区二区三区AV| 国产浮力第一页永久地址| 日本免费一区视频| 久久久久久国产精品mv| 国产免费羞羞视频| 91av国产在线| 国产黄在线观看| 全部毛片免费看| 三级毛片在线播放| 人人艹人人爽| 国产成人你懂的在线观看| 天天操天天噜| 色网站在线免费观看| 久久9966精品国产免费| 国产特一级毛片| 久久99精品久久久久久不卡| 久久精品91麻豆| 四虎亚洲国产成人久久精品| 欧美www在线观看| 欧美精品一区在线看| 国产丝袜91| 99久久国产综合精品2020| 国产jizz| 无码日韩人妻精品久久蜜桃| 一级毛片免费观看不卡视频| 亚洲第一视频网站| 538精品在线观看| 日韩午夜片| 久久免费精品琪琪| 久夜色精品国产噜噜| 日本久久网站| 亚洲精品高清视频| 凹凸国产熟女精品视频| 欧美啪啪视频免码| 欧美国产另类| 视频在线观看一区二区| 色综合天天综合中文网| 亚洲欧洲日产无码AV| 欧美一道本| 99re热精品视频国产免费| 九九精品在线观看| 激情综合婷婷丁香五月尤物| 全裸无码专区| 国产小视频a在线观看| 日本五区在线不卡精品| 久久国产精品嫖妓| 国产精品开放后亚洲| 国产最新无码专区在线| 91成人试看福利体验区| 欧美精品伊人久久| 亚洲精品国产日韩无码AV永久免费网| 亚洲综合欧美在线一区在线播放| 女人18毛片久久| 色综合狠狠操| 一本一道波多野结衣av黑人在线| 亚洲aⅴ天堂| 在线无码九区| 91视频99| 2021无码专区人妻系列日韩| 国产福利2021最新在线观看| 欧美日韩精品综合在线一区| 亚洲香蕉久久| 久久这里只精品热免费99| 国产91在线|日本| 伊人婷婷色香五月综合缴缴情| 97se亚洲综合| 久久久精品无码一二三区| 国产精品手机视频|