999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

支持向量機在葡萄酒識別上的應用

2019-05-24 14:11:40陳婉嬌龍衛江
電腦知識與技術 2019年4期
關鍵詞:機器學習

陳婉嬌 龍衛江

摘要:在當今的大數據時代,機器學習越來越廣泛地應用于生活中,為人們解決實際生活生產的需要。其中,支持向量機算法是機器學習中重要的算法之一,應用廣泛且有效。文章主要介紹了支持向量機的原理和模型,還介紹了核函數在支持向量機中的應用和交叉驗證法的理論。在實驗部分,文章將支持向量機應用于葡萄酒數據集上,通過分析對比,得到了以下的結論:對于葡萄酒數據集,采用R語言對多種支持向量機模型進行比較,當支持向量機的類型為nu-classification,核函數為線性核函數時,識別的正確率最高,達到了98.86%,并且應用交叉驗證法進行驗證,降低了識別誤差。

關鍵詞:機器學習;支持向量機;核函數;葡萄酒數據集;交叉驗證法

中圖分類號:O242.1 文獻標識碼:A 文章編號:1009-3044(2019)04-0154-03

Abstract: Today is the era of big data and machine learning is widely used in life to solve the needs of real life production. Among them, the support vector machine (SVM) algorithm is one of the important algorithms in machine learning, and it is widely used and effective. The article mainly introduces the principle and model of support vector machine, and also introduces the application of kernel function in SVM. In addition, the principle of cross-validation is introduced. In the experiments, the paper applies the SVM to the wine dataset. Through analysis and comparison, the following conclusions are obtained: For the wine dataset, a variety of support vector machine models are used for comparison. When the type of SVM is nu-classification, and the kernel function is the linear kernel, the recognition rate is the highest, which is 98.86%. In addition, the cross-validation method is applied in this paper, which reduces the recognition error.

Key words: machine learning; support vector machine(SVM); kernel function; wine data set; cross-validation method

1 引言

在當今大數據時代,人工智能廣泛應用于生活中的各個領域,機器學習在科學研究中占據著越來越重要的地位,科學工作者致力于研究機器學習算法,機器學習算法通過已有數據進行學習,獲得學習規律,用于預測判別等等[1]。機器學習算法可分為監督學習、無監督學習、半監督學習,其中支持向量機是一種監督學習算法。

支持向量機也是機器學習中的一個重要的統計學習方法,應用廣泛且有效,在模式識別、函數逼近、函數擬合、回歸估計等均有很好的應用[2]。

本文主要研究支持向量機的算法,并將支持向量機應用于葡萄酒數據集上,選擇合適的核函數,采用交叉驗證法,探究支持向量機算法在該數據集上的判別效果。

2 基礎知識

2.1支持向量機模型

機器學習中的分類模型有很多,支持向量機就是其中的一種,它原始的模型主要是在特征空間中將樣本盡可能地分開,使得樣本間間隔最大化,但是并非所有的樣本都是完全線性可分的,于是有了軟間隔的解決方法,但是對于一些樣本是線性不可分的,就引出了核函數,將樣本映射到高維空間中,使得樣本在高維特征空間中可分,解決了樣本非線性問題。因此對于支持向量機可以分為硬間隔SVM,軟間隔SVM和非線性SVM[3][4]。

2.2 間隔與支持間隔

對于分類模型,屬于監督學習范疇,是希望可以在空間中找到某個超平面,可以將類別不一樣的樣本區分開來,而且這樣的超平面并不是唯一的,但最優化算法是可以找到最能區分樣本空間的超平面,選擇位于兩類訓練樣本正中間的劃分超平面,原因是這個超平面的分類結果最魯棒,泛化能力最強[5]。

2.4 交叉驗證法

交叉驗證法在機器學習中很常用,通常用于檢驗模型算法的性能,基本的想法是將樣本進行分組,分為訓練集與測試集,交替多次進行訓練與檢驗,以得到更為客觀的評價模型算法的性能指標,常見的方法有以下兩種:

1)留一法

留一法是每次將樣本中的一個樣本作為測試集,其他的樣本作為訓練集,假設樣本有n個,則需要重復進行n次檢驗,n次分類準確率的平均值作為分類準確率,被實際評估的模型與期望評估的模型很相似,但比較適合小樣本的情況[8]。

2)K-折交叉驗證

將樣本平均分為k組,每次試驗將其中一組作為測試集,其他k-1組作為訓練集,則需要進行k次試驗,將k次分類準確率的平均值作為分類準確率,通常k的取值均大于1,常見的有5折和10折交叉驗證法[8]。

3 實驗與應用

3.1 數據描述

本文的數據來自UCI上的機器學習數據庫,為葡萄酒數據集,表示的是意大利同一地區3中不同品種的葡萄酒13中化學成分含量,以期通過某種模型算法,可以將葡萄酒自動分類[9]。

本次分類的數據共有178個樣本,每個樣本有13個屬性,并提供每個樣本的正確分類,共有三類葡萄酒,現在選取兩個屬性Flavanoids和Hue對葡萄酒數據進行展示,可以看到,三類葡萄酒數據基本可由一定的超平面將其分開。

3.3 實驗

本文采用的R語言進行建模,采用支持向量機軟件包e1071,采用svm函數,其中,變量type在R語言中可選參數有C-classification、nu-classification、one-classification、eps-regression、nu-regression[10][11],前三種針對字符型結果變量的分類方式,第三種屬于邏輯判斷,后兩種針對數量型結果變量的分類方式,在R語言中,變量kernel可選參數有Linear、polynomial、radial、sigmoid,分別為線性核函數、多項式核函數、高斯核函數、Sigmod核函數,分別將type為C-classification、nu-classification、one-classification和kernel為Linear、polynomial、radial、sigmoid[10][11]組合的12種模型應用于葡萄酒數據集上,用十折交叉驗證法比較這12種組合模型的效果,采用10折檢驗數據的正確率的平均值作為模型檢驗的正確率。

可見,表現最差的是type為one-classification的支持向量機模型,無論核函數取哪一種正確率仍很低,表現最好的模型是type為nu-classification,核函數為線性核函數的支持向量機模型,識別的正確率為98.86%,通過觀察這一類模型十折交叉驗證正確率最高的為100%,共有八次達到正確分類,另外兩次的正確率分別是:94.12%和94.44%。因此我們可以看到這一葡萄酒數據集在支持向量機模型中分類判別表現較好。

4 總結

文章將支持向量機應用在葡萄酒數據集的分類識別中,通過實驗說明了當類型為nu-classification,核函數為線性核函數的支持向量機模型時,識別正確率最高,達到了98.86%。此外,通過了多種模型的比較,并且應用交叉驗證法進行驗證,降低了分類的誤差。

參考文獻:

[1] 周志華. 機器學習[M]. 清華大學出版社, 2016.

[2] 李航. 統計學習方法[M]. 清華大學出版社, 2012.

[3] Saurabh Paul, Malik Magdon-Ismail, Petros Drineas. Feature selection for linear SVM with provable guarantees[J]. Pattern Recognition, 2016, 60:205-214.

[4] Pirasteh A, Maghooli K, Mousavizadeh S. Iris recognition using localized zernikes feature and SVM[J]. Applied Mathematics & Computation, 2016, 168(2):1128-1144.

[5] Shang W, Li L, Wan M, et al. Industrial communication intrusion detection algorithm based on improved one-class SVM[C]// Industrial Control Systems Security. IEEE, 2016:21-25.

[6] 李彤. 支持向量機的分解理論算法研究[J]. 河南科技, 2013(2):9-10.

[7] 姚迪, 劉會杰, 劉潔, 等. 基于支持向量機的認知無線電頻譜感知[J]. 電子設計工程, 2018(21).

[8] Xu P, Davoine F, Zha H, et al. Evidential calibration of binary SVM classifiers[J]. International Journal of Approximate Reasoning, 2016, 72(C):55-70.

[9] Available at http://blog.csdn.net/zjccoder/article/category/2397449

[10] 肖敏, 王小天, 韓路朋. 基于SVM的露天邊坡穩定性預測模型研究及R語言實現[J]. 露天采礦技術, 2018, 33(1): 38-42.

[11] 姚興山. 基于統計的中文文本分類研究[J]. 情報理論與實踐, 2009, 32(5):95-98.

【通聯編輯:王力】

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 国产精品亚洲а∨天堂免下载| 精品视频一区二区观看| 久久精品中文字幕少妇| 一级全黄毛片| 热re99久久精品国99热| 亚洲中文字幕97久久精品少妇| 国产成人禁片在线观看| 亚洲天天更新| 日韩一区二区三免费高清| 88av在线播放| 国产成人a在线观看视频| 亚洲综合中文字幕国产精品欧美| 国产幂在线无码精品| 久久semm亚洲国产| 亚洲熟女偷拍| 精品国产自在在线在线观看| 视频二区欧美| 亚洲视频无码| 国产xxxxx免费视频| 97超爽成人免费视频在线播放| 亚洲美女一区| 国产农村1级毛片| 亚洲男人的天堂网| 超薄丝袜足j国产在线视频| 国产在线观看一区精品| 青青青草国产| 欧洲一区二区三区无码| 欧美区一区| 国产成年无码AⅤ片在线| 韩日免费小视频| 色噜噜狠狠色综合网图区| 91精品啪在线观看国产60岁| 亚洲国产天堂久久九九九| 99人体免费视频| 国产成在线观看免费视频| 亚洲经典在线中文字幕| 日本a∨在线观看| 五月激情婷婷综合| 日韩国产综合精选| 71pao成人国产永久免费视频| 国产精品第页| 欧美精品不卡| 国产福利在线观看精品| 亚洲av日韩av制服丝袜| 91精品国产福利| 91外围女在线观看| 欧美一级在线播放| a级毛片一区二区免费视频| 欧美国产成人在线| 潮喷在线无码白浆| 好吊妞欧美视频免费| 亚洲国产欧美目韩成人综合| 国产地址二永久伊甸园| 亚洲成A人V欧美综合天堂| 四虎免费视频网站| 无码一区中文字幕| 嫩草影院在线观看精品视频| 99国产精品免费观看视频| 亚洲黄色视频在线观看一区| 亚洲精品少妇熟女| 亚洲色欲色欲www在线观看| 天天摸天天操免费播放小视频| 欧美一区福利| 性色一区| 在线播放精品一区二区啪视频| 一本一道波多野结衣一区二区| 亚洲国产看片基地久久1024| 国产在线精彩视频论坛| www.亚洲一区二区三区| 中文字幕首页系列人妻| 亚洲欧洲日产国产无码AV| 中文字幕精品一区二区三区视频| 色综合五月婷婷| 丝袜久久剧情精品国产| 东京热一区二区三区无码视频| 国产精品99久久久久久董美香| 亚洲国产精品VA在线看黑人| 免费aa毛片| 黄色网址手机国内免费在线观看| 99re精彩视频| swag国产精品| 真人高潮娇喘嗯啊在线观看|