999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

低質量數據驅動的支持向量機的發展與應用

2019-07-19 05:47:45趙興章
活力 2019年8期
關鍵詞:機器學習

趙興章

【摘要】低質量數據驅動的支持向量機主要的作用是機器學習和模式識別。它在機器學習和模式識別方面具有理想的性能和特有的優勢。

【關鍵詞】低質量數據;支持向量機;機器學習;機器學習

引言

支持向量機是機器學習與模式識別領域最優秀的成果。SVM以統計學理論為基礎,研究小樣本情況下的機器學習規律,考慮漸近性能要求,并追求有限信息條件下的最優結果。SVM采用了新型的統計學VC維理論,并運用結構風險最小化、間隔最大化、核函數等相關技術。SVM具有堅實的數學理論基礎,有效地解決了有限樣本條件下高維數據模型的構建問題,并具有泛化能力強、收斂到全局最優、維數不敏感等優點。SVM模型及相關理論已經被成功地應用于眾多領域,如:文本歸類、圖像處理、語言分析、人臉識別、生物信息辨識等。這也說明了SVM在機器學習和模式識別方面具有理想的性能和特有的優勢。目前,SVM是機器學習與模式識別領域最熱門的研究方向之一。

一、支持向量機在各個領域遇到的問題

SVM理論在工業領域已有的應用存在著一些問題。第一個方面的問題是已應用的SVM理論不完全符合工業數據的低質量驅動特性。一個不可忽略的事實是從工業現場獲得的工業數據屬于低質量數據。這里的“低質量”表達了多個方面的含義,我們以工業鋼表面缺陷分類識別為例說明。第一個方面,低質量數據表示缺陷樣本的標記信息存在噪聲。表面缺陷數據采集于鋼鐵企業生產線,其人工標記的群體一部分來自專家,另一部分來自一線工人。專家的缺陷標記質量能夠得到可靠的保證,但是一線工人的標記質量差異較大,存在錯誤標記的情況。第二個方面,低質量數據表示缺陷樣本的特征存在噪聲。缺陷特征噪聲主要源于工業生產線惡劣環境的影響,以及設備與采樣的錯誤。這些影響與錯誤造成了同類型缺陷不同樣本的特征差異,引起特征噪聲。查閱已應用SVM理論的鋼表面缺陷識別的文獻發現,大部分文獻都假設鋼表面缺陷是標準質量數據,少部分文獻對具有噪聲、不平衡的缺陷數據進行了分析,但只從樣本權重上進行解決。

第二個問題是已應用的SVM算法不滿足工業數據持續學習的要求。一個不可忽略的事實是工業數據的獲取是一個持續的過程。一般來說,工業數據都源于實際的產品生產線,這些產品生產線在運行的過程中會持續產生新的數據。這些新的數據對于學習與識別而言,可以作為原有的訓練數據的補充。因為這些新的數據一方面解決了原有訓練數據的不充足問題,另一方面對于不同時期的工業產品提供了最新的訓練數據。因此,工業數據的獲取、分析、學習需要以更新的方式實現。比如說,工業鋼表面缺陷檢測系統就被安裝在實際的鋼生產線上。檢測系統實時的分析、學習與識別鋼制產品,并使用這些新的數據在線更新檢測系統。因此,對于鋼表面缺陷的學習與識別算法要求具備增量學習的能力。已應用SVM算法的鋼表面缺陷識別的文獻很少涉及在線更新,也很少使用具有增量學習的SVM模型。也就是說,這些文獻都采用一個固定的訓練數據集,獲得一個固定的學習模型,忽略了后續獲得的新數據。

第三個問題是SVM最新理論沒有被及時的應用于工業領域。查閱相關的文獻發現,工業領域對于SVM的應用還停留在標準SVM及改進的SVM理論上。近幾年,隨著對SVM標準模型研究的深入,又出現了一批新的SVM模型,如:孿生支持向量機、彈球損失函數支持向量機、孿生超球體支持向量機、非平行支持向量機、未確知支持向量機等。我們把這些新型的SVM模型統稱為新生類SVM,它們主要在效率、精度、推廣性能與泛化性能上具有優勢。這些新生類SVM模型很少被應用到工業數據的機器學習與模式識別,如鋼表面缺陷檢測、工業故障診斷等。

二、低質量數據驅動的支持向量機

針對低質量數據的兩種情況:M分布不平衡和噪聲的問題,研究新的魯棒性分類模型。首先研究樣本分布不平衡,將兩類樣本盡量正確分開。以下有很多方法第一基于采樣的方法,基于數據層面的方法被廣泛應用基于SVM不平衡數據分類算法中,在訓練SVM模型前通過使用各種數據預處理方法使訓練樣本達到平衡,這些方法包括隨即向上/向下采樣法,這種方法不僅有效地減少對SVM的訓練時間,而且能提高分類器的性能。其次是基于核調整的方法通過核調整函數來改善SVM對不平衡數據集的分類性能。當訓練樣本包含大量噪聲樣本時,基于單一稀有類訓練出來的模型,通常與基于兩類樣本得到的模型具有良好的性能。可以使用模糊集理論和決策樹等方法解決不平衡數據分類問題。這種方法的優點可以解決大量噪聲的樣本的效果比較好。最后,是噪聲問題噪聲,主要包括標簽噪聲和特征噪聲主要解決的就是特征噪聲問題,特征噪聲可以采用二次損失函數和彈球(pinball)損失函數的SVM,主要從全局的角度降低了分類器對噪聲的敏感性。

結語

作為一種新型的機器學習方法,低質量數據驅動的支持向量機具有很強的理論基礎,能夠解決低質量數據的數學問題與實際問題,主要適用于模擬的函數、回歸分析和數據分類領域。與基本的支持向量機相比它的適應性更好、速度更快。

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 久久五月天综合| 久久毛片网| 亚洲国产精品美女| 国产v欧美v日韩v综合精品| 2020极品精品国产 | 中文毛片无遮挡播放免费| 欧美午夜在线观看| 无码精品福利一区二区三区| 爆乳熟妇一区二区三区| 亚洲系列中文字幕一区二区| 黄色片中文字幕| 亚洲中文精品久久久久久不卡| 精品自拍视频在线观看| 一区二区影院| 成人国产小视频| 精品久久久无码专区中文字幕| 无码AV日韩一二三区| 亚洲国产午夜精华无码福利| 亚洲天堂在线视频| 欧美一区二区啪啪| 国产农村1级毛片| 国产国语一级毛片在线视频| WWW丫丫国产成人精品| 制服无码网站| 国产麻豆aⅴ精品无码| 伊人精品视频免费在线| 婷婷六月综合网| 狠狠色婷婷丁香综合久久韩国| 激情無極限的亚洲一区免费| 不卡的在线视频免费观看| 国产av无码日韩av无码网站 | 波多野结衣一区二区三区四区视频| 国产成人无码Av在线播放无广告| 亚洲天堂视频网站| 青青热久免费精品视频6| 国产拍在线| 国产二级毛片| 国产精品视频观看裸模| 久久精品日日躁夜夜躁欧美| 久久久久人妻一区精品色奶水| 亚洲色图欧美一区| 欧美高清日韩| 亚洲无码视频图片| 国产免费久久精品44| 亚洲黄色成人| 美女毛片在线| 亚洲av无码成人专区| 香蕉综合在线视频91| 亚洲国产成人麻豆精品| 亚洲欧美自拍中文| 国产免费福利网站| 成人av手机在线观看| 无码高清专区| 亚洲国产成人综合精品2020| 亚洲伊人天堂| 91成人在线观看| 不卡网亚洲无码| 国产成人高清亚洲一区久久| 婷婷色狠狠干| 9966国产精品视频| 国产日韩欧美视频| 国产区人妖精品人妖精品视频| 欧美无专区| 亚洲人网站| 欧美精品伊人久久| 日本三级黄在线观看| 四虎影院国产| 亚洲嫩模喷白浆| 国产正在播放| 一级毛片在线播放免费观看| 中国丰满人妻无码束缚啪啪| 国产毛片片精品天天看视频| 欧美日韩理论| 国产免费人成视频网| 黄色三级网站免费| 内射人妻无码色AV天堂| 久久这里只精品国产99热8| 日本午夜视频在线观看| 久久香蕉国产线看观看式| 久久午夜夜伦鲁鲁片无码免费| 久久综合九色综合97网| 国产黑人在线|