999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Transfer-SVM多標簽文本分類算法研究

2019-08-06 13:48:19李程文宋文廣譚建平
無線互聯(lián)科技 2019年10期

李程文 宋文廣 譚建平

摘? ?要:傳統(tǒng)的支持向量機分類模型只有在利用大量已標注數(shù)據(jù)進行訓練才能獲得較高精度。在實際應用中,多標簽數(shù)據(jù)相對于傳統(tǒng)單標簽數(shù)據(jù)更具有價值,但多標簽數(shù)據(jù)中含有大量冗余數(shù)據(jù),獲取大量多標簽數(shù)據(jù)難度非常大。文章提出一種基于遷移學習的分類算法,利用目標數(shù)據(jù)域和源數(shù)據(jù)域的相關(guān)性,從源數(shù)據(jù)域中選取對分類超平面起關(guān)鍵作用的支持向量和目標數(shù)據(jù)域,一起訓練分類模型以提高分類精度。

關(guān)鍵詞:多標簽;遷移學習;文本分類;支持向量機

一般支持向量機(Support Vector Machine,SVM)要想獲得比較好的分類精度需要滿足兩個需求:(1)利用大量的有標簽數(shù)據(jù)訓練分類模型。(2)要求測試集和訓練集是同分布數(shù)據(jù)[1]。

針對傳統(tǒng)的SVM,需要利用大量的有標簽數(shù)據(jù)訓練分類模型才能獲得分類精度的問題[2],本文引入遷移學習,通過選取源域數(shù)據(jù)集中對分類超平面起決定性作用的關(guān)鍵支持向量與目標數(shù)據(jù)域數(shù)據(jù)一起進行模型訓練,并且放寬了對訓練集和測試集的要求,以提高分類模型的分類精度[3]。

1? ? 基于Transfer-SVM多標簽文本分類算法

1.1? 算法思想

本文MT-SVM的核心思想是:由于對支持向量機的分類超平面起決定性作用的只有關(guān)鍵的少數(shù)支持向量,所以,假如源數(shù)據(jù)域和目標數(shù)據(jù)域相關(guān),則這兩個數(shù)據(jù)域的支持向量機分類超平面非常接近,因此,決定目標數(shù)據(jù)源的分類超平面的支持向量和決定源數(shù)據(jù)域的分類超平面的支持向量非常接近。所以,通過選取源域數(shù)據(jù)集中對分類超平面起決定性作用的關(guān)鍵支持向量與目標數(shù)據(jù)域數(shù)據(jù)一起進行模型訓練以提高分類模型的分類精度是可行的。

1.2? 目標函數(shù)構(gòu)造

利用高斯函數(shù)σ(vsi,DTl)評估支持向量與已標注目標域數(shù)據(jù)vsi的相似度,選取關(guān)鍵支持向量。將相似性評估項加入到支持向量機的目標函數(shù),構(gòu)造算法的目標函數(shù),表示如下:

2? ? 實驗

2.1? 數(shù)據(jù)集

化合物毒性預測(Prediction Toxicity of Compounds,PTC)。本文實驗所用數(shù)據(jù)集為PTC,該數(shù)據(jù)集包含作用在4種不同老鼠身上的417種不同的化合物致癌信息。將數(shù)據(jù)集中存在缺陷的數(shù)據(jù)集(即具有E,EE和IS標簽的數(shù)據(jù))移除,最終得到253種化合物實驗的數(shù)據(jù),并為數(shù)據(jù)分配4類標簽(即MR,F(xiàn)R,MM,F(xiàn)M)。對于每一類標簽的屬性可以標記為+1,-1或0,即+1表示沒有產(chǎn)生致癌效果,0表示未被標記,-1表示產(chǎn)生了致癌效果。具體數(shù)據(jù)如表1所示,其中,Pos(%)表示每個實驗的積極化合物的平均百分比。

2.2? 試驗方法

為了能體現(xiàn)提出的算法的有效性與實用性,將實現(xiàn)以下方法進行對比。

SVM[4]:傳統(tǒng)的支持向量機分類算法,實驗在多標簽目標域數(shù)據(jù)比較少的情況下分類性能。

MT-SVM:采用評估方法選擇適合的多標簽源數(shù)據(jù)域支持向量,并加入到目標數(shù)據(jù)域進行分類器訓練。

2.3? 實驗結(jié)果

在實驗中,目標領(lǐng)域分訓練集與測試集,目標領(lǐng)域訓練集只選取源領(lǐng)域訓練集1%,剩下的為測試集,由于目標訓練集很少,要保證樣本基本分類正確,Transfer-SVM中參數(shù)在[0.000 001,0.000 01,0.000 1,0.001,0.01,0.1,1,10,100,1 000]中選取。可以看出,本算法的準確率要高于傳統(tǒng)的SVM分類算法。

3? ? 結(jié)語

利用目標數(shù)據(jù)域和源數(shù)據(jù)域的相關(guān)性,從源數(shù)據(jù)域中選取對分類超平面起關(guān)鍵作用的支持向量和目標數(shù)據(jù)域一起訓練分類模型以提高分類精度。因此,Transfer-SVM算法能夠有效地提高分類精度。

[參考文獻]

[1]JIANG S,PANG G,WU M.An improved K-nearest-neighbor algorithm for text categorization[J].Expert Systems with Applications,2012(1):1503-1509.

[2]SEBASTINAI F.Machine learning in automated text categorization[J].Association for Computing Machinery Surveys,2002(1):1-47.

[3]YANG J,YAN R,HAUPTMANN A G.Cross-domain video concept detection using adaptive SVMs[C].Augsburg:the 15th International Conference on Multimedia,2007.

[4]CHIH C C,CHIHJEN L.LIBSVM:a library for support vector machine,2001[EB/OL].(2018-07-15)[2019-05-10].http://www.csie.ntu.edu.tw/~cjlin/libsvm.

主站蜘蛛池模板: 91丨九色丨首页在线播放| 亚洲手机在线| 欧美午夜久久| 中文无码精品a∨在线观看| 伊人丁香五月天久久综合| 亚洲美女操| 亚洲中久无码永久在线观看软件 | 伊人色综合久久天天| 99精品在线看| 亚洲性色永久网址| 国产成人精品一区二区不卡| 天天干伊人| 啪啪永久免费av| 毛片基地美国正在播放亚洲| 欧美在线精品怡红院| 日本免费a视频| 在线毛片免费| 欧美亚洲激情| 日韩国产综合精选| 国产精品白浆无码流出在线看| 婷婷色在线视频| 欧美在线视频a| 久久精品日日躁夜夜躁欧美| 精品国产香蕉伊思人在线| 国内黄色精品| 91精品情国产情侣高潮对白蜜| 福利一区在线| 视频二区欧美| 高潮毛片免费观看| 国产极品美女在线| 国产日韩欧美精品区性色| 国产91精品最新在线播放| 精品成人一区二区三区电影| 亚洲水蜜桃久久综合网站| 啊嗯不日本网站| 自拍偷拍欧美日韩| 国产啪在线91| 三上悠亚在线精品二区| 999福利激情视频| 国产精品漂亮美女在线观看| www欧美在线观看| 国产成人免费高清AⅤ| 亚洲国产欧美国产综合久久| 欧美全免费aaaaaa特黄在线| 精品国产www| 国产制服丝袜91在线| 亚洲天堂高清| 免费人成视网站在线不卡| 97se亚洲综合不卡| h网站在线播放| 国产永久免费视频m3u8| 日韩色图区| 亚洲精品不卡午夜精品| 国产av一码二码三码无码| 亚亚洲乱码一二三四区| 在线国产三级| 色综合激情网| 97国产精品视频自在拍| AV熟女乱| 2020最新国产精品视频| 日韩精品中文字幕一区三区| 狠狠躁天天躁夜夜躁婷婷| 亚洲成a人片| 日日拍夜夜操| 国产精品久久久精品三级| 高清乱码精品福利在线视频| 国产剧情无码视频在线观看| 麻豆AV网站免费进入| 啊嗯不日本网站| 制服无码网站| 福利视频一区| 国产91丝袜| a级毛片免费网站| 在线免费无码视频| 波多野结衣久久高清免费| 91精品啪在线观看国产60岁| 青青青国产精品国产精品美女| 亚洲成aⅴ人片在线影院八| 亚洲天堂久久新| 米奇精品一区二区三区| 青青热久免费精品视频6| 成年人免费国产视频|