摘要:為了有效地利用結(jié)構(gòu)信息,提出了一種新的自學(xué)習(xí)算法,算法中利用聚類方法從自標(biāo)記樣本中選擇可信度高的樣本,同時用一個數(shù)據(jù)編輯方法從這些可信度高的樣本中剔除被錯標(biāo)的可能性較高的樣本。算法在UCI數(shù)據(jù)上進(jìn)行了驗證,效果和收斂速度比對比算法要好,說明引入聚類選擇候選樣本是有效的。
關(guān)鍵詞:自訓(xùn)練;無標(biāo)簽樣本;聚類;半監(jiān)督學(xué)習(xí)
中圖分類號:TP391 文獻(xiàn)標(biāo)志碼:A 文章編號:1001-3695(2010)09-3341-04