趙 建 華
(1. 西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院,陜西 西安 710072; 2. 商洛學(xué)院數(shù)學(xué)與計(jì)算機(jī)應(yīng)用學(xué)院,陜西 商洛 726000)
·計(jì)算機(jī)軟件理論、技術(shù)與應(yīng)用·
基于SOM神經(jīng)網(wǎng)絡(luò)的半監(jiān)督分類算法
趙 建 華1,2
(1. 西北工業(yè)大學(xué)計(jì)算機(jī)學(xué)院,陜西 西安 710072; 2. 商洛學(xué)院數(shù)學(xué)與計(jì)算機(jī)應(yīng)用學(xué)院,陜西 商洛 726000)
為提高半監(jiān)督分類的性能,提出一種基于SOM神經(jīng)網(wǎng)絡(luò)的半監(jiān)督分類算法SSC-SOM。結(jié)合SOM的聚類特性,基于先聚類后標(biāo)記的思想,充分利用有標(biāo)記樣本和未標(biāo)記樣本訓(xùn)練SOM分類器;將聚類的形成和有標(biāo)記樣本分配到各個(gè)聚類中同時(shí)進(jìn)行,并根據(jù)有標(biāo)記樣本計(jì)算各個(gè)聚類的聚類中心;在整個(gè)未標(biāo)記樣本的范圍內(nèi),根據(jù)聚類中心,使用K近鄰算法對(duì)未標(biāo)記樣本進(jìn)行標(biāo)記,挖掘未標(biāo)記樣本的隱含信息。在UCI數(shù)據(jù)集中進(jìn)行分類實(shí)驗(yàn),其結(jié)果表明,SSC-SOM的分類率比SSOM提高2.22 %,且收斂性較好。
半監(jiān)督學(xué)習(xí);自組織特征映射神經(jīng)網(wǎng)絡(luò);分類;聚類
半監(jiān)督學(xué)習(xí)是一種結(jié)合有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的學(xué)習(xí)方法,綜合利用少量有標(biāo)記樣本和大量的未標(biāo)記樣本來提高學(xué)習(xí)性能,是一個(gè)非常熱門的研究方向[1]。半監(jiān)督分類[2-3]利用大量未標(biāo)記數(shù)據(jù)擴(kuò)大分類算法的訓(xùn)練集,主要研究從有監(jiān)督學(xué)習(xí)的角度出發(fā), 當(dāng)已標(biāo)記訓(xùn)練樣本不足時(shí), 如何自動(dòng)地利用大量未標(biāo)記樣本信息輔助分類器的訓(xùn)練。
將自組織神經(jīng)網(wǎng)絡(luò)(self-organizing feature maps,SOM)引入到半監(jiān)督學(xué)習(xí)領(lǐng)域,設(shè)計(jì)基于SOM的半監(jiān)督學(xué)習(xí)算法,是目前學(xué)者涉入較少的一個(gè)課題。孫雁飛等[4]提出一種基于半監(jiān)督學(xué)習(xí)的GA-SOM聚類方法,該方法用半監(jiān)督學(xué)習(xí)進(jìn)行樣本的初始化,利用SOM作為訓(xùn)練器對(duì)無標(biāo)簽樣本進(jìn)行聚類,并申請(qǐng)了專利。……