賀艷芳,李莉杰
(河南開封科技傳媒學(xué)院 理工學(xué)院,河南 開封 475004)
聚類是機(jī)器學(xué)習(xí)中最重要的研究課題之一,其目的是在不知道樣本標(biāo)簽的情況下,將樣本分成不同的組,稱為聚類。在當(dāng)今時代,聚類技術(shù)在人工智能、數(shù)據(jù)挖掘和模式識別中占有重要的地位,通過聚類能夠進(jìn)行圖像識別、數(shù)據(jù)的分類等。聚類技術(shù)屬于無監(jiān)督學(xué)習(xí),利用數(shù)據(jù)之間內(nèi)在結(jié)構(gòu)技術(shù),它是把相似的數(shù)據(jù)結(jié)構(gòu)分為一類。多視角數(shù)據(jù)的特征包含了同一個對象不同角度的信息。例如:一個網(wǎng)頁數(shù)據(jù)中有兩個視角的數(shù)據(jù)既包含網(wǎng)頁內(nèi)容又包含網(wǎng)頁鏈接信息,其中網(wǎng)頁內(nèi)容是一個視角,而網(wǎng)頁鏈接信息是另一個視角;視頻中包含音頻、圖像等特征;圖像數(shù)據(jù)中既涉及顏色直方圖特征、紋理特征等圖像特征,又設(shè)計描述該圖像內(nèi)容的文本。多視圖聚類就是將多個特征集聚成在一起進(jìn)行聚類。由于這種方法解決了聚類的很多問題,所以多視圖聚類算法已被廣泛的使用和開發(fā),以獲得額外的信息,以改善最終的聚類。而在這些方法中,譜聚類方法因其定義明確的數(shù)學(xué)框架和易于實(shí)現(xiàn)而成為最流行的方法。目前常見的多視角方法可以分為以下幾種方法:(1)協(xié)同訓(xùn)練方法;(2)多核學(xué)習(xí)方法;(3)多視圖融合方法;(4)多視角子空間學(xué)習(xí)方法。協(xié)同訓(xùn)練算法在多視角算法中屬于半監(jiān)督學(xué)習(xí)方法,該算法只能解決兩個視角的問題,當(dāng)出現(xiàn)多個視角特征,用該算法會有局限性。……