0 引言
聚類方法已經在很多領域中得到了較為深入的研究和廣泛的應用,如市場調研、社會網絡分析、生物信息學,以及其他學科領域的研究。常見的聚類方法有基于劃分的方法、基于層次的方法、基于密度的方法、基于網格的方法、基于模型的方法;常用的聚類算法包括K-均值聚類算法、K-中心點聚類算法、CLARANS、BIRCH、CuQUE、DBSCAN、譜聚類等。以上的這些聚類方法基本上都是以數據特征之間的相似性為聚類條件的。但是在不同的應用中研究發現,數據除了自身有特征之外,彼此之間還有復雜的關聯關系。例如,作者與參考文獻之間存在直接引用、被引用與間接引用的關系;蛋白質中氨基酸之間存在氫鍵概率、炭環、疏水性、帶電性、殘基等關聯關系。一個社會網絡節點數據之間的關聯關系如圖1所示。