摘要:圖像中的文本字符存在于雜亂的背景之中,拍攝視角的不同使得文本具有較大的幾何變形,再加上存在光照變化、字符顏色不統一等現象會導致背景分離和文本識別困難。,為此提出一種基于圖像文本區域的圖像聚類方法、該方法首先對自然場景圖像中已定位的文本區域提取局部特征描述,并使用隨機投影方法將局部特征矢量集映射為固定維的特征向量,然后對包含圖像文本區域的圖像進行聚類。這種方法避免了由圖像分割與字符識別帶來的困難。實驗結果表明,該方法可以對包含文字的自然場景圖像有效地進行聚類,聚類的準確率能達到86.66%。