摘 要:在文本掃描輸入的過程中,文本圖像不可避免地會(huì)發(fā)生傾斜,而布局分析及字符識(shí)別算法對(duì)頁面傾斜十分敏感,因此傾斜檢測(cè)和校正是文檔分析預(yù)處理中的重要環(huán)節(jié)。提出了一個(gè)基于直線擬合的傾斜檢測(cè)方法,它對(duì)文本圖像二值化、分塊,進(jìn)行Fourier變換獲得Fourier光譜,提取Fourier光譜中反映傾斜角的特征點(diǎn),然后對(duì)特征點(diǎn)進(jìn)行擬合處理,最后獲得頁面傾斜角。實(shí)驗(yàn)結(jié)果表明,該方法能夠精確檢測(cè)文本的傾斜角度,并且不受文本布局、行間距以及字體的影響。
關(guān)鍵詞:傾斜檢測(cè);Fourier變換;特征點(diǎn);直線擬合
中圖法分類號(hào):TP391
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1001—3695(2005)06—0251—03