許亞美 盧朝陽 李靜 姚超
摘要:針對維吾爾詞書寫粘連和手寫筆畫漂移等問題,提出一種基于多信息融合路徑尋優的字符分割算法。利用筆畫提取、切分和聚類,過分割單詞圖像得到主體和附加字段,通過字段模糊匹配獲得魯棒的字根序列描述,以抑制筆畫漂移造成的干擾;由建立的匹配位置高斯模型來估算字段匹配信息,經對單字分類器輸出進行置信度轉換,從而得到字符識別信息,再運用數據統計獲取單詞語義信息;由構建的字符序列二階Markov語言模型,基于Bayes準則,提出了單詞后驗概率的多信息加權融合計算方法,通過字段匹配及字根合并的路徑尋優,可得到最佳字符分割結果。在手寫維文樣本庫上的實驗表明,所提算法能有效提升字符分割的準確率和穩定性。
關鍵詞:信息處理技術;手寫文字識別;字符分割;維吾爾語;多信息融合