





摘 要:該文提出一種基于 PaddleOCR 框架的金融票據手寫體文本識別方法,通過引入基于生成對抗網絡(GAN)的數據合成工具 Style-Text,增強模型對不同背景文本的識別能力。在真實的金融票據數據集上進行的實驗表明,該方法在處理復雜文本和低質量圖像方面表現出顯著的優勢,證明其在金融票據手寫體文本識別中的有效性和實用性。
關鍵詞:金融票據識別;PaddleOCR;數據合成;手寫體;文本識別
中圖分類號:TP391.4 文獻標志碼:A 文章編號:2095-2945(2024)30-0068-04
Abstract: This paper proposes a handwritten text recognition method for financial bills based on the PaddleOCR framework. By introducing Style-Text, a data synthesis tool based on GeYBXDgfRg+BmoO/I0YMqg5A==nerative Adversarial Network (GAN), it enhances the model's ability to recognize texts in different backgrounds. Experiments on real financial bill datasets show that this method has significant advantages in processing complex texts and low-quality images, proving its effectiveness and practicality in handwritten text recognition of financial bills.
Keywords: financial instrument recognition; PaddleOCR; data synthesis; handwriting; text recognition
金融票據作為金融交易和記錄的基礎憑證,其數字化處理對于提升業務效率、降低操作風險以及增強客戶體驗至關重要。手寫體文本識別技術在這一過程中扮演著核心角色,尤其是在處理支票、銀行匯票、信用卡賬單等涉及手寫信息的金融票據時。然而,手寫體文本的高度變異性、不規則書寫風格以及復雜的背景噪聲,使得自動化識別任務充滿挑戰。盡管光學字符識別(OCR)技術已取得顯著進展,但針對金融票據中的手寫體文本識別,仍需解決準確率和魯棒性的問題。所以,開發一種高效、準確的手寫體文本識別算法,對于金融行業的現代化和數字化轉型具有重要的戰略意義。
1 本研究的貢獻和創新點
本研究聚焦于金融票據手寫體文本識別的難題,提出了一種基于PaddleOCR框架[1]的識別方案,并通過引入Style-Text數據合成工具[2],顯著提升了模型對不同背景文本的識別能力。具體貢獻和創新點如下。
第一,提出了基于PaddleOCR的金融票據手寫體文本識別方案:結合金融票據的特殊性,采用了深度學習技術和GAN生成的數據集,顯著提高了手寫體文本識別的準確性和效率?!?br>