余聶芳
摘 要:神經網絡是一種新型的信息處理模型,通過對生物神經系統的模擬,憑借自適應學習以及自動處理等功能,可達到預期目的。脫機手寫漢字識別難度較大,為提高識別速度和精確度,采用了建立在反向傳播法基礎上的神經網絡模型,對脫機手寫漢字進行識別。以小字符集漢字識別為例,針對反向傳播法中存在的缺陷,如收斂速度過慢,易陷入局部最小點等,對其算法進行了改進,取得了較好的效果。
關鍵詞:BP神經網絡 BP算法改進 脫機手寫漢字識別 誤差函數
中圖分類號:TP183 文獻標識碼:A 文章編號:1674-098X(2014)01(b)-0047-01
漢字識別有兩種,一種是印刷體漢字,因比較規范,容易識別;第二種是手寫漢字,分聯機手寫和脫機手寫兩類,前者準確率較高,后者則偏低,是當前的研究重點。作為模式識別的重要組成部分,漢字識別技術應用廣泛,但由于涉及圖像處理、人工智能、計算機、數字信號處理等多種技術,加上漢字的復雜繁多,使得漢字識別存在著很大困難,如尤其是相似字,使得識別更為困難,如“裸”和“祼”、“壺”和“壸”、“禪”和“褝”等,極易出現錯誤。
1 神經網絡和BP神經網絡
1.1 神經網絡
神經網絡是在現代神經科研成果的基礎上提出并發展起來的,通過對生物大腦神經的模擬建立的一種信息處理系統,由許多簡單元件連接構成,具有非線性和容錯性,從能力特征來講,具有自適應和自組織性。其優勢主要體現在:能夠模仿人腦進行聯想記憶;對存儲的信息進行分類識別;能夠自動總結歸納經驗。在長期的實踐發展中,神經網絡技術不斷完善,在語音處理、機器人研究、模式識別等諸多領域都有廣泛應用。
1.2 BP神經網絡
用于文字識別的神經網絡模型有很多,BP神經網絡是其中較為常用的一種,該網絡模型是以BP算法(即反向傳播算法)為基礎的,除了函數逼近功能,還具有良好的機器學習能力。
BP神經網絡屬于多層前向網絡,能夠進行反向傳遞、修正誤差,通過結構和權值將頗為復雜的非線性映射關系表達出來。多由輸入層、輸出層以及隱含層組成,每層都有若干神經元,前向網絡是指其計算過程呈單向型,即由輸入層到中間層,再到輸出層。
BP算法有兩個階段,一是正向傳播,二是反向傳播,在第一個階段,將信號輸進系統的輸入層,由其內部神經元進行處理,主要是加權求和、激勵函數等,而后傳遞到中間層(即隱含層),在經過內部逐層處理,傳到輸出層,將實際的輸出值和預期值相比,若超過了規定的誤差范圍,就開始反向傳播,把誤差值從輸出層輸入,向中間層和輸入層傳遞,求得每層內各單元的誤差,將相應的權值進行修改,經不斷的調整,直至誤差值符合要求。
2 BP網絡神經在小字符集漢字識別中的實際應用
2.1 缺陷
(1)站在數學的角度看,BP網絡神經所使用的梯度下降法屬于非線性優化算法的一種,以至于局部極小值大的問題很難得到解決,在實際計算中,BP算法能夠將網絡權值進行收斂,但收斂值為局部極小解的可能性較大,是否是全局的最小解則沒有可靠的保證。若解決的問題比較復雜,很容易致使誤差函數陷入局部的極小區域。
(3)中間層的結點
在確定訓練集之后,輸入層和輸出層的結點數目也相應的確定下來,然而中間層及選取層內結點時,缺乏足夠的理論作指導,中間層的結點數直接影響著網絡的學習效率和復雜程度,因此,在選取中間層變得結點時,也應做一定的改進,積極建立相關的指導理論。
3 結語
針對脫機手寫漢字識別技術存在的難度,可運用BP神經網絡技術,而實際應用中,收斂速度過慢以及局部最小點問題對BP神經網絡技術影響較大,為此,需從初始權值的選取、激勵函數、誤差函數等方面對其算法加以改進,以達到提升脫機手寫漢字識別速度和精確度的目的。
參考文獻
[1] 張中.漢字識別技術綜述[J].語言文學應用,2007,26(22):77一86.
[2] 余華,曹亮,李啟元.BP神經網絡算法的改進及其在手寫體漢字識別中的應用[J].江西師范大學學報,2009,33(5):598-603.endprint
摘 要:神經網絡是一種新型的信息處理模型,通過對生物神經系統的模擬,憑借自適應學習以及自動處理等功能,可達到預期目的。脫機手寫漢字識別難度較大,為提高識別速度和精確度,采用了建立在反向傳播法基礎上的神經網絡模型,對脫機手寫漢字進行識別。以小字符集漢字識別為例,針對反向傳播法中存在的缺陷,如收斂速度過慢,易陷入局部最小點等,對其算法進行了改進,取得了較好的效果。
關鍵詞:BP神經網絡 BP算法改進 脫機手寫漢字識別 誤差函數
中圖分類號:TP183 文獻標識碼:A 文章編號:1674-098X(2014)01(b)-0047-01
漢字識別有兩種,一種是印刷體漢字,因比較規范,容易識別;第二種是手寫漢字,分聯機手寫和脫機手寫兩類,前者準確率較高,后者則偏低,是當前的研究重點。作為模式識別的重要組成部分,漢字識別技術應用廣泛,但由于涉及圖像處理、人工智能、計算機、數字信號處理等多種技術,加上漢字的復雜繁多,使得漢字識別存在著很大困難,如尤其是相似字,使得識別更為困難,如“裸”和“祼”、“壺”和“壸”、“禪”和“褝”等,極易出現錯誤。
1 神經網絡和BP神經網絡
1.1 神經網絡
神經網絡是在現代神經科研成果的基礎上提出并發展起來的,通過對生物大腦神經的模擬建立的一種信息處理系統,由許多簡單元件連接構成,具有非線性和容錯性,從能力特征來講,具有自適應和自組織性。其優勢主要體現在:能夠模仿人腦進行聯想記憶;對存儲的信息進行分類識別;能夠自動總結歸納經驗。在長期的實踐發展中,神經網絡技術不斷完善,在語音處理、機器人研究、模式識別等諸多領域都有廣泛應用。
1.2 BP神經網絡
用于文字識別的神經網絡模型有很多,BP神經網絡是其中較為常用的一種,該網絡模型是以BP算法(即反向傳播算法)為基礎的,除了函數逼近功能,還具有良好的機器學習能力。
BP神經網絡屬于多層前向網絡,能夠進行反向傳遞、修正誤差,通過結構和權值將頗為復雜的非線性映射關系表達出來。多由輸入層、輸出層以及隱含層組成,每層都有若干神經元,前向網絡是指其計算過程呈單向型,即由輸入層到中間層,再到輸出層。
BP算法有兩個階段,一是正向傳播,二是反向傳播,在第一個階段,將信號輸進系統的輸入層,由其內部神經元進行處理,主要是加權求和、激勵函數等,而后傳遞到中間層(即隱含層),在經過內部逐層處理,傳到輸出層,將實際的輸出值和預期值相比,若超過了規定的誤差范圍,就開始反向傳播,把誤差值從輸出層輸入,向中間層和輸入層傳遞,求得每層內各單元的誤差,將相應的權值進行修改,經不斷的調整,直至誤差值符合要求。
2 BP網絡神經在小字符集漢字識別中的實際應用
2.1 缺陷
(1)站在數學的角度看,BP網絡神經所使用的梯度下降法屬于非線性優化算法的一種,以至于局部極小值大的問題很難得到解決,在實際計算中,BP算法能夠將網絡權值進行收斂,但收斂值為局部極小解的可能性較大,是否是全局的最小解則沒有可靠的保證。若解決的問題比較復雜,很容易致使誤差函數陷入局部的極小區域。
(3)中間層的結點
在確定訓練集之后,輸入層和輸出層的結點數目也相應的確定下來,然而中間層及選取層內結點時,缺乏足夠的理論作指導,中間層的結點數直接影響著網絡的學習效率和復雜程度,因此,在選取中間層變得結點時,也應做一定的改進,積極建立相關的指導理論。
3 結語
針對脫機手寫漢字識別技術存在的難度,可運用BP神經網絡技術,而實際應用中,收斂速度過慢以及局部最小點問題對BP神經網絡技術影響較大,為此,需從初始權值的選取、激勵函數、誤差函數等方面對其算法加以改進,以達到提升脫機手寫漢字識別速度和精確度的目的。
參考文獻
[1] 張中.漢字識別技術綜述[J].語言文學應用,2007,26(22):77一86.
[2] 余華,曹亮,李啟元.BP神經網絡算法的改進及其在手寫體漢字識別中的應用[J].江西師范大學學報,2009,33(5):598-603.endprint
摘 要:神經網絡是一種新型的信息處理模型,通過對生物神經系統的模擬,憑借自適應學習以及自動處理等功能,可達到預期目的。脫機手寫漢字識別難度較大,為提高識別速度和精確度,采用了建立在反向傳播法基礎上的神經網絡模型,對脫機手寫漢字進行識別。以小字符集漢字識別為例,針對反向傳播法中存在的缺陷,如收斂速度過慢,易陷入局部最小點等,對其算法進行了改進,取得了較好的效果。
關鍵詞:BP神經網絡 BP算法改進 脫機手寫漢字識別 誤差函數
中圖分類號:TP183 文獻標識碼:A 文章編號:1674-098X(2014)01(b)-0047-01
漢字識別有兩種,一種是印刷體漢字,因比較規范,容易識別;第二種是手寫漢字,分聯機手寫和脫機手寫兩類,前者準確率較高,后者則偏低,是當前的研究重點。作為模式識別的重要組成部分,漢字識別技術應用廣泛,但由于涉及圖像處理、人工智能、計算機、數字信號處理等多種技術,加上漢字的復雜繁多,使得漢字識別存在著很大困難,如尤其是相似字,使得識別更為困難,如“裸”和“祼”、“壺”和“壸”、“禪”和“褝”等,極易出現錯誤。
1 神經網絡和BP神經網絡
1.1 神經網絡
神經網絡是在現代神經科研成果的基礎上提出并發展起來的,通過對生物大腦神經的模擬建立的一種信息處理系統,由許多簡單元件連接構成,具有非線性和容錯性,從能力特征來講,具有自適應和自組織性。其優勢主要體現在:能夠模仿人腦進行聯想記憶;對存儲的信息進行分類識別;能夠自動總結歸納經驗。在長期的實踐發展中,神經網絡技術不斷完善,在語音處理、機器人研究、模式識別等諸多領域都有廣泛應用。
1.2 BP神經網絡
用于文字識別的神經網絡模型有很多,BP神經網絡是其中較為常用的一種,該網絡模型是以BP算法(即反向傳播算法)為基礎的,除了函數逼近功能,還具有良好的機器學習能力。
BP神經網絡屬于多層前向網絡,能夠進行反向傳遞、修正誤差,通過結構和權值將頗為復雜的非線性映射關系表達出來。多由輸入層、輸出層以及隱含層組成,每層都有若干神經元,前向網絡是指其計算過程呈單向型,即由輸入層到中間層,再到輸出層。
BP算法有兩個階段,一是正向傳播,二是反向傳播,在第一個階段,將信號輸進系統的輸入層,由其內部神經元進行處理,主要是加權求和、激勵函數等,而后傳遞到中間層(即隱含層),在經過內部逐層處理,傳到輸出層,將實際的輸出值和預期值相比,若超過了規定的誤差范圍,就開始反向傳播,把誤差值從輸出層輸入,向中間層和輸入層傳遞,求得每層內各單元的誤差,將相應的權值進行修改,經不斷的調整,直至誤差值符合要求。
2 BP網絡神經在小字符集漢字識別中的實際應用
2.1 缺陷
(1)站在數學的角度看,BP網絡神經所使用的梯度下降法屬于非線性優化算法的一種,以至于局部極小值大的問題很難得到解決,在實際計算中,BP算法能夠將網絡權值進行收斂,但收斂值為局部極小解的可能性較大,是否是全局的最小解則沒有可靠的保證。若解決的問題比較復雜,很容易致使誤差函數陷入局部的極小區域。
(3)中間層的結點
在確定訓練集之后,輸入層和輸出層的結點數目也相應的確定下來,然而中間層及選取層內結點時,缺乏足夠的理論作指導,中間層的結點數直接影響著網絡的學習效率和復雜程度,因此,在選取中間層變得結點時,也應做一定的改進,積極建立相關的指導理論。
3 結語
針對脫機手寫漢字識別技術存在的難度,可運用BP神經網絡技術,而實際應用中,收斂速度過慢以及局部最小點問題對BP神經網絡技術影響較大,為此,需從初始權值的選取、激勵函數、誤差函數等方面對其算法加以改進,以達到提升脫機手寫漢字識別速度和精確度的目的。
參考文獻
[1] 張中.漢字識別技術綜述[J].語言文學應用,2007,26(22):77一86.
[2] 余華,曹亮,李啟元.BP神經網絡算法的改進及其在手寫體漢字識別中的應用[J].江西師范大學學報,2009,33(5):598-603.endprint