999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向滿文字符識別的訓練數據增廣方法研究

2018-02-05 01:36:08畢佳晶鄭蕊蕊賀建軍
大連民族大學學報 2018年1期
關鍵詞:單詞方法

畢佳晶,李 敏,鄭蕊蕊,許 爽,賀建軍,黃 荻,2

(1.大連民族大學 信息與通信工程學院,遼寧 大連, 116605;2. 北方民族大學 數學與信息科學學院,寧夏 銀川,750021)

光學字符識別(Optical Character Recognition, OCR)主要采用機器學習方法實現,而深度學習技術的發展為OCR的研究提供了更先進的解決方案[1]。深度學習技術給模式識別領域的很多方面帶來了顯著的改善[2],但需要海量訓練數據才能滿足深度學習模型的泛化條件。數據庫的采集和整理工作需要消耗大量人力物力來兼顧規模性和準確性[3],僅靠人工收集整理樣本效率非常低,難以滿足實驗對數據規模的要求。特別是在我國少數民族文字識別的研究中,樣本數據的匱乏問題尤為突出[4]。原因在于目前能夠讀寫少數民族文字的人數有限,公開的數字化少數民族文獻資源短缺。因此亟待解決訓練樣本數據匱乏的問題。

采用數據增廣技術(Data Argumentation)生成數據(Synthetic Data)是目前擴大樣本規模,擴展樣本多樣性的有效途徑。M Jaderberg[5]等人通過對原有Google字體庫中的樣本采用字符間距調整,添加下劃線和投影畸變的數據生成方法進行擴展,并使用擴展后的數據集研究自然場景下的文本識別,達到了90.8%的識別率。PatricceY.Simard[6]等人使用鏡像、旋轉、仿射變換和扭曲等數據生成方法對MNIST數據集進行擴展,使用擴展后的數據集研究手寫數字識別,達到了99.6%的識別率。采用上述幾何變形方法擴展少數民族文字數據是一種很好的借鑒[7]。本文以滿文字符識別為研究背景,針對滿文文檔的特點,提出一種融合字體幾何結構形變與圖像質量變換的數據增廣技術框架。

1 滿文數據增廣技術框架

在滿文字符識別的研究中以《滿語365句》為藍本初步構建印刷體滿文單詞數據集,包含671類共2130個規范的印刷體滿文單詞圖像樣本[8],因此樣本數據集字體單一,且數量難以滿足訓練深度學習模型的要求。

本文提出一種滿文單詞圖像數據增廣技術框架,由字體幾何結構變形和圖像質量變換兩個模塊組成,分別采用9種基本的數據生成方法,模擬滿文文檔采集時的常見情況見表1。除使用單一數據生成方法外,對同一訓練樣本混合2種及2種以上的數據生成方法以進一步增加訓練樣本的數量和形式。

表1數據增廣技術框架

2 字符幾何結構變換

2.1 形態學處理

滿文文字的印刷體,具有字體規整且字符筆畫的粗細較為一致的特點。利用圖像形態學處理中的膨脹和腐蝕對字符圖像進行處理以改變其筆畫的粗細,模擬不同粗細的筆觸[9]。對字符圖像進行腐蝕和膨脹處理時,核的大小和形狀都對結果有影響。首先固定核大小為4×4,以常用的3種形狀的核(十字交叉型、矩形和圓形)分別進行膨脹和腐蝕處理的結果如圖1。綜合考慮處理效果和運算復雜度,選擇矩形核。

因為所處理字符的類別、形狀、筆畫粗細等差異較大,核的大小無法用一個統一的適用標準定義,只能通過實驗獲得適用范圍。以不同大小的矩形內核處理一張滿文字符圖像結果如圖1(c):當核大小為2×2像素時(像素為單位)的效果和原圖幾乎無差別,而核大小為7×7和8×8時處理結果所包含的字符信息已有丟失。因此合適的處理內核大小應為kernel∈{3,4,5,6},即形態學變換核大小的經驗值為kernel∈{1/3w, 1/2w}的整數,其中w表示滿文中軸線寬度。

圖1 采用不同形狀及大小內核的形態學變換結果

2.2 彈性形變

James McCaffrey在對MNIST數據庫的數據增廣研究中提出彈性形變法模擬手寫數字扭曲的形狀[9]。對圖像進行彈性形變的關鍵是如何對每一個像素進行移動,使得相鄰像素的移動距離和方向相似的同時在全局表現出一定的隨機性。彈性形變算法的偽代碼如下:

(1)輸入:源圖像M;

(2)以源圖像M的尺寸(w,h),定義大小為(w,h)維度的兩個偏移矩陣MatX,MatY分別對應圖片像素的x和y方向的偏移對MatX、MatY的每一元素隨機生成-1到1的偏移值,生成所需目標數量的偏移矩陣;

(3)將高斯矩陣分別和MatX和MatY進行卷積,使相鄰隨機的偏移值獲得一定的相關性;

(4)將自定義扭曲幅度a 與MatX和MatY的每一元素相乘,得到調整后的偏移矩陣;

(5)利用MatX和MatY矩陣作為偏移矩陣生成扭曲后的圖像R;

(6)輸出:結果圖像R。

使用彈性形變法,可在一定程度上模擬手寫滿文時因手部不規則的抖動而引起的字體形變現象。其結果如圖2。

圖2 彈性形變變換結果

2.3 仿射變換

(1)

在源圖像和結果圖像中預設3組對應點來構建映射關系,仿射變換的流程如圖3。

圖3 仿射變換流程及結果

在原圖像中選取3個固定點P1、P2和P3;在結果圖像中的對應點分別是Q1、Q2和Q3。如果采用無限制隨機法選取Q點,則有極大概率產生類似于圖3(c)所示的結果,出現字符信息嚴重缺失的現象。為解決該問題,本文提出在特定區域內隨機選取Q1、Q2和Q3的方法:設原圖像的高為h寬為w,則特定區域的高h1= 0.2 ×h,寬w1= 0.2 ×w,其中0.2是通過大量實驗獲得的經驗值。采用上述規則標定的特定區域位置即圖3(a)中點Q1、Q2和Q3所處的陰影區域。采用特定區域內的仿射變換結果如圖3(b)所示,在保持原有仿射變換隨機性的同時,避免了結果圖像字符信息缺失的現象。

3 字符圖像質量變換

3.1 自定義背景融合

造成印刷體滿文樣本數據單一的另一原因是樣本數據均為黑色字體襯以白色背景,而真實場景下的滿文大多具有復雜的背景。本文中采用將字符圖像與各種采集自真實場景下的背景圖像進行融合的方法來更好的模擬真實場景下的字符圖像。此方法可以進一步擴展樣本數據的多樣性。設背景圖像為n×m階矩陣Ib ,其中第i行j列處點的值表示為bi,j(i≤n,j≤m),字符圖像二值化后為n×m階矩陣It,其中第i行j列處點的值表示為ti,j(i≤n,j≤m),則融合結果圖像Ir可以由矩陣Ib與矩陣It求哈達瑪乘積所得,即Ir=bij*tij,其中*表示哈達瑪乘積。同一滿文字符與采自不同真實場景下的背景相融合的效果圖如圖4。

3.2 褪色變換

現存的滿文文檔大多已產生不同程度的褪色現象。因此本文中采用將單詞圖像與背景進行線性混合操作的方法來模擬真實情況下的文檔褪色現象。線性混合操作是一種二元的像素操作,其原理為

dst=(1-a)*src+a*srd。

(2)

式中:α∈(0,1),表示背景圖像在結果圖像中所占的比例;dst表示結果圖像;src表示字符圖像;srd表示背景圖像。在實際應用中調整α的值可以實現不用程度的褪色模擬。以α值為0.5進行模擬的結果如圖5。

圖4 滿文單詞圖像背景融合示例

圖5 滿文圖像褪色現象模擬

3.3 光照不均模擬

字符圖像模擬光照不均可以簡化為在字符圖像上疊加白色光斑,光斑的亮度從光斑中心向周圍逐漸減小。由于字符圖像樣本的底色多為白色,字體多為黑色,因此對光斑的疊加可表示為

y=Ro+I*W,

(3)

式中:Rb為一點經過混色后的顏色;Ro為該點原始的像素值;W為RGB表示純白色。I為當前點處的光斑亮度,取值隨位置變化:設虛擬的光斑中心在圖像的(Ox,Oy) 處,光斑的半徑為R像素,則圖像任意點(x,y)處的混合I值為

(4)

通過設置光斑的中心坐標和半徑即可實現字符圖像的模擬光照不均效果。設置光斑中心坐標(Ox,Oy)為(w/2,h/2),光斑半徑R=w/2其光照不均模擬效果如圖6。

圖6 光照不均現象模擬

4 實驗結果分析

實驗以采集自《滿語365句》的真實圖像為基本數據,在此基礎上分別采用9種字符數據生成方法之一獲得初步圖像樣本,然后以這些圖像樣本為基礎對其使用另外的8種方法進一步擴展數據的多樣性和數量,部分混合生成結果如圖7。數據生成過程由一個小組獨立完成,組員之間所采用的方法也保持相對獨立,每位組員對每種字符的生成都采用了隨機機制,以確保生成的樣本數據間有較大的差異,進一步降低了生成的樣本數據在特征空間上的重復率。在訓練集和測試集劃分上,采用隨機置亂的方法進一步消除主觀因素的影響。

圖7 部分混合生成結果示意圖

分別采用支持向量機和卷積神經網絡模型對印刷體滿文單詞進行識別。在進行支持向量機實驗時所用的數據集中每類滿文單詞共有300個樣本,其中200個樣本用于訓練,100個樣本用于測試,在對40類滿文單詞的識別中達到了90%的識別率。在進行卷積神經網絡實驗時所用的數據集中每類滿文單詞共有70 000個樣本,其中60 000個樣本用于訓練,10 000個樣本用于測試,在對671類滿文單詞的識別中達到了97.83%的識別率。實驗結果表明本文提出的數據增廣技術框架是一種擴充機器學習訓練樣本數據量的有效方法,能夠提供多樣化的訓練樣本。

5 結 論

為了解決滿文識別研究中遇到的樣本缺乏問題,本文提出了使用人工數據生成方法擴展樣本數據的技術框架,該框架由字體幾何結構變形和字符圖像質量變換兩個模塊構成,共包含9種基本數據生成方法。實驗證明采用本文提出的數據增廣方法生成的訓練樣本能夠滿足機器學習方法對訓練樣本規模和多樣性的需求,是一種擴充光學字符識別數據規模的有效方法。

[1] FEDOROVICI L O, PRECUP R E, DRAGAN F, et al. Evolutionary optimization-based training of convolutional neural networks for OCR applications[C].tem Theory: Control and Computing, 2013:207-212.

[2] LECUN Y, BENGIO Y, HINTON G. Deep learning.[J]. Nature, 2015, 521(7553):436-44.

[3] 金連文,鐘卓耀,楊釗,等. 深度學習在手寫漢字識別中的應用綜述[J]. 自動化學報,2016 (8):1125-1141.

[4] 鄭蕊蕊,李敏,吳寶春. 基于MATLAB GUI的少數民族文字手寫體采集系統——以滿文為例[J].大連民族學院學報,2014(3):306-309.

[5] JADERBERG M, SIMONYAN K, VEDALDI A, et al. Synthetic data and artificial neural networks for natural scene text recognition[J]. EprintArxiv, 2014(1):1-8.

[6] SIMARD P Y, STEINKRAUS D, PLATT J C. Best practices for convolutional neural networks applied to visual document analysis[C]// International Conference on Document Analysis and Recognition. IEEE Computer Society, 2003:958-963.

[7] 王會靖. 基于局部特征的復雜背景圖像內文本識別研究與實現[D].上海:上海交通大學,2010.

[8] 周興華,李敏,鄭蕊蕊,等. 印刷體滿文文字數據庫的構建與實現[J].大連民族學院學報,2015(3):270-273.

[9] JAMES M C. Distorting the MNIST Image Data Set[EB/OL] (2014-07)[2016-12-13].https://msdn.microsoft.com/en-us/magazine/dn754573.aspx.

[10] RAFAEL C G, RICHARD E W . 數字圖像處理[M].阮秋琦,譯.北京:電子工業出版社,2011.

猜你喜歡
單詞方法
What’s This?
Exercise 1
單詞連一連
學習方法
看圖填單詞
看完這些單詞的翻譯,整個人都不好了
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 欧美一道本| 99资源在线| 久久99国产综合精品女同| 成人在线观看一区| 欧美成人一级| 91青草视频| 一级不卡毛片| 久久精品这里只有国产中文精品| 国产菊爆视频在线观看| 国产97视频在线观看| 亚洲 欧美 偷自乱 图片| 色老头综合网| 亚洲成aⅴ人片在线影院八| 一级毛片在线播放免费观看| 国产美女人喷水在线观看| 思思热在线视频精品| 亚洲国产理论片在线播放| 欧美成人精品在线| 成年人免费国产视频| 免费人成视网站在线不卡| 免费av一区二区三区在线| 青草国产在线视频| 日本黄色不卡视频| 天天激情综合| 亚洲专区一区二区在线观看| 国产97公开成人免费视频| 免费观看无遮挡www的小视频| 永久在线精品免费视频观看| 欧美在线精品一区二区三区| 伊人久久大香线蕉综合影视| 宅男噜噜噜66国产在线观看| 久久久久88色偷偷| 国产精品无码久久久久AV| 亚洲欧美日韩天堂| 视频在线观看一区二区| 国产高清精品在线91| 老色鬼欧美精品| 亚洲国产成熟视频在线多多 | 亚州AV秘 一区二区三区| 亚洲精品第一在线观看视频| 成人免费网站久久久| 久久久久九九精品影院| 亚洲Va中文字幕久久一区| 91黄色在线观看| 亚洲嫩模喷白浆| 亚洲精品中文字幕无乱码| 免费国产一级 片内射老| 国产内射一区亚洲| 九色视频最新网址| 久久精品一卡日本电影| 欧美乱妇高清无乱码免费| 中国国产A一级毛片| 亚洲一区无码在线| 欧美天堂久久| 91无码人妻精品一区| 日本成人一区| 国产成人一区在线播放| 亚洲无码电影| 国产麻豆福利av在线播放| 国产成人综合在线观看| 91麻豆国产精品91久久久| 女人一级毛片| 久久 午夜福利 张柏芝| 久久人人妻人人爽人人卡片av| 亚洲美女久久| 亚洲成人黄色网址| 久久精品欧美一区二区| 亚洲人妖在线| 欧美激情视频一区二区三区免费| 欧美有码在线| 国产精品亚洲天堂| 91九色视频网| 久久综合色88| 久久青草热| 日韩AV无码一区| 国产精品免费入口视频| 免费va国产在线观看| 久久99国产综合精品女同| 久久综合一个色综合网| 久久香蕉国产线| 国产精品亚欧美一区二区| 91亚洲视频下载|