999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于圖像模式識別的數字圖書資料修復及應用

2018-08-11 11:04:34王帆
科學與財富 2018年17期

王帆

摘 要:圖書內容的電子化和網絡化發展就是圖書資料的數字化過程,圖書資料實現了數字化之后,就會存儲在專業的數據庫服務系統中,讀者只需要通過網絡就可以在線閱讀或者下載,文章闡述了圖形模式識別技術在數字圖書資料修復中的應用情況,即通過對圖書資料進行掃描、二值化和圖像的重建等方法對不清晰的圖形進行自動修復,最終實現數字圖書資料的數字化處理。

關鍵詞:圖像模式識別;數字圖書;資料修復;

1圖書數字化處理的基本要求

圖書資料的數字化是圖書內容的電子化和網絡化,數字化的圖書資料脫離了傳統的媒介載體———紙質材料。圖書經數字化處理后,存儲于專業管理的數據庫服務器中,讀者通過網絡進行在線閱讀。在我國,當前以“清華同方”、“維普資訊”的學術文獻數據庫的建立與使用為代表;大量的傳統圖書已被制成以光盤為主要存貯形式的電子圖書,如書生之家;“數字圖書館”(“虛擬圖書館”)的建設和發展等都離不開圖書的數字化處理這一關鍵技術。雖然這兩種媒介(網絡媒介和紙質媒介)表達文獻的方式不一樣,但都是同樣內容的呈現,圖書數字化的基本要求是經處理后,電子圖書能客觀地再現紙質圖書的原有真實內容。

2傳統修復過程中存在的問題

對圖書資料進行數字化處理,首先要進行數據收集,即將相關的數據輸入計算機;而后,會顯示出一個長方形方框;對這個長方形方框進行圖像預處理之后,就要對區域內的圖像進行模式識別。通過這種方法能將圖書資料中的文字清晰而又準確地反映出來,為圖書資料的修復提供參考意見。這一系列過程完成之后,就可以實現圖書和檔案的數字化。目前,二值化方法是圖書數字化中使用最多的方法。因為在數字圖書資料的修復過程中,需要對大量的數據進行處理,而使用二值化的方法就能滿足這種需求。二值化方法具有工作效率高的特點,這也是其最大的優勢。數字圖書資料經過二值化的處理之后,所得到圖像的對比度會高于原有圖書資料中的圖像,給識別和閱讀提供方便的同時也會帶來一些新的問題,例如:二值化處理會使原來圖像中本來就不清晰的部分字符變得更加模糊,不能進行準確識別。這個問題不能解決,就會給圖書資料的數字化工作帶來巨大的負面影響。如果連數字化處理的基本要求都無法達到,就會迫使圖書管理人員放棄對這一部分資料進行修復。此外,通過圖像采集系統攝入的圖像通常都會自動生成BMP格式并存放在計算機中,但計算機顯示出來的卻是灰度圖像。在各種因素的影響下,圖像會出現模糊,筆畫斷開、粗細不均衡等現象,而且圖像中大量孤立噪聲的存在,也會使提取字符的難度加大。針對數字圖書資料修復中存在的這些問題,筆者在傳統二值化處理的基礎上,引用了局部二值化的處理方法,主要是為了對不清晰的數字圖書資料進行修復,從而實現圖書資料的數字化。

3模式識別技術的原理及方法分析

模式識別指的是對表征現象或事物的各種形式的信息進行分析和處理,以達到對現象或事物進行描述、辨認、分類及解釋的一系列過程。

3.1局部二值化的原理

局部二值化就是將大塊圖像分割為若干個小塊圖像,分別對各個小圖像進行二值化,進而形成完整的二值化圖像。講二值化的問題分解為“分割”、“塊副二值化”及“合并”三個步驟來進行,以達到對圖像進行二值化處理的目的。

3.2圖像分塊的確定

在圖像分割時,將圖像分割成正方形和矩形,首先將圖像進行若干正方形的分割,其余的部分也就形成了若干的小矩形,閾值選取方法的普適性與時間開銷是息息相關的。

4數字圖書資料的修復方法

圖書資料的數字化過程中,經掃描得到的圖像要經過圖像預處理、提取圖像中的字符信息、圖像局部的二值化處理等過程,圖像局部的二值化是圖書資料修復過程的關鍵。

4.1圖像預處理

在圖書或檔案數字化過程中,由于掃描系統(如CCD攝像頭)、光電轉換裝置、工作環境(光)等因素,常常導致圖像不均勻、對比度不足等問題,使圖像的清晰度差、還原度和可視性降低;另外由于光電敏感元件載荷粒子隨機運動所產生的噪聲、傳輸通道的干擾等原因,數碼化后的灰度圖像含有一定的噪聲,因此,在圖書、檔案圖像二值化前,要對圖像進行預處理。當前主要采取的措施有:灰度變換和平滑濾波。灰度變換是對圖像像素灰度值進行修正,實現圖像處理后成像均勻,對比度飽和;平滑濾波是在圖像處理中,在平滑圖像中的加性噪聲。

4.2圖像中字符信息的提取

采集系統攝入的是24位的灰度圖像,其有224(16777216)個灰度等級。圖像上的點(x,y)的灰度值設為f(x,y)。對此灰度圖像進行二值化就是將圖像轉換為只有兩個等級(黑、白)的二值圖像。依據圖像區域的相似性和不連續性,取圖像灰度平均值為閾值N,二值化處理可表示為:

小的點,其值設置為1。像素的集合為背景區域;小于或等于此閾值N的像素設置為黑,像素值為1,這樣就得到了只有黑白兩色的二值圖像,將圖書檔案中的字符信息就凸顯了出來。數字圖書資料的背景色一般為淺色,字符為深色,多數情況下,紙質圖書資料的背景為白色、字符為黑色,因此,采用紙質圖書資料的24位位圖,像素點的亮度作為灰度等級值。

通常采用圖像的二值化方法是把整個圖像亮度的平均值N作為閾值。當局部顏色較淺時,字符信息和背景的亮度都大于N,二值化后,這部分的值都為0,全部都將被視為背景上的點,這樣很容易丟失圖書資料中退色的部分信息。為了解決這個問題,文獻提出了圖像全局均值和局部方差方法、文獻提出了小波分析法,在文獻中,先采用開關中值濾波消除噪聲干擾,然后利用迭代算法實現圖像的二值化分割。這些方法都涉及復雜的計算,在此采用局部二值化方法,取閾值為各個塊亮度的均值。

3.3二值化圖像的再處理

圖像局部二值化后,得到了各個小塊圖像的“值點”,這樣避免了因某個小塊由于顏色淡而整體無“值點”的情況,但是同時產生了一個新問題,這樣的二值化圖像中含有較多的噪音,在進行圖像重建之前必須去除。平滑化處理可以去除噪音,在此采用了文獻]的高斯濾波方法進行平滑化處理。圖像重構。通過前面的處理,得到完整的原始數字圖書資料的二值化圖像,可以構造出增強字符信息的圖像文件,還原出比原來數字圖書資料效果好的圖像,便于閱讀和處理的數字圖書資料,可以構造其BMP位圖文件,也可以打印出比原來效果好的紙質圖書資料,達到了修復有損數字圖書資料的目的。模式識別。除了用重建數字圖書資料的圖像的方法之外,還可以根據實際問題的需要進行后繼處理,如文獻中,使用模式識別方法分割字符、歸類識別字符、手工修正、重新輸出原圖書資料的內容,對表格字符的識別和圖像重構可參見文獻。

總結:模式識別技術在現代圖書信息和檔案處理中有著廣泛的用途,文章闡述了圖形模式識別技術在數字圖書資料修復中的應用情況,即通過對圖書資料進行掃描、二值化和圖像的重建等方法對不清晰的圖形進行自動修復,最終實現數字圖書資料的數字化處理。

參考文獻:

[1]呂俊哲.圖像二值化算法研究及其實現[J].科技情報開發與經濟,2004(12).

[2]賈昔玲.基于圖像模式識別的數字圖書資料修復及應用研究[J].數字技術與應用,2010(10).

[3]化明艷.高校數字圖書館信息服務能力評價模型研究[D].南京農業大學,2010.

主站蜘蛛池模板: 欧美伦理一区| 免费观看无遮挡www的小视频| 国产成人久视频免费| 久操中文在线| 高潮毛片无遮挡高清视频播放| 伊人AV天堂| 色综合色国产热无码一| 四虎永久免费网站| 欧美人与动牲交a欧美精品| 婷婷伊人五月| 国产91av在线| 国产真实乱子伦视频播放| 国产毛片片精品天天看视频| 欧美激情一区二区三区成人| 亚洲人精品亚洲人成在线| 欧美成人午夜在线全部免费| 国产噜噜噜视频在线观看 | 色呦呦手机在线精品| 9cao视频精品| 亚洲欧州色色免费AV| 爽爽影院十八禁在线观看| 久久免费精品琪琪| 免费三A级毛片视频| 91精品国产自产在线观看| 精品国产成人av免费| 亚洲无码精彩视频在线观看| 亚洲制服丝袜第一页| 国产无码精品在线播放| 日本午夜网站| 中文字幕日韩视频欧美一区| 精品久久蜜桃| 亚洲国产亚综合在线区| a级毛片网| 嫩草影院在线观看精品视频| 国产真实自在自线免费精品| 国产特级毛片| 色噜噜狠狠狠综合曰曰曰| 九色在线观看视频| www.91在线播放| 欧美劲爆第一页| 毛片久久网站小视频| 91成人免费观看| 亚洲视频色图| 国产人成在线观看| 国产黑丝视频在线观看| 在线欧美一区| 2019国产在线| 国产导航在线| 成人夜夜嗨| 丁香五月婷婷激情基地| 婷婷亚洲视频| 日韩国产欧美精品在线| 国产精品大白天新婚身材| 欧美亚洲一区二区三区在线| 在线观看无码a∨| 看你懂的巨臀中文字幕一区二区 | 久久国产亚洲欧美日韩精品| 国产精品亚欧美一区二区三区 | 欧美曰批视频免费播放免费| 色婷婷在线影院| 被公侵犯人妻少妇一区二区三区| 久久亚洲黄色视频| 久久精品丝袜高跟鞋| 国产欧美高清| 国产成a人片在线播放| 欧美成人一区午夜福利在线| 国产免费网址| 欧美a级完整在线观看| 欧美日韩午夜| 欧美h在线观看| 美女国内精品自产拍在线播放| 久久综合色88| 久久青草热| 亚洲三级影院| 国产黑丝视频在线观看| 亚洲黄网在线| 欧美五月婷婷| 熟女成人国产精品视频| 亚洲日韩AV无码一区二区三区人| 伊人久久精品无码麻豆精品| 久久亚洲中文字幕精品一区| 91国内视频在线观看|