王凱
摘要:針對雙向切割的破碎紙片的自動復原問題,本文首先對圖片進行數字化處理,讀取圖片的灰度信息,構建灰度矩陣,并將灰度矩陣轉化為0-1矩陣,從而將二維圖片數值化。然后采用2次篩選的方法,通過讀取圖片前180個像素行,根據同行字的圖片中心高度差相同或相近似原則,建立圖片中心高度差模型進行行篩選,確定出中文分為11類;然后,針對同行內圖片的排列,建立左右邊界匹配模型,同時進行人工干預,剔除各類中多余元素,對于缺失元素類別進行填補;最后,對于行與行間的拼接,建立上下邊界匹配模型,得出在各行的上下位置序列,完成第2次篩選,得出原文件圖片序列。結果顯示,拼接復原率為100%。
關鍵詞:左右邊界匹配模型 圖片中心高度差 上下邊界匹配模型 碎紙片拼接
1.模型分析
在對文件既橫切又縱切的情況下,完成破碎紙片的拼接工作。本文分為以下四步來解決:
1、對每張圖片文件進行數據讀取,目的在于將附件所給的bmp格式的碎紙片圖以灰度值矩陣的形式存儲。再將灰度值矩陣轉化為0-1矩陣,來得到模型的數據基礎,構建反映中文文章行特征矩陣;
2、通過建立特征匹配模型,左右邊界匹配模型,上下邊界匹配模型三個模型,完成雙向切割破碎紙片匹配模型的構建;
3、利用MATLAB對模型進行求解。此外,特征匹配模型后需要人工干預;
4、分析求解結果。
2模型的準備
2.1圖片的數字化處理
2.1.1灰度值矩陣的獲取[1]
2.1.2.0-1矩陣的建立
2.1.3獲取左、右邊界矩陣
2.2圖像的預處理
3建立橫縱切碎片匹配模型
3.1構建左右邊界匹配模型
3.1.1構建左邊界匹配模型
3.1.2構建右邊界匹配模型
3.1.3構建最佳匹配模型
3.2建立上下邊界匹配模型
本模型的建立思路和第一問中右邊界匹配模型建立的思路相似。不同之處在于,問題一是19條縱列的左右匹配模型,而本模型是11行的上下邊界匹配模型。
將第k張圖片的上、下邊界處的元素分別存于矩陣的第一行、第二行中。即上下邊界匹配模型中第k行的上下邊界矩陣為:
3.2.1上邊界匹配構建模型
將第k行的上邊界與第行的下邊界進行上邊界匹配,即求第k行的邊界矩陣的第一行與第s行的邊界矩陣的第二行對應列元素的差,再求差的絕對值的和—— 。
對應的匹配方式即為第K行與第S行的最佳上下匹配方式。
4.模型的求解
4.1求解步驟
對各行高按升序編號1~11
跟據左右邊界匹配模型對各行圖片進行排序然后人工剔除多余或者匹配度差的圖片
將其余碎片分別與1,2,3,5,6,8,10匹配,確定其在行集合的列順序如表3所示
5結論
本文針對碎紙片的拼接復原問題,首先,通過對圖片進行數字化處理,并利用灰度及圖片中心高度來建立碎紙片的拼接配準算法;其次,根據圖片邊界的相似相容的方法建立左右匹配模型和上下匹配模型;由于在一些碎紙片邊緣特征信息非常少的復雜情形下很難對碎紙片進行自動化拼接[8],需要采取人工干預調整的方法,最后得到了全部碎紙片的復原圖。總體來說該模型算法較為簡單,自動化匹配程度高,具有很好的可操作性和推廣價值。
參考文獻(References)
[1]王帆,劉慧. 基于Matlab GUI的數字圖像處理實驗平臺設計[J]. 中國科技信息,2011,(07):124-125.
[2]叢波. 基于MATLAB的數字圖像處理技術及應用[J]. 中國科技信息,2011,(05):85-86+89.