張春娥,魏揚帆,王巖松
(1.北京交通大學信息科學研究所,北京 100044;2.北京征圖新視科技有限公司,北京 100022)
煙葉自動圖像分級技術研究綜述
張春娥1,魏揚帆1,王巖松2
(1.北京交通大學信息科學研究所,北京 100044;2.北京征圖新視科技有限公司,北京 100022)
在煙葉自動分級的過程中,提取煙葉特征幵且進行分級是至兲重要的步驟。闡明了煙葉分級的現行國家標準,分析總結了常用的顏色、形狀、紋理等特征分析手段,包括一些較為新穎的方法。對多種方法綜合對比分析,結合我國煙草行業實際背景與現實環境,從簡捷、經濟、高效、可靠四方面考慮,提出在標準 D50照明光源條件下,提取現實中可用的葉長、面積等圖像特征,選擇適合判別的均勻顏色模型對煙葉進行分級判別。
煙葉;分級;圖像特征;顏色模型; 自動化分級
目前,我國煙葉分級收購仍以人工為主,存在著勞動強度大、主觀性強、工作效率低、分級標準不易掌握、分級精度不穩定等缺點[1],人工煙葉分級的主觀性還造成了收購分級專家的灰色利益、煙農和收購方因分級不同意見引起的質量糾紛等問題。前期煙葉備貨階段的質量問題會給后續煙葉工商交接帶來諸多問題[2]。計算機技術的迅猛發展,為煙葉自動檢測與分級系統提供了豐富的解決方法和途徑[3]。采用自動化手段替代人工對煙葉進行質量分級,已成為煙草工業發展亟需解決的熱點問題之一。
根據國家標準[4],煙葉可以分為烤煙、晾曬煙、再造煙葉等大類,其中烤煙為最常見的類型。
烤煙分級國家標準《烤煙 GB 2635—92》[5]規定了烤煙的技術要求、檢驗方法和驗收規則等內容,是分級、收購、交接的依據。烤煙煙葉可以分為共 8個正組、5個副組,在此基礎上還可根據煙葉的成熟度、葉片結構、身份、油分、色度、長度、殘傷等七個外觀品級因素分為 42個級。
目前,煙葉市場的分組分級基本由人工完成,對人工技術要求較高。工人需要進行系統的專業分級培訓,并且經過一段時間熟練技能后才能在分級時根據各級別煙葉的視覺、觸覺、嗅覺反應做出綜合判斷。分級技術較熟練的工人一般分級的效率為60 kg/(人·d)左右(以每天工作 8 h 計)。分級后的煙葉由具有國家煙草專賣局煙葉等級質量鑒別檢驗資格的人員對其進行復查,按《烤煙》分級標準 進行 等級質量 檢驗 ,煙 葉 合 格 率為 67.55%~91.78%不等[6]。人工分級的前期培訓較為復雜,培訓時間較長,培訓結果難以預料,分級效率低,準確率不確定,明顯阻礙了煙葉的收購和生產[7]。
國外利用計算機視覺技術研究煙葉的檢測與分級始于 1984 年,比我國的此類研究要早。1993年,津巴布韋大學的 MacCormac 設計了一個可用于煙葉實時分級的圖像處理單元原形[8]。1997 年,Cho 等[9]研究了如何利用機器視覺提取白肋煙的形狀、顏色等特征以對其進行分級。Tattersfield 等[10]提取烤煙煙葉的形狀、顏色等特征,對烤煙的生長部位和顏色進行分組識別。
在我國,進行煙葉自動識別和分級技術的研究起步相對較晚,但也有一些研究成果,如下所述。
根據每片煙葉的圖像特征進行分級,必須以散煙的形式來進行收購。與傳統把煙收購形式相比,散煙收購可以提高等級純度和復烤的成品率[11],而且散煙收購的模式也適合機器視覺技術的應用。根據《烤煙》標準中的各分級因素,可以從圖像上提取的特征為數不少。其中部分特征用于分級效果良好,部分特征使用技術較為成熟。
4.1 以顏色作為技術特征用于煙葉分級
從烤煙分級國家標準可知,顏色是煙葉分組的關鍵因素之一。
張建平等[12]對煙葉顏色進行測量與分析認為,由于色素的形成和分解與生長發育、營養吸收、光照等條件有關,故顏色與成熟度、部位等有內在聯系,顏色的差異很大程度上反映了煙葉內在質量的區別。蔡健榮等[13]利用計算機視覺方法研發了煙葉質量分類系統,主要利用顏色特征,另外包括形狀、紋理特征將其一同作為分類的依據。李浩[14]在對煙葉進行分級時使用了顏色作為主要的判別特征,嘗試使用了 RGB、HIS 2 種色度學模型來度量不同等級煙葉的顏色差別。比較了 RGB 和 HIS 2 種模型在煙葉分級應用中的區別,并最終得出2種模型下的正確率分析結果。
4.2 以形狀作為技術特征用于煙葉分級
煙葉的葉形特征如葉長、葉寬、葉片面積、圓度等也是決定煙葉組別、級別的重要因素。煙葉部位不同,外觀特征有異,如下部葉圓寬;中部葉較寬,葉尖較鈍;上部煙葉較窄,葉尖較銳;另外煙葉的長度也是影響級別歸屬的重要因素之一[15]。
張 建平 等[15]提出使 用葉片的 平均 長寬比和平均葉尖角來描述葉片的形狀特征。根據煙葉圖像的灰度差別區分煙葉與背景部分;去除零星煙葉碎塊后計算葉面面積大小;確定煙葉外邊界輪廓;計算煙葉長度、寬度及葉尖角等,通過一系列手段方法獲取煙葉的多個形狀特征。周文等[16]提出從煙葉圖像中提取煙葉葉形特征進行分級。由于煙葉葉形特征適于用計算機圖像特征提取、分析、處理,故可作為品質特征提取的突破點之一。對煙葉紅綠藍三幀圖像直方圖分析發現,藍體煙葉圖像與背景之間的差異最大,故可根據煙葉的藍體直方圖提取特征信息,提取煙葉長度、寬度、長寬比、周長、面積等特征信息。
4.3 以煙葉紋理作為技術特征用于煙葉分級
煙葉的紋理特征是煙葉的褶皺、葉脈、焦邊、成熟度、油分、陰影、殘損等因素共同作用的結果,紋理特征是一種不依賴于亮度或顏色且可以反映圖像中組織規律變化的視覺特征。
張帆等[17]在 2001 年發表的標準煙葉數據庫的圖像檢索中就提出了紋理作為分級特征的使用,并且給出了紋理特征獲取的計算方法。紋理特征值的提取是利用了圖像的灰度共生矩陣,求其紋理熵、紋理能量、紋理慣性、紋理逆差矩的一系列數字統計特征。杜東亮[18]提出了使用 Gabor 小波分析煙葉紋理,進而對煙葉進行分級。另外,在文中還提出基于灰色系統理論通過煙葉的其他外觀特征來綜合描述煙葉的成熟度和油分這兩個很難從圖像上獲取的分級因素。大致為先確定成熟度、油份和其他可獲得的特征之間的關聯度,然后根據眾多其他特征間接確定煙葉的成熟度和油份。這種方法與國家標準以及現行的人工觸摸的方法有非常大的區別。
4.4 較為新穎的分級技術
馬文杰[19]提出使 用 透射 圖像來進 行煙 葉圖像分割,因為煙葉對藍光的吸收較好,在透射圖像中利用藍體煙葉和背景的差別將圖像中煙葉部分分割出來。劉華波等[20]提出了透射圖像顏色特征在煙葉識別中的應用。他們認為光線從背面照射煙葉時,煙葉的厚薄、葉肉組織的疏密和葉片細胞內所含物質的差異會引起透射光強度和光譜特性的變化,可以反映煙葉的這些內在質量特征。基于此理論推測,嘗試采用反射和透射兩種形式獲得煙葉圖像,探討透射圖像特征在煙葉計算機視覺分級中的有效性。
申金媛 等[21]提出 了 將煙 葉的紅外光譜 作為煙葉的分級特征。煙葉等級劃分的7大因素中的成熟度與煙葉內在的化學成分、結構有著密切的關系,紅外光譜其實反映的是 C—O,C—H基團的和頻與倍頻吸收,煙葉成熟度其實就是煙葉的這些化學成分及含量在葉表的反應。另外,油分、身份、色度等分級因素都在紅外光譜上有特殊的反應,因此紅外光譜也是煙葉分級的重要特征之一。
目前的自動分級技術有各自的特點,同時也面臨著一些需要解決的瓶頸問題。
5.1 以顏色辨別為基礎的分級效果與問題
李浩[14]采 用 基于反 射與 透射圖像 的煙 葉分級方法,分別提取反射圖像和透射圖像特征,使用RGB 和 HSI兩種顏色系統分別作為判別的依據,基于貝葉斯判別方法進行分級判別。結果顯示如果使用 1 種色度學模型(RGB 或 HIS),且使用 1 種圖像類型(反射或透射)的顏色特征所建立的判別方程誤判率較高;任取 1種圖像類型,綜合運用 RGB與 HIS 2 種顏色特征所建立的判別方程的誤判率有一定的減少;結合2種圖像類型任選1種色度學模型建立判別方程,誤判率則有顯著的減少。說明 2種色度學模型的結合使用對提高煙葉分組判別的正確率有一定的作用,但效果不明顯。引入煙葉透射圖像對提高煙葉分組正確率有很明顯的作用。
目前采用的顏色空間模型有待商榷,RGB系統是最常用的一種顏色系統,在圖像處理中使用方便,易于表達。HSI顏色系統可以定量地描述顏色對人眼的視覺作用,故其參量具有色覺上的直觀意義[22]。但是,RGB 和 HSI 都是非均勻的色度系統,在度量煙葉顏色時并不太適合機器視覺做出判斷[23]。兩個顏色之間在知覺上的差異就是色差,理想的顏色空間中點與點之間距離大小就是相應顏色之間的色差的大小。色差的定義和測量是一切顏色測量相關設備的基礎,也是機器視覺系統應用顏色信息的前提[24],不均勻的顏色模型也就意味著煙葉之間均勻的顏色差別在計算機視覺中被放大了或者縮小了。所以,為了準確區分顏色,需要一個均勻的顏色模型用于計算機視覺中顏色的判斷。
5.2 照明光源的缺陷所引起的問題
蔡 健榮[13]的 基于計 算機視覺技術 的煙葉質量分選系統,由于照明技術的缺陷,結果不盡如人意。通過神經網絡學習后,不同地區測試樣本的正確率最低為 81.7%,比熟練人工分級正確率要低。究其原因,主要是因為所采用的光源與標準光源有很大的偏差。決定顏色實質的其實是物體的光譜反射率,顏色就是它被人眼所感知引起的感覺。可想而知,在光源光譜不標準的情況下,所獲得的物體的反射光譜也必然不標準,自然達不到標準的顏色測量,從而影響最終的正確率。
擇取統計學軟件包——SPSS19.0,針對計數資料(n,%)行卡方檢驗。針對計量資料(±s)行t檢驗。在P<0.05條件下,證實數據存在統計學差別。
此外,在 50 Hz 的普通交流光源作用下采集圖像,會出現明顯的明暗相間的條紋,即交流光源的紋波頻閃現象[25]。頻閃現象影響判決結果,降低了系統識別的準確性,所以利用圖像信息來判別煙葉等級判決時,照明有必要采用標準等級的光源。
5.3 以葉型和紋理特征為基礎的分級效果與問題
l998 年,北京工商大學研發了一種用于烤煙煙葉特征的提取和分級的機器視覺系統[26](flue-cured tobacco grading system,FTGS),并構建了一個煙葉特征的標準數據庫。該系統提取了包括顏色、形狀、紋理和葉脈等4類特征,在廣東、廣西、湖南、云南 4 省進行測試,正確率分別為 90.4%、87.3%、89.1%、84.8%。馬建元等[27]選取煙葉的色調、飽和度、亮度3個顏色特征值和長度、長寬比、面積、周長及圓度5個形狀特征值進行綜合判斷,分級正確率可達 93.7%。針對使用煙葉輪廓作為特征的分組方法,李翠英[28]進行了初步的嘗試,采用二元正交多項式擬合邊緣曲線,交互驗證的正確率達到93.3%,外部新數據驗證的判別正確率達到 90%,
周文等[16]所采用 的 特征 提取中使 用了 煙葉的形狀特征,包括葉長,葉寬,長寬比,葉尖角,輪廓,黑白紋理等等。實驗顯示都具有一定效果,但是在實驗的過程中并未考慮煙葉分級現場的實際情況。原煙葉沒有清理也沒有整理過,煙草收購來的煙葉數目龐大,質量參差不齊,煙葉成把蜷曲著,灰塵泥土不可避免。對這樣的煙葉進行形狀特征提取,必定會導致部分形狀特征難以獲取或所得誤差很大,比如煙葉的翻卷必定影響葉尖角和長寬比的計算,塵土則會導致紋理圖案的改變等等。所以,在實際情況中部分實驗使用的特征在分級現場無法使用。
5.4 以紅外光譜特征為基礎的分級效果與問題
申金媛 等[21,29]研 發 了一種 利 用光譜和圖像 特征進行煙葉分級的方法,分級正確率較為理想。其主要方法是獲取煙葉的圖像信息和光譜信息,使用神經網絡,依靠圖像信息特征和光譜信息特征做出分組分色分級。通過神經網絡得出訓練樣本的正確吻合率為 100%,測試樣本平均正確吻合率為 91%,結果略優于其他方法。
上述紅外光譜特征的使用雖然有較為可靠的結果,但是根據光譜特征進行分級必須要在確定組別和顏色的基礎之上[29]。實則就是,使用紅外光譜作為特征依然依賴于圖像信息的獲取,且獲取紅外光譜的系統結構更為復雜,而正確率與圖像系統比較,提高程度有限。此外,紅外光譜設備造價高昂,這在某程度上也制約了其在煙草行業中的推廣。在此情況下,紅外光譜設備也不是最為理想的選擇。
目前的煙葉自動分級技術大多停留在論證和實驗階段,如第5節的分析,實際應用中還沒有成熟和高效的技術,更沒有已經成熟穩定可推廣的系統。以散煙收購的方式代替把煙收購的方式也是煙草收購推廣的方向[30-31],而自動化的機器視覺應用更適用于散煙收購的方式。隨著煙草行業的發展,亟待一種技術可行且具有推廣可能的系統出現。
由于煙草工業的不斷發展,自動化煙葉圖像分級系統替代人工分級是大勢所趨。在市場需求強烈的背景下,煙葉自動分級系統的面世對其本身必然會帶來相應的經濟回報。而且隨著更多的新技術的突破,煙葉分級的合理化、高效化、簡捷化可以適應煙草工業的需要,此對提高廣大煙農的積極性、促進煙草種植產業的發展等都具有重大意義。
[1]馬文杰 . 煙葉圖像采集技術規范與烤煙收購質量分級特征研究[D]. 武漢:華中農業大學,2007.
[2] 閆新甫,馬建偉,王英元,等. 工商交接備貨煙葉等級質量分析[J]. 中國煙草科學,2006,27(3):28-31.
[3] 李銳. 煙葉分級指標量化研究的技術創新過程[J].中國煙草科學,2000,21(2):5-7.
[4]國家煙草專賣局. YC/T 210.1—2006 煙葉代碼[S]. 北京:中國標準出版社,2006.
[5]國家技術監督局. GB 2635—1992 烤煙[S]. 北京:中國標準出版社,1992.
[6]陳風雷,孫紅權,鄭少清,等. 初烤煙葉專業化分級效率研究[J]. 山地農業生物學報,2012,31(3):228-230.
[7]韓力群,何為,段振剛,等. 烤煙煙葉自動分級的智能技術[J]. 農業工程學報,2002,18(6):173-175.
[8]MacCormac J K M.On-line image processing for tobacco grading in Zimbabwe [C]//ISIE'93-Budapest. IEEE International Symposium on Industrial Electronics. Conference Proceedings, Budapest: 1993, 327-331.
[9]Cho H K, Paek K H. Feasibility of grading dried burley tobacco leaves using machine vision[J]. Journal of the Korean Society for Agricultural Machinery, 1997, 22(1): 30-40.
[10] Tattersfield G, Forbes K. Classification of Tobacco Leaves by Color and Plant Position[C]//Proceedings of the Ninth Annual Symposium of the Pattern Recognition Association of South Africa, Cape Town: 1998, 11.
[11] 王兆群,孫志禮,王曰生. 烤煙散葉分級收購技術探討[J]. 中國煙草科學,2008,29(4):51-53.
[12]張建平,吳寧一,方如明,等. 煙葉顏色測量與分析[J]. 江蘇工程院學報,1993,14(4):7-14.
[13] 蔡健榮,方如明,張世慶,等. 利用計算機視覺技術的煙葉質量分選系統研究[J]. 農業工程學報,2000,16 (3):118-122.
[14] 李浩 . 基于數字圖像處理技術的烤煙煙葉自動分組模型研究[D]. 武漢,華中農業大學,2007.
[15] 張建平,吳守一,方如明,等. 農產品質量的計算機輔助檢驗與分級(第Ⅰ報),煙葉外觀品質特征的定量檢驗[J]. 農業工程學報,1996,12(3):158-162.
[16] 周文,韓力群,李銳,等. 計算機圖像處理技術在烤煙煙葉形狀特征提取中的應用[J]. 煙草科技,2000,140: 12-13.
[17] 張帆,方如明,蔡建榮,等. 標準煙葉數據庫的圖像檢索[J]. 農業機械學報,2001,32(1):66-68.
[18] 杜東亮. 烤煙煙葉視覺分級中標準定量化模型的研究[D]. 鄭州:河南科技大學,2008.
[19] 馬文杰,賀立源,徐勝詳,等. 基于烤煙透射特征的煙葉圖像分割研究 [J]. 農業工程報, 2006, 22(7): 134-137.
[20] 劉華波,賀立源,馬文杰,等. 透射圖像顏色特征在煙葉識別中應用的探索 [J]. 農業工程學報,2007,23(9),169-171.
[21] 劉劍君,申金媛,張樂明,等,基于紅外光譜的煙葉自動分級研究[J]. 激光與紅外,2011,41(9):986-990.
[22] 陶霖密,徐光祐. 機器視覺中的顏色問題及應用[J]. 科學通報,2001,46(3):178-189.
[23] 吳富寧,楊子彪等.基于顏色特征進行農作物圖像分類識別的應用研究綜述[J]. 中國農業科學導報,2003,5 (2):32-38.
[24] 周水琴,應義斌.顏色模型在農產品顏色檢測與分級中的應用[J]. 浙江大學學報,2003,29(6):684-688.
[25] 陳杰,李志敏,鐘先信,等. 煙草在線檢測與異物剔除系統[J]. 光電工程,2003,30(5):51-54.
[26] 張惠民,韓力群,段正剛,等. 基于圖像特征的煙葉分級[J]. 武漢大學學報,2003,28(3),359-362.
[27] 馬建元,伍鐵軍. 基于圖像處理和模糊識別的煙葉分級技術研究[J]. 機械制造及自動化,2011,40(1):90-93.
[28] 李翠英 . 基于輪廓特征的烤煙煙葉自動分組技術研究[D]. 武漢:華中農業大學,2008.
[29] 申金媛,劉劍君. 利用光譜和圖像特征進行煙葉分級的方法:中國,CN102590211A [P]. 2011-01-11.
[30] 郭亮,黃輝,孫紅權,等. 烤煙散葉分級收購一體化及其應用[J]. 中國煙草科學,2012,33(3):81-86.
[31] 徐明康,高峻,盧劍,等. 烤煙專業化分級散煙收購模式探討[J]. 中國煙草科學,2012,33(2):90-93.
A Survey on Automatic Tobacco Image Grading Techniques
ZHANG Chun?e1, WEI Yangfan1, WANG Yansong2
(1. Institute of Information Science, Beijing Jiaotong University, Beijing 100044, China; 2. Beijing Focusight Technology Co., Ltd., Beijing 100022, China)
To obtain the characteristics that can be used for grading tobacco leaves is a crucial step in the process of an automatic tobacco image grading system. This article first expounds the current national grading standard of tobacco leaves, and then explores the feasible methods which is suitable for industrial environment after analyzing techniques using the characteristics of the color, shape, texture and other technical measure, with considering of simplicity, economy, efficiency, and reliability. The method solved the problems in LED light, image feature extracting and choice of well distributed color model.
tobacco leaf; grade; image feature; color model; automatic grading
S572
1007-5119(2014)04-0103-06 DOI:10.13496/j.issn.1007-5119.2014.04.020
中央高校基本科研業務基金(2012M037)
章春娥,博士,主要研究方向為數字圖像處理與數字水印技術,信息安全,工業現場圖像處理(機器視覺)。E-mail:chezhang@bjtu.edu.cn
2013-06-27
2014-05-21