宿恒碩 呂 軍 丁志平 唐彥杰 陳旭東 周 強 張哲宇 姚 青
(1. 浙江理工大學信息學院 杭州 310018; 2.張家港海關 張家港 215600; 3.杭州籜草科技有限公司 杭州 311500)
當前,木材種類鑒定主要由專業人員在實驗室利用放大鏡和顯微鏡等儀器設備觀察木材的宏觀和微觀特征,與標樣比對后確定木材類別(汪杭軍, 2013)。每種木材在生長過程中均形成獨特的宏觀和微觀結構,但木材種類繁多,即使同一種木材,其宏觀和微觀結構也因地點、氣候和營養等情況不同存在一定差異。種間相似及種內差異現象增加了木材種類識別難度,加之我國木材貿易監管一線精通木材分類知識的專家稀缺,木材或木制品交易頻繁,這種人工木材種類鑒定方法存在著專業性強、任務重、周期長和非實時性等問題,無法滿足木材監管實時性和高效性需求,亟需一種快速準確的木材種類鑒定方法。
隨著圖像處理技術的飛速發展與應用,利用圖像進行木材種類識別成為近年來的研究熱點(張怡卓等, 2012)。基于圖像的木材種類識別方法可以概括為2類: 一類是傳統模式識別方法(Lewetal., 2005; Touetal., 2006; 2009a),另一類是深度學習方法(Kwonetal., 2017; Ravindranetal., 2018; Oktariaetal., 2019)。傳統模式識別方法首先對木材圖像進行預處理,然后提取與篩選木材圖像特征,再通過模式識別方法進行分類識別。用于木材識別的圖像特征主要包括灰度共生矩陣(白雪冰等, 2005; Touetal., 2009b; Wangetal., 2010)、顏色矩陣(白雪冰等, 2007)、小波變換提取的紋理特征(于海鵬等, 2007; 馬琳等, 2013; 戴維等, 2012; 郭德軍等, 2005; 王晗, 2008)和HOG局部特征(羅微, 2019; Sugiartoetal., 2017; Nurthoharietal., 2019)等。傳統模式識別方法中的圖像特征需要通過多次試驗篩選獲得,模型在測試集中一般能獲得較高識別率,但其魯棒性和泛化能力較差。深度學習方法具有自主學習、特征多樣性、準確率高、模型魯棒性和泛化能力強等優點(Paketal., 2017),近年來在圖像識別中獲得了成功應用。基于圖像的深度學習方法主要是利用卷積神經網絡(convolutional neural networks, CNN)對木材圖像進行自主分布式特征提取,通過加深網絡層數對特征進行更抽象和概括性的表達,進而利用高階特征信息進行分類識別。Kwon等(2017)利用改進的 LeNet 網絡模型對 5 種韓國針葉軟木材的橫截面圖像進行種類鑒定,平均準確率為99.3%。Ravindran等(2018)基于卷積神經網絡模型對 10 種山梨科(Sorbaceae)新熱帶樹種木材橫截面圖像進行分類識別,不同屬、種木材平均識別率分別為97.5%和87.0%。Oktaria 等(2019)利用不同卷積神經網絡模型識別印度尼西亞30種木材橫截面圖像,結果發現基于AlexNet模型的木材識別效果最佳,平均識別率達96.7%。上述研究大多針對實驗室環境下顯微鏡拍攝的木材圖像,涉及的木材種類偏少,相似木材種類識別率低,無法滿足便捷、快速、準確識別木材的需求。
鑒于此,本研究針對傳統木材種類人工鑒定方法存在的專業性強、任務重、周期長和非實時性等問題,提出一種基于分塊梯度加權的木材種類識別模型,對32種橫截面相似的木材進行種類識別,以期提高木材監管的實時性和高效性,為木材種類快速、準確識別提供理論依據。
利用外帶微距鏡頭的手機采集打磨過的木材橫截面圖像,32種木材共采集圖像8 975幅,圖像格式為.jpg,大小為 2 240×2 240 像素(圖1)。按照8∶1∶1比例隨機選擇圖像作為模型的訓練集、驗證集和測試集。所有木材圖像源自張家港海關國家材種鑒定與木材檢疫重點實驗室,并經過木材專家鑒定。

圖1 木材橫截面宏觀結構(放大7倍)Fig. 1 Microstructure of wood cross section(amplification of 7 times)第 1 行依次為馬達加斯加鐵木豆、檀香紫檀、降香黃檀、愛里古夷蘇木、盧氏黑黃檀、阿那豆、巴里黃檀、黑核桃The first row is Swartzia madagascariensis, Pterocarpus santalinus, Dalbergia odorifera, Guibourtia ehie, Dalbergia louvelii, Anadenanthera spp., Dalbergia bariensis, Juglans spp.; 第 2 行依次為印度黃檀、猴子果、伯利茲黃檀、馬達加斯加黃檀、交趾黃檀、凱爾雜色豆、黃膽木、刺猬紫檀The second row is Dalbergia sissoo, Tieghemella spp., Dalbergia stevensonii, Dalbergia greveana, Dalbergia cochinchinensis, Baphia kirkii, Nauclea spp., Pterocarpus erinaceus; 第 3 行依次為相思木、卡雅楝、中美洲黃檀、龍腦香、大果紫檀、古夷蘇木、刀狀黑黃檀、阿摩楝The third row is Acacia spp., Khaya spp., Dalbergia granadillo, Dipterocarpus spp., Pterocarpus macrocarpus, Guibourtia spp., Dalbergia cultrata, Amoora spp.; 第 4 行依次為雨樹、奧氏黃檀、銀葉樹、染料紫檀、微凹黃檀、東非黑黃檀、螺穗木、紅蘇木The fourth row is Samanea saman, Dalbergia oliveri, Heritiera spp., Pterocarpus tinctorius, Dalbergia retusa, Dalbergia melanoxylon, Spirostachys africana, Baikiaea spp.
從圖 1 木材橫截面宏觀結構可以看出,多數木材之間視覺差異小、相似度較高,其中盧氏黑黃檀、阿那豆、巴里黃檀、黑核桃、印度黃檀、猴子果、伯利茲黃檀、馬達加斯加黃檀、交趾黃檀、凱爾雜色豆、古夷蘇木大巴花、刀狀黑黃檀14種木材的紋理特征非常相似,在顏色特征上相思木、卡雅楝、中美洲黃檀、龍腦香、大果紫檀、古夷蘇木大巴花、刀狀黑黃檀、阿摩楝、雨樹、奧氏黃檀、銀葉樹和染料紫檀12種木材非常相似。
1.2.1 顏色校正 木材橫截面圖像特征受外界光照和采集設備影響較大,本研究采用灰色世界法(Kwoketal., 2011)對圖像進行顏色校正,通過R、G、B三通道灰度平均值計算增益系數,然后用各通道灰度值與對應增益系數的乘積代替原始通道灰度值,消除由圖像采集設備和環境差異引起的偏色影響。

圖2 顏色校正前后的木材橫截面圖像Fig. 2 Wood cross section images before and after color correction
1.2.2 數據增強 為提高模型的魯棒性和泛化能力,采用水平翻轉、垂直翻轉和增添椒鹽噪聲的數據增強方法擴充樣本圖像,使每種木材圖像訓練樣本量達600幅以上。不同數據增強方法見圖3。
1.2.3 圖像分塊 木材橫截面宏觀結構自相似,為獲得更多的訓練樣本和圖像特征,對圖像進行分塊處理。采用5×5、7×7和10×10分塊方法,一幅圖像分別可以獲得25、49和100幅子圖像。通過雙線性插值法將每幅分塊子圖像統一縮放至224×224像素。
卷積神經網絡(CNN)采用端到端方式自動學習網絡參數,在圖像識別中表現出色。目前,應用較多的CNN識別模型有VggNet16(Simonyanetal., 2014)、GoogleNet(Szegedyetal., 2015)、DenseNet(Huangetal., 2017)、MobileNetv3(Howardetal., 2019)、ResNet系列(Heetal., 2016)等。其中,ResNet系列模型引入殘差結構,隨著網絡層數加深,通過引用恒等映射能夠解決網絡退化問題; 同時,在反向傳播過程中始終保證梯度值大于0,能夠有效防止梯度消失。相比其他模型,ResNet系列模型在圖像識別中取得了較好識別效果,本研究選擇ResNet101作為特征提取網絡。
利用外帶微距鏡頭手機采集的木材橫截面圖像存在中間清楚、邊緣模糊和變形的問題,為了提高木材種類識別率,將ResNet101模型原有的Softmax分類層進行改進。從木材橫截面圖像邊緣到中心采用不同的梯度值(5×5分塊策略依次為0.8、0.9和1,7×7分塊策略依次為0.7、0.8、0.9和1,10×10分塊策略依次為0.6、0.7、0.8、0.9和1)作為不同子區域圖像分類得分的權重,旨在加大中心區域在整個木材橫截面圖像分類任務中的占比(圖4)。利用Softmax方法將各類加權得分轉換為最終概率值,概率值的加權轉換方法如下:

(1)

(2)
式(1)中:Z表示各子圖像分類得分值,n表示分塊的行數,m表示分塊的列數,S表示加權后的C維得分向量; 式(2)中:C表示木材總類別數,S(i)表示S中第i維的得分值,P(i)表示Softmax計算后第i類的概率值,Y表示最終概率值。
為了評價木材識別模型的識別效果,選擇準確率(accuracy)、召回率(recall)、平均準確率 (average accuracy)和平均召回率(average recall)作為評價指標:
(3)
(4)
(5)
(6)
式中:TP表示某種木材正確識別的數量; FP表示錯誤識別為某種木材的數量; FN表示某種木材錯誤識別為其他種類木材的數量;C表示木材種類數量。
為了評價不同特征提取網絡對木材的識別效果,采用原圖形式,在相同訓練集、驗證集和測試集下,分別訓練和測試VggNet16、GoogleNet、DenseNet、MobileNetv3、ResNet50、ResNet101和ResNet152深度學習模型。同時,將分塊與梯度加權策略應用于ResNet101模型,測試不同模型對木材的識別效果。
所有模型訓練與測試均在開源的 Caffe 深度學習框架下完成。主要硬件配置: CPU為AMD Ryzen 5 3600 6-Core Processor 3.60 GHz和NVIDIA GeForce GTX 1080Ti,主機內存為16.00 GB 。
模型訓練采用遷移學習(Panetal., 2009)方式,首先利用在ImageNet數據集上預訓練的網絡模型對參數進行初始化,然后使用隨機初始化器對殘差網絡中全連接分類層的參數進行初始化。模型采用2個GPU并行訓練,模型優化策略選用梯度下降方法,權重正則化系數為0.000 1,動量設置為0.9,使用周期性衰減的學習率,初始化為0.1,每40 000次迭代衰減為1/10。
迭代次數是卷積神經網絡訓練的主要參數之一,將迭代過程中的損失值和準確率繪制成損失曲線和準確率曲線,用于評估訓練過程中模型的學習狀態。圖5給出了木材橫截面ResNet101分類識別模型訓練時的損失曲線和準確率曲線,可以看出,隨著迭代次數增加,模型的損失曲線逐漸下降,準確率曲線逐漸增加,當迭代到8萬次時2條曲線趨于穩定,表明模型已經收斂,并獲得較好的精度。

圖5 ResNet101模型訓練損失曲線和準確率曲線Fig. 5 Training loss curve and accuracy curve of ResNet101 model
用同一木材橫截面原圖訓練集訓練VggNet16、GoogleNet、DenseNet、MobileNetv3、ResNet50、ResNet101和 ResNet152共7個模型,并在同一測試集下測試32種木材,識別結果見表 1。其中,ResNet系列3個模型的平均準確率和平均召回率均超過85%,在木材特征提取方面優于其他模型; 在ResNet系列模型中,ResNet101的平均識別準確率比ResNet50、ResNet152分別高4.2%和1.6%。因此,選擇ResNet101作為木材種類識別的基礎模型。

表1 不同模型的32種木材橫截面圖像的識別結果Tab.1 Identification results of cross-sectional images of 32 wood species on different models
對木材橫截面圖像的原圖和經5×5、7×7、10×10分塊的子圖像訓練ResNet101模型,32種木材測試的識別準確率結果見圖6 。

圖6 不同分塊方法的木材識別準確率Fig. 6 Identification accuracies of different wood species by different image partitioning methods
從圖6可以看出,基于分塊的ResNet101模型,每種木材的識別準確率和平均識別準確率均優于基于原圖的ResNet101模型,表明分塊梯度加權策略能夠有效提升木材識別準確率,其中基于7×7 分塊的ResNet101模型得到的平均識別準確率為96.5%,優于5×5、10×10分塊的94.8%和95.3%。基于原圖的ResNet101模型識別準確率始終維持在92%左右,這是因為將縮放后的原圖送入ResNet101網絡時損失了較多細節信息,而分塊后的圖像能夠保留更多圖像內容。從分類結果穩定性來看,對木材橫截面原圖和5 × 5分塊的識別結果波動較大,說明模型的魯棒性不好。因此,最終選擇7×7分塊策略。
圖像邊緣模糊和變形使木材橫截面圖像丟失很多有效信息,同時增加了圖像噪聲,從而影響木材識別結果。基于分塊的ResNet101模型中每個分塊子圖像,如果賦予相同權值,對每幅圖像識別結果的貢獻是相同的,無法降低邊緣模糊和變形對圖像識別結果的影響。為了減少邊緣模糊和變形對識別的影響,提高木材圖像識別準確率,對木材橫截面圖像邊緣到中心賦予不同梯度值作為不同子區域圖像分類得分的權重。不同ResNet101模型對木材的識別結果如表 2 所示。

表2 不同的ResNet101模型的木材識別結果Tab.2 Identification results of wood species on different ResNet101 models
從表2可以看出,基于分塊梯度加權方法的ResNet101模型平均識別率和平均召回率均高于基于原圖的ResNet101模型和基于分塊的ResNet101模型,平均準確率分別提高6.7%和2.3%,平均召回率分別提高7.4%和2.8%,表明梯度加權方法能夠有效提高木材識別準確率。
我國是木材進口大國,也是瀕危野生動植物種國際貿易公約(CITES)締約國,對瀕危木材進出口有著嚴格的監管(尹江蘋等, 2019)。隨著全球木材交易頻繁,而我國木材種類鑒定專家稀缺,依靠傳統人工鑒定方法難以滿足與日俱增的木材鑒定需求。
木材橫截面宏觀結構是其細胞組織形狀和分布的一種體現,具有種的特異性,是專家識別木材種類的重要依據。隨著圖像處理和機器學習的發展和應用,利用圖像自動識別木材種類成為研究熱點。由于木材種類較多,生長環境存在較大差異,不同木材的橫截面圖像呈現種間相似和種內差異現象,利用手動設計分類特征的傳統模式識別方法已無法滿足實際應用需求。針對相似度高的木材橫截面圖像,本研究提出的基于分塊梯度加權方法的改進ResNet101模型,能夠提取更加精細和抽象的特征,有利于木材橫截面圖像的精細分類,提高了木材識別準確率,分塊梯度加權法增強了模型的魯棒性和泛化能力。
本研究僅對32種橫截面圖像相似的木材種類識別方法進行探索,在實際應用中,木材種類繁多,應收集更多種類和數量的木材圖像,增加木材識別種類并提高識別率。而且,由于外界環境、拍攝方式等不同,手機采集的樣本圖像存在較大差異,無法保證圖像的均勻性和相似性,可考慮開發穩定的木材橫截面圖像采集工具。另外,本研究所使用的模型參數數量固定,下一步可在保證識別率的前提下對模型進行裁剪,使模型可以部署到本地嵌入式設備中,提高木材種類的識別速度和信息的安全性。
隨著全球木材交易日益頻繁,快速、準確地識別木材種類可以緩解木材鑒定專家稀缺和鑒定周期長的問題。以手機采集的木材橫截面圖像為研究對象,建立7個卷積神經網絡模型,對32種相似的木材進行種類識別,結果表明,基于分塊梯度加權方法的ResNet101模型可用于木材種類識別,分塊梯度加權策略提高了木材識別準確率,平均準確率達98.8%。研究結果可為海關一線木材監察人員提供一種快速便捷的木材初篩鑒定方法。