何 拓 劉守佳 陸 楊 張永剛 焦立超 殷亞方
(中國林業科學研究院木材工業研究所 中國林業科學研究院木材標本館 北京 100091)
隨著全球森林資源貿易量劇增,以《瀕危野生動植物物種國際貿易公約》(Convention on International Trade in Endangered Species of Wild Fauna and Flora,CITES)管制物種為代表的木材貿易成為全球關注的焦點(Lewisetal., 2015; Brancalionetal., 2018)。截至2019年,CITES已將超過500種木材樹種列入附錄進行管制(焦立超等, 2019)。我國是CITES的締約國之一,也是全球最大的木材進口國, 2019年木材進口量1.14億m3,同比增長1.72%, 木材缺口持續增加,木材資源對外依存度超過50%(王登舉, 2019),我國的木材貿易,特別是以CITES附錄所列黃檀屬(Dalbergiaspp.)、紫檀屬(Pterocarpusspp.)和古夷蘇木屬(Guibourtia spp.)等樹種為代表的瀕危珍貴木材進口貿易受到國際社會廣泛關注; 同時,《國家重點保護野生植物名錄(第一批)》也將降香黃檀(Dalbergiaodorifera)、黑黃檀(Dalbergiacultrate)和印度紫檀(Pterocarpusindicus)等樹種列入名錄進行保護。但在利益的驅動下,瀕危珍貴木材及木制品在貿易流通環節中非法走私、以假充真和以次充好等現象時常發生,給國際履約執法和我國林產品產業發展帶來了嚴峻挑戰。因此,實現木材樹種的科學識別,是我國提升CITES履約執法能力、加強林產品產業鏈監管以及保障木材安全的重要科學途徑。
“種”是木材分類的基本單元,位于分類單位“屬”之下。傳統木材解剖學方法通過宏觀和微觀構造特征對木材進行分類和識別,一般只能確定到“屬”的水平(Wiedenhoeftetal., 2019),無法滿足國際履約執法和國內市場監管需求。近年來發展的DNA條形碼(Jiaoetal., 2018)、近紅外光譜(Kanayamaetal., 2019)、氣相色譜質譜聯用(Zhangetal., 2019a)和實時直接分析質譜(Deklercketal., 2019; Zhangetal., 2019b)等方法,雖然有望實現木材“種”的識別,但構建完善可靠的木材相應分類特征(DNA序列、化學指紋圖譜等)參考數據庫需耗費大量人力財力; 而且,受限于測試手段和裝置,上述方法仍無法在口岸現場等場景下對大批量木材樣本進行快速高效識別,大大限制了其發展和應用。因此,亟待開展其他木材識別方法研究,彌補現有方法手段的缺陷和不足,以實現木材在“種”水平的自動精準識別。
隨著計算機技術的快速發展,圖像分類為木材樹種精準快速識別提供了新的思路(劉子豪等, 2013)。不同于木材DNA序列和化學指紋圖譜等分類特征,木材構造特征可通過圖像形式便捷獲取,且構建木材構造特征圖像分類特征庫更加省時省力。但值得注意的是,木材構造特征圖像屬于細粒度圖像范疇(鄧旭冉等, 2019),具有不同樹種間特征差異小、同一樹種內特征差異大的特點,采用傳統圖像識別方法難以解決木材關鍵識別特征自動提取和精準分類的問題。近年來快速發展起來的深度學習方法(LeCunetal., 2015)可通過多層卷積神經網絡深度解析圖像大數據,自動提取識別特征,實現圖像準確快速分類,為木材識別新技術的發展奠定了前期基礎。
本研究以瀕危珍貴黃檀屬和紫檀屬樹種為主要研究對象,在建立木材構造特征圖像數據集的基礎上,通過構建基于不同卷積神經網絡的深度學習模型,實現木材識別特征的自動提取和精準分類,以期為木材“種”的自動精準識別提供新思路,為我國提升CITES履約執法能力、加強林產品產業鏈監管以及保障木材安全提供科技支撐。
木材標本來源于巴西圣保羅技術研究所木材標本館(BCTw)、中國林業科學研究院木材標本館(CAFw)、美國林產品實驗室木材標本館(MADw和SJRw)和巴西圣保羅林業研究所木材標本館(SPSFw),包含15種黃檀屬和11種紫檀屬木材共417份。其他木材樣本采集自廣東省東莞魚珠木材交易市場(YZ),包含13種黃檀屬和9種紫檀屬木材共110份。試驗木材樣品來源和數量信息如表1所示。
1) 木材樣品表面處理: 對木材樣品橫切面進行砂光,使砂光后的樣品表面光滑、無砂光痕跡,且導管、軸向薄壁細胞等未被堵塞或破壞。

表1 木材標本館(He et al., 2020a)和木材市場的樣品及其構造特征圖像來源和數量基本信息Tab.1 The information of wood samples and collected anatomical images from wood collections(He et al., 2020a) and market
2) 木材構造特征圖像采集: 利用iWood專業圖像采集裝置對砂光后的木材樣品橫切面采集8位圖RGB圖像,圖像采集分辨率為2 048像素×2 048像素。圖像采集區域覆蓋樣品整個橫切面,且互不重疊,可充分代表木材橫切面不同類型的構造特征。
3) 木材構造特征圖像數據集建立: 從采集的圖像中刪除存在缺陷和質量較低的圖像,并對保留的圖像添加標簽,建立圖像數據集Rosewood-26。采集自417份木材標本的10 237幅圖像用于模型訓練和驗證,采集自110份木材樣本的550幅圖像用于模型泛化能力(模型對未知樣本的識別能力)測試。
構建AlexNet(Krizhevskyetal., 2012; Heetal., 2020a)、VGG16(Simonyanetal., 2014)、DenseNet-121(Iandolaetal., 2014)和ResNet-50(Heetal., 2015)4種卷積神經網絡模型。模型基本架構包括卷積層(convolution layer)、池化層(pooling layer)和全連接層(fully-connected layer),其中,卷積層和池化層用于自動提取特征,全連接層用于分類識別。在卷積層與全連接層之間,進行線性整流激活函數(rectified linear unit, ReLU)、局部響應規一化(local response normalization, LRN)、池化(pooling)和隨機抑制(dropout)等操作,以防止網絡訓練過程中出現訓練集模型識別精度高而測試集模型識別精度低的過擬合問題。
在卷積神經網絡每個卷積層和前2個全連接層后均使用ReLU作為激活函數:
f(x)=max(0,x)。
(1)
ReLU函數定義了神經元線性變換后的非線性輸出結果,對進入神經元的來自上一層神經網絡的輸入向量x,使用線性整流激活函數的神經元會輸出max(0,x)至下一層神經元或作為整個神經網絡的輸出。ReLU函數的優點是可以緩解梯度消失問題,加快網絡訓練速度(Nairetal., 2010),與Sigmoid等其他非線性激活函數相比,ReLU函數更加簡單快速。
LRN模仿了生物神經系統的“側抑制”,即被激活的神經元會抑制相鄰神經元。在ReLU函數后加入LRN的目的是調節神經元的響應,使響應值較大的神經元變得相對更大,同時抑制相鄰響應較小的神經元,從而提高模型泛化能力。LRN計算方法如下:
(2)

池化在降低特征圖譜(feature map)維度和減少參數的同時,一定程度上保留了樣本主要特征,起到防止過擬合的作用。池化是一種下采樣方法,通常包括最大池化(max pooling)和平均池化(mean pooling)2種方式,本研究采用最大池化方式,保留更顯著的圖像特征,以更好地防止過擬合。

圖1 原始圖像預處理流程(以印度紫檀圖像為例)Fig.1 The flow diagram of the original image pre-processing(Pterocarpus indicus as an example)
隨機抑制是在神經網絡前向訓練過程中,保持輸入不變,隨機選擇一部分隱層神經元進行運算并保留記錄,從而在反向傳播時更新這些神經元對應的參數(Hintonetal., 2012)。本研究中,Dropout層設置在前2個全連接層后,以解決全連接層的過擬合問題。

圖2 木材構造特征原始圖像和均衡處理后圖像塊樣本數量分布Fig.2 The quantity distribution of original anatomical images and the patches after balance processing
1.4.1 圖像預處理 對于圖像分辨率為2 048像素×2 048像素的高維RGB數據,若直接使用原始數據進行網絡訓練,不僅運算量大、模型訓練耗時長,而且各類別樣本數據差異較大,不平衡的訓練樣本會影響模型訓練精度,容易出現過擬合問題。因此,本研究在模型訓練前對原始數據進行2種預處理(Heetal., 2020a): 1) 截取圖像塊并縮小,首先從原始圖像中截取1 200像素×1 200像素圖像塊,然后將其縮小為227像素×227像素圖像塊作為最終訓練圖像,以極大降低數據維度(圖1); 2) 數據集劃分,在保證圖像塊重疊率小于20%的條件下,對于樣本數量較多的類別,從每個圖像樣本中截取較少圖像塊,對于樣本數量較少的類別,從每個圖像樣本中截取較多圖像塊。樣本原始圖像和均衡處理后圖像塊的樣本數量分布如圖2所示,經均衡處理的樣本數量方差從0.025 064減小至0.00 557。預處理后,采集于26種木材標本的10 237幅原始圖像擴充為132 265個圖像塊樣本,隨機選取其中30 896、3 871和3 829個圖像塊樣本分別作為訓練集、驗證集和測試集。
1.4.2 模型訓練 基于谷歌開放數據集ImageNet對模型進行預訓練后,微調模型參數,利用木材構造特征圖像數據集Rosewood-26對模型進行遷移學習(Panetal., 2010)。采用隨機梯度下降(stochastic gradient descent,SGD)方法加速神經網絡訓練,每次讀取400個圖像塊樣本,每265次迭代完成一輪(epoch)樣本訓練,設置基礎學習率(learning rate)、動量(momentum)和權值衰減(weight decay)等參數,用于獲得較快梯度下降速度并控制模型復雜度以防止過擬合。
1.4.3 模型測試 模型測試分2個步驟: 1) 采用3 829個圖像塊樣本對模型進行測試,輸出混淆矩陣(confusion matrix),并將每類測試樣本單獨輸出,得到所有誤判樣本,用于進一步分析模型的樹種識別能力; 2) 采用收集自交易市場的木材樣品圖像樣本對模型進行進一步測試,計算模型識別精度,評價模型泛化能力。
比較本研究構建的4種卷積神經網絡模型,AlexNet模型僅5層,結構最簡單,模型訓練時間最短,但模型識別精度最低; VGG16和DenseNet-121模型識別精度較高,但2種模型分別具有最多的權重數量和最長的訓練時間,不利于模型參數調節和優化,且消耗較多算力資源; ResNet-50模型深度雖達50層,但其權重數量最少,訓練時間相對較短,識別精度最高(表2)。深度學習模型網絡層數對模型性能具有重要影響,網絡層數增加后模型可進行更加復雜的特征提取任務,理論上能夠獲得更好的識別結果,但模型準確度也可能出現飽和甚至下降現象(Penningtonetal., 2017)。ResNet-50模型利用殘差學習解決了模型精度退化問題,近年來在圖像識別領域得到了廣泛應用。Ravindran等(2020)構建ResNet-34模型對10種楝科(Meliaceae)木材進行識別,模型最佳精度為82.7%; 本研究構建的ResNet-50模型對26種瀕危珍貴木材的識別精度達98.33%,顯著高于已有報道結果。因此,本研究優選ResNet-50模型進行黃檀屬和紫檀屬樹種木材的分類與識別。

表2 不同卷積神經網絡模型的參數和分類精度Tab.2 Parameters and accuracy of various convolutional neural networks
ResNet-50模型輸出的混淆矩陣如圖3所示。在15種黃檀屬木材中,僅有交趾黃檀1幅圖像被誤判為印度紫檀,而在11種紫檀屬木材中,無任何圖像被誤判為黃檀屬,ResNet-50模型在“屬”水平的分類精度接近100%。在“種”水平上,有9種黃檀屬木材(賽州黃檀、絨毛黃檀、東非黑黃檀、降香黃檀、奧氏黃檀、微凹黃檀、印度黃檀、亞馬遜黃檀和危地馬拉黃檀)和3種紫檀屬木材(檀香紫檀、非洲紫檀和染料紫檀)的分類精度達100%。在黃檀屬木材中,約8.6%的海南黃檀木材被誤判為黃檀,約5.7%的黃檀木材被誤判為印度黃檀,比較海南黃檀、黃檀誤判圖像與真實樹種圖像,海南黃檀、黃檀和印度黃檀3種木材在構造特征上具有較高相似性,采用傳統木材解剖學方法也難以鑒別。在紫檀屬木材中,安哥拉紫檀、安達曼紫檀、刺猬紫檀、印度紫檀、大果紫檀和囊狀紫檀6種木材的分類結果相互混淆,藥用紫檀和羅氏紫檀也出現相互混淆現象。檀香紫檀和染料紫檀木材構造特征極為相似,傳統木材解剖學方法難以將二者準確鑒別(梅萍等, 2017; Zhangetal., 2019a; 2019b),而本研究構建的ResNet-50模型可以成功鑒別檀香紫檀和染料紫檀。在11種紫檀屬木材中,印度紫檀的分類精度最低(93.28%),該樹種分別被誤判為安哥拉紫檀、安達曼紫檀、刺猬紫檀、大果紫檀和囊狀紫檀。印度紫檀樹種存在較大的種內變異性,不同木材樣本呈現多樣性構造特征,與同屬其他樹種的木材構造特征容易產生混淆(李桂蘭, 2007)。

圖3 采用ResNet-50模型識別15種黃檀屬和11種紫檀屬樹種木材的混淆矩陣Fig.3 Confusion matrix for image classification of 15 Dalbergia species and 11 Pterocarpus species generated by ResNet-50 model
基于構建的深度卷積神經網絡模型ResNet-50,本研究開發了iWood木材自動識別系統(殷亞方等, 2019),用于現場環境下木材樹種的識別。通過將采集自交易市場木材樣品的110幅圖像上傳至服務器測試發現,樣品在“屬”和“種”水平的識別精度分別為91.8%和77.3%。雖然該結果低于測試集的識別精度,但仍表明ResNet-50模型對未知樣本具有較好識別能力,模型未出現明顯過擬合。傳統木材解剖學方法可以識別木材到“屬”,但難以實現“種”的準確識別,且需要專業人員長期的木材鑒定訓練和知識經驗積累,耗費大量人力物力; 相較而言,基于本研究建立的木材構造特征圖像數據集構建的深度卷積神經網絡模型ResNet-50在“屬”水平的木材識別能力與專業鑒定人員相當,且識別速度快。同時,本研究首次采用市場來源的木材樣品構造特征圖像數據集對模型的泛化能力進行測試評價,雖然ResNet-50模型在“種”水平的識別精度僅為77.3%,但隨著木材構造特征圖像數據集的不斷擴充以及模型性能的持續優化,模型識別精度有望進一步提升,以應用于海關執法、木材貿易和質量監督檢驗等領域,為木材樹種自動精準識別提供新的途徑。
作為一種可再生生物材料,木材具有生物體普遍存在的天然復雜性,其構造特征通常在種間和種內均表現出較明顯的變異性(Heetal., 2020b)。由于在采集、保存和交換等方面存在的局限性,通過木材標本無法獲取木材種內所有變異特征,因此傳統木材解剖學方法難以實現“種”的準確識別(姜笑梅等, 2010)。基于木材構造特征圖像的深度學習方法為木材“種”的準確識別提供了新思路,木材變異性的構造特征可通過圖像形式便捷獲取,突破了傳統木材識別方法依賴實物標本和組織切片獲取木材構造特征的局限性。
卷積神經網絡可實現大數據量圖像的有效降維,并保留圖像關鍵特征,近年來在圖像分類領域得到廣泛應用。本研究從正確定名的15種黃檀屬和11種紫檀屬木材標本上采集10 237幅木材橫切面構造圖像建立木材構造特征圖像數據集Rosewood-26,為卷積神經網絡模型訓練和測試奠定了數據基礎; 構建的AlexNet、VGG16、DenseNet-121和ResNest-50 共4種卷積神經網絡模型對26種瀕危珍貴木材的分類精度分別為93.85%、98.00%、96.00%和98.33%,其中ResNet-50模型分類精度最高。值得注意的是,本研究采用的木材樹種類別及其圖像數量與深度學習領域的大規模數據集(如ImageNet)相比還遠遠不足,不同卷積神經網絡模型的分類精度未呈現明顯差異,今后在構建卷積神經網絡模型時,應進一步綜合考慮模型深度、權重數量和訓練時間等因素,以實現卷積神經模型性能的最優化(Pavindranetal., 2019)。
本研究分別從中國、美國和巴西4個木材標本館采集木材標本橫切面構造特征圖像,建立包含15種黃檀屬和11種紫檀屬木材的高質量圖像數據集Rosewood-26,該圖像數據集包含各樹種不同個體的構造特征信息,盡可能多地覆蓋了木材樹種的種內變異性,以保證構建的卷積神經網絡模型具有較好的魯棒性和泛化能力(胡明越, 2019)。同時,為了推動深度學習方法在木材圖像識別領域的應用,國內外木材標本館正在采用統一標準進行木材標本數字化,建立涵蓋樹種變異性的木材構特征圖像數據共享平臺,為構建更為精準高效的深度學習模型提供盡可能豐富的數據資源。未來通過深入開展木材信息學研究,實現木材圖像特征可視化,進一步揭示樹木木質部關鍵構造特征的種間變異規律,將為木材分類與識別奠定理論基礎,為木材“種”水平的自動精準識別提供科學依據(何拓等, 2020; 2021a)。
木材現場快速識別是木材樹種識別領域長期存在的科技難題,傳統木材解剖學方法一般只能確定到“屬”的水平,同時隨著社會經濟快速發展和社會分工越來越精細化,具有豐富經驗的木材鑒定專業人員數量越來越少,木材樹種現場識別領域面臨技術和人員雙重缺失的嚴峻挑戰(Wiedenhoeftetal., 2019; Heetal., 2020a; 何拓等, 2021b)。本研究通過專業圖像采集裝置采集26種瀕危珍貴木材標本橫切面構造特征圖像,建立木材構造圖像數據集Rosewood-26,構建卷積神經網絡模型,最終成功開發了iWood木材自動識別系統。該系統可實現木材構造特征圖像采集、圖像數據集管理、模型管理以及在線或離線識別等功能。基于卷積神經網絡模型開發的iWood木材自動識別系統,是一種端對端的圖像識別模式,用戶目前可通過圖像采集裝置獲取待檢木材樣品的橫切面構造特征圖像并上傳至系統,系統即可快速輸出樹種識別結果,有望解決包括海關、貿易和質檢在內的木材樹種識別應用領域檢測手段和專業鑒定人員長期缺乏的難題。
本研究采集15種黃檀屬和11種紫檀屬瀕危珍貴樹種木材橫切面構造特征圖像建立圖像數據集Rosewood-26,構建AlexNet、VGG16、DenseNet-121和ResNet-50 共4種卷積神經網絡模型進行木材樹種識別,其中ResNet-50模型識別精度最高(98.33%),對9種黃檀屬和3種紫檀屬木材的識別精度達100%,并可成功鑒別構造特征極為相似的檀香紫檀和染料紫檀; 基于ResNet-50模型構建的木材自動識別系統iWood,在“屬”和“種”水平的識別精度分別為91.8%和 77.3%。基于卷積神經網絡的木材計算機視覺識別方法,從覆蓋木材構造特征變異性的圖像大數據中自動提取關鍵識別特征并進行精準分類,解決了傳統木材解剖學方法難以識別木材到“種”的難題,突破了新興木材識別技術(DNA條形碼、化學指紋圖譜)難以建立參考數據庫的局限,為木材在“種”水平的自動精準識別提供了新的思路。本研究建立的基于卷積神經網絡的木材識別系統iWood適用于海關執法、木材貿易和質量監督等多場景下的木材自動精準識別,能夠為我國提升CITES履約執法能力、加強林產品產業鏈監管以及保障木材安全提供科技支撐。
建議今后借助國際林業研究組織聯盟(IUFRO)、國際木材解剖學家協會(IAWA)和木材標本國家創新聯盟(NIAWC)等國內外平臺,形成木材標本及其數據共享網絡,建立完整覆蓋木材構造特征種內中間變異的圖像數據庫,為木材圖像智能識別奠定數據基礎。同時,在對木材樣本、圖像數據集、深度學習模型及其參數體系深入研究以及識別系統測試應用的基礎上,制定木材計算機視覺識別方法標準,推動木材自動精準識別技術的推廣應用。