趙茂程 陳加新 邢曉陽 汪希偉 顧 越 李 忠
(1.南京林業大學機械電子工程學院, 南京 210037; 2.南京林業大學機電產品包裝生物質材料國家地方聯合工程研究中心, 南京 210037)
近年來,高光譜成像技術由于其快速、無損的特點,被廣泛地應用于農林產品質量安全檢測工作中[1-7],其中推掃式高光譜成像(Pushbroom hyperspectral imaging, P-B HSI)因在空間和光譜方面都具有很好的分辨率而備受關注[8-10]。
高光譜圖像中的每個像素點都包含特定位置的光譜信息,它可以實現被測樣本組分含量分布的可視化[11],以便實現品質在線檢測[12]。但是這些可視化圖像中常出現多條貫穿整個樣本區域的縱向條紋,例如文獻[13]建立的豬肉腌制過程中水分變化的空間分布圖像;文獻[14]建立的三文魚脂肪含量分布圖像;文獻[15]建立的變質牛肉摻假物在鮮肉糜中分布的可視化圖像。這種條紋還會出現在圖像處理工作中,如文獻[16]將玉米根茬從裸露地表背景中分離。這些條紋并非樣本自身的紋理,而是圖像中的條紋噪聲,其影響檢測精度,干擾可視化圖像中靶標物的判斷,阻礙圖像中靶標物與背景的分離。
目前,對于推掃式高光譜成像條紋噪聲問題的研究主要是針對衛星遙感上的高光譜圖像,處理方法包括數字濾波法[17]、增益估計法[18]、匹配法[19]、變分法[20]、圖像分解法[21]等,這些方法對圖像中條紋噪聲有一定的抑制效果,但是會改變相鄰沒有條紋噪聲區域的像素值,容易損失原始圖像中的真實信息,降低空間分布預測圖像的可信度。而對于室內高光譜成像系統應用,可以對系統條紋噪聲進行標定,通過使用專用的去條紋校正,更好地解決條紋噪聲問題。而目前推掃式高光譜成像固有的條紋噪聲對生物對象品質指標空間分布預測的影響及消除方法尚無專門研究報道。
我國是世界最大的銀杏葉生產國和出口國,由銀杏葉提取物制成的各類食品、保健品、藥品等已超過了100種,市場每年對銀杏葉有數以萬噸的需求量[22]。銀杏葉的含水率可以用于監測銀杏樹苗對水分的需求情況,且在收購時有助于準確預估干葉質量。更重要的是,對化學計量學可視化圖像中條紋噪聲分析的關鍵是能夠將其與樣本紋理相區別,以驗證其對細節部分的影響,而含水率對葉片表面的傷痕非常敏感,在可視化圖像中可以呈現傷痕的空間細節。因此,本文以銀杏葉含水率為例,基于化學計量學進行指標空間分布預測,利用標定法去除推掃式高光譜成像中的條紋噪聲,以改善含水率預測的可視化效果。
1.1.1實驗樣本
銀杏葉樣本采自江蘇省徐州市邳州市四戶鎮銀杏種植基地,于2020年8月12日采摘銀杏葉若干片,當天通過保溫箱帶回實驗室,并置于冰箱-18℃環境下保存。在第5~15天,每天22:00從冰箱中取出無破損的銀杏葉15片,以吸水紙包裹,放置于室溫(20℃)解凍9 h,在第2天07:00將葉片表面水擦干,然后先采集銀杏葉鮮葉質量,再采集高光譜圖像,最后干燥后采集銀杏葉干葉質量,計算含水率。
1.1.2高光譜成像系統
高光譜成像檢測平臺包含高光譜成像系統、一條白色食品級傳送帶(HSIA-CSD800型)、一套由12只50 W的鹵素燈與一個穹頂構成的漫反射照明系統,以及一臺計算機。高光譜成像系統為四川雙利合譜成像技術有限公司生產的GaiaField-N17E-N3型系統,主要包括成像光譜儀(Imspector N7E型,900~1 700 nm)、探測器(InGaAs型相機)、鏡頭(OLES22型)。其中成像光譜儀光譜分辨率為5 nm,被測樣品置于傳送帶上的載物臺上,由步進電機驅動,整個檢測過程置于暗室中,以屏蔽其他雜散光對數據采集的影響。
1.2.1含水率測定
采用干燥法對銀杏葉含水率進行測定。先用JA003型電子天平(上海浦春計量儀器有限公司)稱量鮮葉質量,然后將葉片放入牛皮信封中,將其置于DHG-9246A型電熱恒溫鼓風干燥箱(上海精宏實驗設備有限公司)中,于80℃條件下干燥2 h,使水分完全蒸發,再稱量干葉質量。銀杏葉含水率計算方法為
(1)
式中Mf——鮮葉質量,g
Md——干葉質量,g
1.2.2高光譜圖像采集
高光譜圖像數據由計算機中Specview軟件獲取,將高光譜相機與照明系統預熱30 min后進行銀杏葉圖像數據采集。為了避免采集的圖像失真,檢測平臺經過多次調整以獲取最佳數據采集參數:成像光譜儀的曝光物距為430 mm,曝光時間為6 ms,傳送帶移動速度為2.8 cm/s,掃描距離為200 mm,圖像分辨率為640像素×580像素。
1.2.3圖像預處理
(1)反射率校正
由于高光譜相機在圖像采集過程中存在暗電流影響,且光源系統照明通常不均勻,從而導致采集的圖像中有大量噪聲,因此需要對采集的圖像進行反射率校正,以消除暗電流及光源不均勻的影響[23]。校正方法為
(2)
式中R——高光譜圖像反射率
Ro——原始高光譜圖像反射率
Rb——黑色背景高光譜圖像反射率
Rw——白板高光譜圖像反射率
(2)傳統均值濾波圖像增強
平滑空間濾波一般通過模糊處理達到降低圖像噪聲的效果,傳統均值濾波是其中的線性空間濾波[24],它可以對圖像中每個像素點進行處理。傳統均值濾波主要是將圖像中每個像素點的值用濾波器模板內像素的平均值代替,從而抑制噪聲的影響,本文采用圓形均值濾波模板,當半徑為3像素時,條紋噪聲被有效消除。
雖然傳統均值濾波可以削弱條紋噪聲的影響,并且算法簡單,計算效率高,但是它使圖像變得模糊,圖像中的細節被嚴重削弱,真實信息丟失。
1.2.4去條紋標定法
去條紋標定法同樣也是對圖像中每個像素點進行校正處理。首先將整個高光譜采集系統進行標定,計算出每個像素點在不同亮度下的誤差,然后在采集新圖像時,對每個像素點進行校正。校正方法為

(3)
式中Iout(w,r,c)——經去條紋標定法處理后高光譜圖像立方體中第w波段、第r行、第c列灰度
Iin(w,r,c)——原始高光譜圖像立方體中第w波段、第r行、第c列灰度

去條紋標定法可以有效消除高光譜圖像中的條紋噪聲,并且不會影響圖像中的細節,使真實信息保存良好。
1.2.5建模與評價
(1)偏最小二乘回歸法(PLSR)預測模型
偏最小二乘回歸法[25]主要用于多因變量對多自變量之間關系建立的模型,是一種廣泛應用于光譜分析的多元回歸方法。這種方法將因變量和自變量數據矩陣同時進行分解,在自變量分解過程中引入因變量,以建立圖像數據中自變量主成分與樣本中被測組分含量之間的關系。PLSR本質上是一個線性預測模型,公式為
(4)
式中Y——模型預測值
β0——增益常數
Xw——第w波段圖像
βw——第w波段圖像的增益系數
n——模型所用波段的數量
PLSR模型中,βw越大,其對預測結果的貢獻越高,相應波段高光譜圖像的放大倍率也越高。然而,此時圖像中蘊含的條紋噪聲也將被放大。各PLSR模型的波段增益系數在本文中用于對指標分布預測結果圖中條紋強度變化趨勢的分析。
(2)模型評價
為了得到最佳性能的模型,采用交叉驗證法(Cross validation,CV)確定最優主成分數。通過取得最小交叉驗證均方根誤差(Root mean square error of cross validation,RMSECV)獲得最佳潛變量數。并采用決定系數R2以及均方根誤差(Root mean square error, RMSE)來驗證模型的效果,通常來說,R2越大(最大值為1),RMSE(最小值為0)相對于實測值越小,模型效果越好。
1.2.6含水率可視化
高光譜成像能夠通過預測模型對樣本高光譜圖像中每個像素的含水率進行預測,從而得到被測組分含量的空間分布圖像。分布圖像的準確性受預測模型性能以及圖像噪聲的影響,預測模型性能可通過調整模型參數來改善;而對于圖像噪聲,部分可以通過反射率校正消除,而另一部分影響較為明顯的條紋噪聲,可通過去條紋校正削弱甚至消除,以獲得最佳葉片含水率分布圖。
2.1.1銀杏葉光譜曲線提取

圖1 銀杏葉原始反射率光譜曲線Fig.1 Original reflection spectrum curves of ginkgo leaves
由于稱量時按單片葉子稱量,且每幅高光譜圖像中只包含一片葉子,因此將圖像中葉片的表面作為感興趣區域。在1 191 nm處,每幅圖像反射率閾值設置為0.2,然后經過向內腐蝕3個像素,再向外膨脹3個像素,可有效提取銀杏葉圖像感興趣區域的光譜信息。又因為采集的高光譜圖像在874.0~1 045.1 nm和1 556.5~1 731.0 nm范圍內噪聲干擾很大,因此刪除這兩個光譜波段。當用去條紋標定法校正后建立銀杏葉含水率分布圖像時,圖像在1 179.2 nm和1 523.0 nm處存在壞點,使分布圖像中存在兩條明顯的深色縱向條紋,因此將這兩個波長也刪除。最終選擇的有效光譜波段為1 046.7~1 177.5 nm、1 180.9~1 504.6 nm和1 507.9~1 554.9 nm,光譜曲線如圖1所示。
從圖1中可以看出,光譜曲線在1 200 nm左右存在微弱的吸收峰,在1 400 nm左右存在明顯的吸收峰。在1 200 nm處為C—H的伸縮振動的二級倍頻信息,是纖維素的吸收谷[26];在1 400 nm附近為O—H的伸縮振動的一級倍頻信息,此處主要為水分的吸收谷[27]。
2.1.2銀杏葉含水率統計
本實驗共采集165個樣本,剔除異常數據的樣本,最終剩余155個樣本。根據含水率排序,以留出法將117個樣本劃分為訓練集,38個樣本劃分為預測集。如表1所示,訓練集與預測集的平均值和標準差相近,說明樣本集分布均勻,且總樣本含水率在56.86%~73.22%之間,樣本之間有明顯的差異性,有利于全波段的PLSR建模。

表1 155份銀杏葉樣本含水率Tab.1 Moisture content of 155 ginkgo leaves
首先將原始高光譜圖像進行反射率校正,得到原始反射率圖像。然后將原始高光譜圖像進行傳統均值濾波增強,均值濾波采用圓形濾波器。當半徑為3個像素時,條紋被有效削弱,再對增強后的圖像使用反射率校正,得到經傳統均值濾波增強后反射率圖像。最后使用去條紋標定法對原始高光譜圖像進行處理,并進行反射率校正,得到經去條紋標定法處理后的反射率圖像。
為體現去條紋標定法的去條紋效果,選擇葉片表面存在折痕、信息比較豐富的146號樣本進行分析,分別選取該樣本在1 045.1 nm處的原始反射率高光譜圖像、經傳統均值濾波增強反射率高光譜圖像和經去條紋標定法處理的反射率高光譜圖像,并將它們的葉片區域置于同一黑色背景中,最后將圖像的色帶刻度值范圍設置為25%~40%,結果如圖2所示。其中,圖2a葉片區域存在明顯的亮暗交替的縱向條紋,這些條紋穿插于銀杏葉葉脈之間,將葉脈打斷;圖2b中,經過傳統均值濾波圖像增強后,銀杏葉的反射率圖像變得模糊,葉脈無法看清,條紋噪聲雖然被削弱,但是依然存在,且被加粗;圖2c中,經過去條紋標定法處理后,銀杏葉表面無明顯條紋,葉脈清晰,去條紋噪聲效果明顯。比較發現,推掃式高光譜圖像的條紋噪聲呈現縱向分布、亮暗交替;傳統均值濾波增強將每個像素點的灰度以其周圍像素點的平均灰度代替,雖然削弱了條紋噪聲的強度,但是會讓條紋噪聲變粗,使圖像質量降低,原始信息丟失;去條紋標定法是對每個像素點的偏差進行增減,相鄰像素點之間不會產生影響,可以很好地抑制條紋噪聲,并保證圖像質量,保留圖像原始信息。

圖2 銀杏葉反射率高光譜圖像(1 045.1 nm)Fig.2 Hyperspectral reflectance images of ginkgo leaf at 1 045.1 nm


圖3 化學計量學模型的預測能力Fig.3 Predictive accuracy of chemometric models
2.4.1含水率可視化圖像建立
在圖4中,每幅葉片圖像大部分區域偏于紅色,而右上角區域和葉柄區域都呈現綠色甚至藍色,說明這兩個區域含水率低于其他區域。對比銀杏葉原始樣本,鮮葉中右上角區域泛黃,呈枯萎狀態,這主要是因細胞內水分流失而導致含水率降低;鮮葉中葉柄區域由于趨于木質化,因此葉柄區域的含水率也相對較低。每幅葉片圖像右下角細節放大圖是由相應葉片圖像上白色方框區域放大兩倍得到,從圖4a~4c、圖4f~4h以及圖4k~4n中可以看到該區域有一條向右下傾斜的“疤痕”,它的顏色比周圍偏綠,即含水率比周圍低,對比銀杏葉原始樣本,該區域上存在一條折痕,折痕處的細胞壁被損壞,導致細胞內的水分流失,從而使折痕處含水率比周圍含水率低。結果表明含水率可視化圖像可以體現樣本細節,反映樣本的真實信息。
2.4.2主成分數對可視化圖像的影響
圖4a~4e為原始圖像銀杏葉含水率可視化圖像隨主成分數變化的情況。從中可以看出,當主成分數為6時,條紋噪聲最小,圖像中細節清晰,圖像可信度最佳;主成分數大于6后,條紋噪聲越來越嚴重,葉脈信息逐漸丟失,枯萎區域逐漸減小,“疤痕”漸漸消失,圖像可信度逐漸降低;主成分數為10時,葉柄區域含水率分布情況與葉片區域一致,與實際情況不符,圖像可信度極差。

圖4 不同處理方法的銀杏葉含水率可視化圖像Fig.4 Visualization images of water content of ginkgo leaf with different preprocessing methods
圖4f~4j為經傳統均值濾波增強圖像建立的銀杏葉含水率可視化圖像隨主成分數變化的情況。從中可以看出,主成分數為6時,條紋噪聲很小,除了因傳統均值濾波增強的特性導致葉脈無法顯示外,其他細節略微模糊,圖像可信度較好;主成分數大于6后,條紋噪聲逐漸增大,“疤痕”漸漸消失,圖像可信度降低;主成分數為10時,葉柄區域含水率分布情況與葉片區域一致,與實際情況不符,圖像可信度極差。
圖4k~4o為經去條紋標定法處理的圖像建立的銀杏葉含水率可視化圖像隨主成分數變化的情況。從中可以看出,主成分數分別為6、7和8時,沒有明顯的條紋噪聲干擾,圖像中細節部分都被保留,圖像可信度都很好;當主成分數為9時,出現微弱的粗狀縱向條紋,細節被削弱,圖像可信度變差;當主成分數為10時,粗壯條紋明顯,“疤痕”消失,葉柄區域含水率分布同樣與葉片區域一致,與實際情況不符,圖像可信度變得極差。
總之,隨著主成分數的增加,化學計量學模型增益系數成倍增大,導致原始圖像、經傳統均值濾波增強圖像以及經去條紋標定法校正的圖像建立的含水率可視化圖像中,條紋噪聲和其他噪聲逐漸增大,圖像質量逐漸降低;而從圖3中看到,隨著主成分數從6增加至10的過程中,3種圖像的化學計量學模型預測能力逐漸提升,當主成分數為10時,達到最高,這與相應的可視化結果相悖。這表明受到推掃式光譜成像本征條紋噪聲缺陷的影響,高準度化學計量學模型求得的像素光譜對指標的空間分布預測可信度不高,從而使其應用受到很大限制。
2.4.3去條紋標定法與均值濾波增強法比較


2.4.4條紋噪聲強度影響因素
圖4中,隨著主成分數的增加,3種處理方法構建的含水率可視化圖像中條紋噪聲強度逐漸增加。
進一步對隨主成分數從6增至10時3種預處理方法下建立的PLSR模型的波段增益系數進行分析,分別計算每個模型的波段增益系數的標準差、最大值和最小值。如圖5所示,3條曲線上的點分別表示每個模型的波段增益系數的標準差,在每個主成分數處,工型圖的下方表示增益系數最小值,上方表示最大值;藍色線條、綠色線條、紅色線條分別為原始圖像、傳統均值濾波增強圖像、去條紋標定圖像的增益系數。圖中兩條紅色水平參考線表示波段增益系數分別為1和-1:當某波段的化學計量學模型增益系數介于兩者之間時,即絕對值小于1時,對該波段圖像中的數值及噪聲起縮小作用,否則起放大作用。從圖中可以看到,3種PLSR模型的波段增益系數的標準差、最大值和最小值變化趨勢相似,它們的絕對值都隨主成分數的增加而增大;當主成分數為6和7時,增益系數的絕對值都小于1,圖像中的數值被縮小,條紋噪聲被抑制;當主成分數為8時,增益系數標準差和最小值的絕對值仍然小于1,最大值略大于1,大多數波段圖像中的數值仍被縮小,條紋噪聲相對主成分數為7時略有增加;當主成分數為9時,增益系數標準差小于1,最大值和最小值的絕對值都大于1,更多波段的圖像數值被放大,條紋噪聲被放大;當主成分數為10時,增益系數標準差、最大值和最小值的絕對值都大于1,大部分波段的圖像數值被放大,條紋噪聲也被進一步放大。波段增益系數增大,條紋噪聲增強,這與圖4中銀杏葉樣本圖像中條紋噪聲的變化趨勢一致。

圖5 不同主成分數預測模型波段增益系數的變化趨勢Fig.5 Spectral gains of chemometric models vs number of principle components
研究表明,當主成分數增加時,模型的波段增益系數增大,導致了化學計量學可視化圖像中條紋噪聲逐漸加重。這意味著高預測能力的化學計量學模型,如果其波段增益較大,將更易受條紋噪聲干擾。因此,一方面高預測能力的化學計量學模型不一定適用于指標分布的可視化;另一方面,去條紋校正從源頭消除噪聲,在保證指標分布可視化圖像中空間信息不受固有條紋噪聲干擾的情況下,在實際應用中可以采用波段增益系數更高、預測能力更強的化學計量學模型對農林產品品質進行空間分布預測。
(1)比較3種反射率圖像發現:反射率校正無法削弱條紋噪聲;傳統均值濾波圖像增強可以減少條紋噪聲,但圖像中條紋噪聲仍然明顯;去條紋標定法可以很好地抑制條紋噪聲,圖像中無條紋噪聲干擾。
(2)比較3種圖像建立的PLSR模型準度發現:去條紋標定法和傳統均值濾波增強均不會對模型的預測能力產生明顯影響,隨化學計量學模型波段增益增加,三者預測準度相當。

(4)比較3種圖像建立的PLSR模型波段增益系數發現:隨化學計量學模型波段增益系數的增大,可視化圖像中的條紋噪聲逐漸惡化。
(5)推掃式光譜成像由于本征條紋噪聲影響,高準度化學計量學模型不一定適用于像素光譜,因此不一定能對靶向指標的空間分布可視化進行預測;而經過去條紋標定法處理,能夠明顯抑制高光譜圖像的本征條紋噪聲,保證可視化圖像免受條紋噪聲干擾的同時,使得在指標預測中可以使用具有更大波段增益系數、更高預測準度的化學計量學模型,從而更加可信地對靶向指標的空間分布情況進行預測。