
關(guān)鍵詞:可溶性固形物含量;無(wú)損檢測(cè);信息融合;特征提取;機(jī)器學(xué)習(xí) 中圖分類號(hào):TS255.7;O439;TP183 文獻(xiàn)標(biāo)識(shí)碼:A DOI: 10.7525/j.issn.1006-8023.2025.03.017
Abstract: Soluble solids content (SSC)is akey indicatorfor assessing the internal qualityoffruits.This study proposes anon-destructive detection method based on hyperspectral image fusion to predict the SSCof blueberries.Three widely used wavelength dimensionalityreduction algorithms areemployed:Monte Carlo uninformative variable elimination(MCUVE),Competitive Adaptive Reweighted Sampling(CARS),and Successive Projections Algorithm(SPA),,to identify optimal wavelengths.Additionally,astrategy integrating Local Binary Paterns(LBP)and GrayLevel Co-occurrence Matrix(GLCM) is proposed for feature extraction.Using spectral features,image features,and fused features,Partial Least Squares (PLS),Backpropagation Neural Network (BPNN),and Support Vector Machine(SVM) models are developed for SSC prediction.Theresults demonstrate that the BPNN model,utilizing spectral features extractedvia the CARS algorithm and image featuresderived from the LBP+GLCM algorithm,yields the highest prediction accuracy.The model'scoefficient of determination(
)isO.9261,while the Root Mean Square Error ofPrediction(RMSEP)is 0.3641.Thisstudyindicates that hyperspectral image fusion technology holds significant potential forthenon-destructiveprediction of blueberry SSC.
Keywords:Soluble solidcontent;non-destructive assessment; information fusion;feature extraction;machine learning
0 引言
藍(lán)莓作為重要的林下經(jīng)濟(jì)作物,因其獨(dú)特的風(fēng)味和豐富的營(yíng)養(yǎng),深受消費(fèi)者喜歡[1-2]。可溶性固形物含量(solublesolidscontent,SSC)是評(píng)估藍(lán)莓新鮮度的一項(xiàng)重要指標(biāo)[3]。傳統(tǒng)的藍(lán)莓SSC檢測(cè)方法是通過(guò)折射儀測(cè)量水果汗液的折射率。然而,該方法費(fèi)時(shí)費(fèi)力,并且檢測(cè)后的藍(lán)莓受到不可逆轉(zhuǎn)的損壞,無(wú)法投入市場(chǎng)中進(jìn)行銷售。因此,有必要采用一種快捷可靠且無(wú)破壞性的方法對(duì)藍(lán)莓SSC進(jìn)行測(cè)定。
無(wú)破壞性的藍(lán)莓SSC測(cè)定方法主要包括超聲波法、拉曼光譜法、核磁共振成像和高光譜成像(hyper-spectralimaging,HSI)。其中,超聲波法通過(guò)檢測(cè)水果內(nèi)部結(jié)構(gòu)的變化來(lái)推測(cè)SSC,但測(cè)量精度較差。拉曼光譜法采用拉曼光譜技術(shù)來(lái)分析水果SSC,但對(duì)設(shè)備要求較高,難以用于生產(chǎn)線上。核磁共振技術(shù)通過(guò)分析水果內(nèi)部的水分和其他化學(xué)成分來(lái)推測(cè)SSC,但設(shè)備昂貴,也不適用于生產(chǎn)線上。
HSI技術(shù)可以同時(shí)提供待測(cè)樣本的空間和光譜信息,在不接觸水果的情況下檢測(cè)成分含量,具有較高的精度和深度信息,適用于大規(guī)模檢測(cè),常用于評(píng)估新鮮果蔬的內(nèi)部質(zhì)量特性。張立秀等4利用HSI技術(shù)結(jié)合離散二進(jìn)制粒子群(discretebinaryparticle swarmoptimization,DBPSO)算法對(duì)久保桃SSC進(jìn)行預(yù)測(cè),采用DBPSO算法、競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣(competi-tiveadaptivereweighted sampling,CARS)、連續(xù)投影算法(successive projections algorithm,SPA)和無(wú)信息變量消除(uninformativevariableelimination,UVE)對(duì)特征波長(zhǎng)進(jìn)行提取。為提高單一算法建模中的魯棒性,提出組合模式的特征波長(zhǎng)提取方法,最后分別建立最小二乘支持向量機(jī)和遺傳算法優(yōu)化的支持向量機(jī)模型。研究結(jié)果表明,二次組合(DBPSO
SPA)-SPA算法建立的最小二乘支持向量機(jī)模型對(duì)久保桃SSC預(yù)測(cè)性能最好,測(cè)試集決定系數(shù)
(decision coefficientofpredictionset)為0.955,測(cè)試集均方根誤差(rootmeansquare errorof prediction,RMSEP)為O.139。常洪娟等[5利用HSI技術(shù)結(jié)合反向傳播神經(jīng)網(wǎng)絡(luò)(Back-propagationneuralnetwork,BPNN)模型與偏最小二乘回歸模型對(duì)芒果SSC進(jìn)行預(yù)測(cè)。采用多元散射校正對(duì)光譜進(jìn)行預(yù)處理,利用遺傳算法、區(qū)間變量迭代空間收縮算法(interval variable iterative spaceshrinkagealgorithms,IVISSA)和變量組合群體分析算法對(duì)光譜進(jìn)行特征提取。結(jié)果表明,IVISSA+BPNN模型預(yù)測(cè)能力最佳,
RMSEP和殘差預(yù)測(cè)偏差(residualpredic-tionbias,RPB)分別為
和2.7127。該模型為開(kāi)發(fā)在線芒果SSC無(wú)損檢測(cè)系統(tǒng)奠定基礎(chǔ)。Qiao等[利用HSI技術(shù),提出多階段逐次投影算法同時(shí)檢測(cè)藍(lán)莓的SSC和硬度。Gao等[7]將光譜與圖像信息融合,建立了檢測(cè)紅提葡萄SSC的偏最小二乘回歸模型。結(jié)果表明,光譜與圖像融合時(shí),偏最小二乘回歸模型的訓(xùn)練集和測(cè)試集的相關(guān)系數(shù)分別為0.9775和0.9762,均顯著優(yōu)于光譜或圖像信息的模型。盡管HSI技術(shù)在水果SSC無(wú)損檢測(cè)方面已有諸多應(yīng)用,但關(guān)于高光譜圖譜融合技術(shù)檢測(cè)藍(lán)莓SSC的研究尚未報(bào)道。
本研究以藍(lán)莓(品種:‘美登’)為研究對(duì)象,利用高光譜成像儀獲取樣本的光譜和圖像信息,建立高光譜圖譜融合信息和單一信息(光譜或圖像)的藍(lán)莓SSC檢測(cè)模型,并對(duì)比模型性能。
1 材料與方法
1.1 材料
試驗(yàn)研究的藍(lán)莓品種為‘美登’,2021年8月采摘自遼寧省丹東市振安區(qū)藍(lán)莓培育基地,采摘后放入保鮮箱內(nèi),并快速運(yùn)往生物信息試驗(yàn)室。樣本到達(dá)后,人工篩選直徑為 1 0~1 4 m m ,重量為 0 . 9 ~ 2 . 1g 的藍(lán)莓樣本,共計(jì)188個(gè)。所有樣本依次編號(hào),用于后續(xù)的圖像分析和數(shù)據(jù)對(duì)照。藍(lán)莓在室溫條件下存放 6 n ,隨即進(jìn)行高光譜圖像采集。
1. 2 高光譜圖像的采集與校正
試驗(yàn)采用的高光譜成像系統(tǒng)如圖1所示,該系統(tǒng)主要包括高光譜成像光譜儀(SpecimFX10)、CCD相機(jī)(IGV-B1410M) , 3 4 m m 定焦透鏡、2個(gè)150W的光線鹵素?zé)簦?900Illuminator)、計(jì)算機(jī)(DELLVostro 5460-D1448)和移動(dòng)平臺(tái)。為獲取清晰且無(wú)失真的圖像,CCD相機(jī)的曝光周期設(shè)置為 2 2 m s ,移動(dòng)平臺(tái)以 1 . 6 m m / s 的速度移動(dòng),使樣本在穩(wěn)定的速度下接受光照,確保成像清晰。將每個(gè)藍(lán)莓樣本逐一放置于移動(dòng)平臺(tái)上,20個(gè)藍(lán)莓為一組,在 4 0 0~1 0 0 0 n m 波段下進(jìn)行高光譜圖像采集。圖像存儲(chǔ)至計(jì)算機(jī)進(jìn)行后續(xù)處理。
為消除光照不均勻和暗電流噪聲等因素對(duì)圖像的影響,需要對(duì)采集到的藍(lán)莓高光譜圖像進(jìn)行黑白板校正。使用反射效率為 9 9 % 的白色漫反射板獲得典型的白色校正圖像,然后將鏡頭蓋遮蓋獲得典型的黑色校正圖像,通過(guò)以下公式計(jì)算得到校正后的高光譜圖像 

式中:
為校正前藍(lán)莓高光譜圖像;
為白色校正圖像;
為黑色校正圖像。

1.3 圖像預(yù)處理與感興趣區(qū)域提取
本研究將藍(lán)莓個(gè)體圖像作為感興趣區(qū)域(Regionsofinterest,ROI)。由于 4 0 0~4 5 0 n m 波長(zhǎng)范圍內(nèi)存在較大噪聲干擾,因此,選擇 4 5 0~1 0 0 0 n m 波長(zhǎng)范圍(431個(gè)波段)進(jìn)行分析,背景和藍(lán)莓的光譜曲線如圖2所示。由圖2可知,背景和樣本相對(duì)反射率值在8 8 2 n m 處差異最為顯著,因此選取 8 8 2 n m 的灰度圖像作為特征圖像,如圖3所示。為獲得藍(lán)莓二值化圖像,在圖3(b)灰度直方圖上建立閾值分割算法,將藍(lán)莓圖像從背景中分離出來(lái)(圖3(c))。最后,利用二值化圖像對(duì)高光譜圖像(圖3(a))做掩膜處理,從而去除背景和噪聲干擾,得到掩膜圖像(圖3(d))。計(jì)算藍(lán)莓個(gè)體掩膜圖像ROI的平均光譜值作為該樣本的相對(duì)反射率值。


1.4 藍(lán)莓SSC測(cè)定方法
樣本高光譜圖像采集完成后,對(duì)樣本進(jìn)行研磨,經(jīng)過(guò)3層紗布過(guò)濾,用吸管吸取 0 . 4 m L 的樣本汁液滴于數(shù)字折光儀(BR0035型,德國(guó)Wiggens,測(cè)量指標(biāo)范圍為
,測(cè)量精度為
),每個(gè)樣本重復(fù)測(cè)定3次,取平均值作為樣本SSC真實(shí)值,并記錄。
1.5 特征提取方法
1.5.1 光譜特征提取方法
對(duì)原始高光譜數(shù)據(jù)進(jìn)行光譜特征提取可以減少數(shù)據(jù)的維度,提高分析效率,同時(shí)保留關(guān)鍵信息,從而有利于提高模型的準(zhǔn)確性和泛化能力。本研究采用3種典型的數(shù)據(jù)降維算法確定有效波長(zhǎng),分別是蒙特卡羅無(wú)信息變量消除(MonteCarlouninformativevariableelimination,MC-UVE)CARS和SPA。
MC-UVE是通過(guò)隨機(jī)抽樣和模擬來(lái)評(píng)估模型輸出的不確定性,從而提高后續(xù)分析的效率和準(zhǔn)確性[9]。CARS通過(guò)競(jìng)爭(zhēng)機(jī)制來(lái)選擇最重要的特征,并逐步調(diào)整權(quán)重,從而提高特征選擇的準(zhǔn)確性[10]。SPA通過(guò)對(duì)數(shù)據(jù)進(jìn)行譜投影,幫助識(shí)別和保留最具信息量的特征,從而減少數(shù)據(jù)的維度[1]。
1.5.2 圖像特征提取方法
為描述圖像紋理特征,本研究采用局部二值模式(localbinarypatterns,LBP,式中記為
)和灰度共生矩陣(gray level co-occurrence matrix,GLCM)提取高光譜圖像特征。
LBP通過(guò)比較每個(gè)像素與其鄰域像素的灰度值,生成一個(gè)二進(jìn)制模式,從而編碼局部紋理信息[12]。本研究采用基于圓形鄰域的LBP算法,以較小的半徑和8個(gè)采樣點(diǎn)實(shí)現(xiàn)細(xì)致的紋理編碼。具體而言,采用LBP算法將圖像劃分為中心域和鄰域。將中心域得到的像素值與相鄰8個(gè)域得到的像素值進(jìn)行比較。如果鄰域像素值大于或等于中心域像素值,編碼為1,否則編碼為0。以此類推,從標(biāo)記區(qū)域的左上角順時(shí)針讀取8個(gè)二進(jìn)制數(shù),形成二值化序列,對(duì)應(yīng)的十進(jìn)制數(shù)就是鄰域中心點(diǎn)的響應(yīng)。計(jì)算公式為


式中: s ( x ) 為符號(hào)函數(shù);
為閾值,即中心域的像素值;
為鄰域的像素值; r 為圓的鄰域半徑, r = 1 ; n 為鄰域像素的位置; p 為半徑圓上的采樣點(diǎn)個(gè)數(shù), p = 8 0
GLCM通過(guò)計(jì)算圖像中不同灰度級(jí)像素的共生關(guān)系,根據(jù)圖像紋理的對(duì)比度(式中記為
)能量(式中記為
、熵(式中記為
和均勻性(式中記為
),對(duì)圖像進(jìn)行紋理分析[13]。其中,對(duì)比度強(qiáng)調(diào)灰度級(jí)差異較大的區(qū)域;能量反映紋理的規(guī)則性;熵描述圖像的隨機(jī)性,能夠反映不均勻區(qū)域;均勻性則更關(guān)注局部區(qū)域的灰度級(jí)相似性。相比于LBP的局部性,GLCM分析的是相對(duì)較大尺度的灰度級(jí)關(guān)聯(lián)性。因此,一個(gè)矩陣由表示特定方向
和特定距離 ( D ) 分離的具有相同灰度級(jí)的像素對(duì)出現(xiàn)的相對(duì)頻率構(gòu)成。為了表示紋理,使用MATLAB程序確定了以下GLCM參數(shù),計(jì)算為




式中:
為灰度共生矩陣; i 和j為灰度級(jí); L 為灰度級(jí)的數(shù)量。
1. 6 建模方法與評(píng)價(jià)指標(biāo)
將光譜特征、圖像特征和圖譜融合特征作為輸人,實(shí)測(cè)樣本SSC作為輸出,建立偏最小二乘(partial leastsquares,PLS)、BPNN和支持向量機(jī)(support vector ma-chine,SVM)3種定量預(yù)測(cè)模型。
PLS是一種線性回歸方法,常用于處理多個(gè)因變量與多個(gè)自變量之間的關(guān)系[14]。BPNN是一種非線性回歸方法,其網(wǎng)絡(luò)的權(quán)重和閾值通過(guò)反向傳播不斷調(diào)整,以最小化網(wǎng)絡(luò)的平方誤差和[15]。本研究使用的BPNN結(jié)構(gòu)采用了3層神經(jīng)網(wǎng)絡(luò),通過(guò)試錯(cuò)法和經(jīng)驗(yàn)法相結(jié)合,確定隱藏層節(jié)點(diǎn)數(shù)為12。輸人層節(jié)點(diǎn)為特征變量的數(shù)量,輸出層為實(shí)測(cè)樣本SSC。不同層之間的激活函數(shù)為Sigmoid函數(shù),目標(biāo)誤差設(shè)定為0.0001,最大迭代次數(shù)設(shè)定為1000,學(xué)習(xí)率設(shè)定為0.01。SVM是一種基于核的方法,通過(guò)核函數(shù)將輸入變量映射到高維特征空間,并從特征空間中提取線性超平面作為決策函數(shù)以解決預(yù)測(cè)問(wèn)題[16]。本研究使用高斯徑向基函數(shù)建立預(yù)測(cè)模型,主要調(diào)整的參數(shù)為懲罰系數(shù)和正則化參數(shù),且用網(wǎng)格搜索法確定最佳參數(shù)的組合。
預(yù)測(cè)模型建立后,通過(guò)4個(gè)指標(biāo)對(duì)模型的預(yù)測(cè)性能進(jìn)行評(píng)價(jià)。具體的評(píng)價(jià)指標(biāo)分別為訓(xùn)練集的決定系數(shù)
(decision coefficient of calibration set)、訓(xùn)練集均方根誤差RMSEC(root mean square error of calibration,式中記為
和RMSEP(式中記為
)。計(jì)算公式為


式中:
為真實(shí)值;
為預(yù)測(cè)值;
為真實(shí)值的平均值; n 為樣本數(shù)量;
和
越接近
和
越小,表明模型的預(yù)測(cè)性能越強(qiáng)。
2 結(jié)果與分析
2.1藍(lán)莓SSC測(cè)定結(jié)果
將樣本按照3:1的比例隨機(jī)分為訓(xùn)練集和測(cè)試集,即隨機(jī)選擇141個(gè)樣本劃分為訓(xùn)練集,其余的47個(gè)樣本劃分為測(cè)試集。訓(xùn)練集和測(cè)試集樣本SSC的統(tǒng)計(jì)結(jié)果見(jiàn)表1。其中,SSC分布范圍為 6 . 5 % ~ 1 3 . 8 % ,訓(xùn)練集和測(cè)試集均值分別為 1 0 . 1 % 和 9 . 7 % ,標(biāo)準(zhǔn)差分別為1.99和1.65。

2. 2 光譜數(shù)據(jù)分析
Savitzky-Golay算法是一種常用的平滑濾波方法,用于消除信號(hào)中的噪聲,同時(shí)盡可能保留信號(hào)的特征信息。該算法通過(guò)在一個(gè)移動(dòng)窗口內(nèi)對(duì)信號(hào)點(diǎn)進(jìn)行多項(xiàng)式擬合,然后用擬合的結(jié)果替代原始點(diǎn)值,從而實(shí)現(xiàn)平滑處理。本研究利用該算法對(duì)樣本校正光譜進(jìn)行預(yù)處理,樣本相對(duì)反射率光譜曲線如圖4所示。由圖4可知,所有樣本的光譜曲線趨勢(shì)相似,在 4 5 0~6 8 4 n m ,相對(duì)反射率緩慢下降,并在 6 8 4 n m 處出現(xiàn)吸收帶,可能是由該波段樣本少量葉綠素引起的[17]。在 6 8 4~8 9 3 n m ,相對(duì)反射率急劇上升,并在 8 9 3 n m 處出現(xiàn)明顯的反射峰,可能與樣本的碳水化合物,水分子中的C一H鍵、O—H鍵和N—H鍵密切相關(guān)[18]。在 8 9 3 ~9 6 2 n m ,相對(duì)反射率急劇下降,并在 9 6 2 n m 處出現(xiàn)明顯的吸收帶,可能是由樣本的水分子中0一H二級(jí)倍頻振動(dòng)引起的[19]。
2.3 特征波段分析
全光譜數(shù)據(jù)通常包含數(shù)千個(gè)變量,為了獲得簡(jiǎn)單、快速、可靠的預(yù)測(cè)模型,需要通過(guò)選擇變量進(jìn)行模型優(yōu)化。全光譜數(shù)據(jù)主要存在2個(gè)缺點(diǎn)。其一,需要大量的時(shí)間來(lái)校準(zhǔn)和執(zhí)行模型,從而影響模型在線分析的速度[20]。此外,全光譜數(shù)據(jù)存在冗余和非相關(guān),這會(huì)降低模型的預(yù)測(cè)能力[2I]。本研究使用MC-UVE、CARS和SPA這3種特征提取算法對(duì)全光譜數(shù)據(jù)進(jìn)行降維,并且這3種算法已被證明在水果SSC變量評(píng)估中是有效的[22-23]。

利用MC-UVE算法的樣本SSC特征波段選擇結(jié)果如圖5所示。其中,黑色曲線表示光譜變量的穩(wěn)定值,紅色曲線表示噪聲變量的穩(wěn)定值,綠色虛線表示截止線。對(duì)于預(yù)測(cè)模型的建立,只有穩(wěn)定性在虛線之上的變量才被認(rèn)為是有效變量,即通過(guò)MC-UVE算法提取了103個(gè)特征波段。
利用CARS算法的樣本SSC特征波段選擇結(jié)果如圖6所示。在該過(guò)程中,使用50次蒙特卡羅采樣迭代,并采用5倍交叉驗(yàn)證選擇最終變量。交叉驗(yàn)證均方根誤差(root mean squared error of cross-validation,RM-SECV)值越小,與樣本相關(guān)的特征波段子集越好。由圖6可知,隨時(shí)間采樣的變量數(shù)量,5倍RMSECV值以及每個(gè)變量的回歸系數(shù)路徑與運(yùn)行一次CARS時(shí)進(jìn)行的蒙特卡羅采樣運(yùn)行次數(shù)有關(guān)。圖6(a)顯示了CARS算法是如何結(jié)合快速選擇和精細(xì)選擇的,表明了選擇的變量數(shù)在變得相對(duì)穩(wěn)定時(shí)如何急劇下降。由于在圖6(b)中,隨著采樣運(yùn)行次數(shù)的增加,無(wú)信息變量逐漸被消除,因此模型的RMSECV值從采樣運(yùn)行1\~34次開(kāi)始緩慢下降,然后,由于一些重要變量被刪除,RMSECV值開(kāi)始上升。最小5倍RMSECV值用于建立樣本SSC預(yù)測(cè)的最佳變量子集。圖6(c)中的每一行顯示每個(gè)變量在不同采樣運(yùn)行時(shí)的回歸系數(shù)。回歸系數(shù)較高的變量更有可能被選擇。因此,回歸系數(shù)的分析可用于確定每次樣本運(yùn)行的一組變量。最小5倍RMSECV值用帶有星號(hào)的垂直線表示。通過(guò)CARS算法,提取了12個(gè)特征波段進(jìn)行樣本SSC的分析。


利用SPA算法的樣本SSC特征波段選擇結(jié)果如圖7所示。圖7(a)顯示通過(guò)SPA獲取的樣本SSC預(yù)測(cè)RMSE圖。空心的正方形顯示所選擇的變量數(shù)。由圖7(a)可知,當(dāng)所選變量的數(shù)量從1\~14時(shí),RMSE曲線急劇下降。隨著所選變量數(shù)的增加,下降趨勢(shì)變得緩慢。當(dāng)選擇的變量數(shù)達(dá)到25時(shí),RMSE達(dá)到了最佳值。此后,RMSE曲線趨于穩(wěn)定。所選變量(空心方塊)對(duì)應(yīng)于光譜的分布如圖7(b)所示。

2.4 模型分析
2.4.1 光譜模型分析
本研究利用3種降維方法提取到的特征波段對(duì)應(yīng)的相對(duì)反射率構(gòu)建PLS、BPNN和SVM樣本SSC預(yù)測(cè)模型。基于光譜特征建立的模型預(yù)測(cè)結(jié)果見(jiàn)表2。由表2可以看出,當(dāng)利用CARS算法提取特征波段建立的BPNN模型在樣本SSC預(yù)測(cè)性能方面最佳。測(cè)試集中
最大,為0.9226,RMSEP最小,為0.3879。

CARS算法的預(yù)測(cè)結(jié)果優(yōu)于MC-UVE和SPA算法,這可能是由于CARS算法選擇的波段與樣本SSC相關(guān)性更強(qiáng)。利用CARS算法選取450、462、467、488、6 7 5 . 7 0 1 . 7 1 5 . 8 0 9 . 8 5 5 . 8 9 6 . 9 7 6 . 9 8 5n m 作為特征波段。其中, 4 5 0 , 4 6 2 , 4 6 7n m 波段與果實(shí)顏色信息有關(guān)[24], 4 8 8 n m 波段與果實(shí)花青素有關(guān)[25], 6 7 5 、 7 0 1n m 波段與果實(shí)中少量的葉綠素有關(guān)[17], 7 1 5 n m 波段與碳水化合物中的C—H基團(tuán)和O—H基團(tuán)有關(guān)[18],855、8 9 6 n m 與C—H基團(tuán)的伸縮振動(dòng)有關(guān)[26], 9 7 6 、 9 8 5 n m 與水的吸收有關(guān)[19]。
2.4.2 圖像模型分析
利用LBP對(duì)樣本灰度圖像進(jìn)行計(jì)算,得到與樣本灰度圖像大小相同的LBP圖像。同時(shí),計(jì)算并繪制LBP的直方圖,用于描述圖像紋理特征。根據(jù)式(4)一式(7)計(jì)算LBP圖像,得到GLCM的特征值。本研究采用4個(gè)方向
生成GLCM,每個(gè)方向使用4個(gè)統(tǒng)計(jì)量(對(duì)比度、能量、熵和均勻性),生成16個(gè)特征值。然后,計(jì)算4個(gè)統(tǒng)計(jì)量的均值、標(biāo)準(zhǔn)差和方差,得到12個(gè)特征值,即描述樣本圖像的28個(gè)特征值。
利用LBP圖像特征、樣本圖像GLCM特征和LBP圖像GLCM特征,分別構(gòu)建PLS、BPNN和SVM樣本SSC預(yù)測(cè)模型。基于圖像特征建立的模型預(yù)測(cè)結(jié)果見(jiàn)表3。由表3可以看出,使用LBP
GLCM提取圖像特征時(shí),BPNN模型對(duì)樣本SSC預(yù)測(cè)性能最佳。測(cè)試集中
最大,為0.6702,RMSE最小,為0.9353。值得注意的是,GLCM對(duì)圖像特征提取的預(yù)測(cè)效果優(yōu)于LBP。可能的原因是GLCM獲得了全局紋理特征,而LBP獲得了局部紋理特征。利用
方法,結(jié)合了LBP的效率和GLCM的魯棒性優(yōu)點(diǎn),利用GLCM方法獲得的樣本圖像的全局特征紋理,彌補(bǔ)了LBP方法在中心像素點(diǎn)灰度計(jì)算方面的不足。

2.4.3 圖譜融合模型分析
光譜信息能夠反映樣本的內(nèi)部化學(xué)成分,圖像信息能夠反映樣本的外部特征。將光譜與圖像信息融合能夠更有效地預(yù)測(cè)樣本SSC。本研究將光譜特征與圖像特征進(jìn)行融合(歸一化處理),然后構(gòu)建PLS、BPNN和SVM樣本SSC預(yù)測(cè)模型。基于圖譜融合特征建立的模型預(yù)測(cè)結(jié)果見(jiàn)表4(黑體數(shù)字表示模型預(yù)測(cè)的最優(yōu)結(jié)果)。由表4可以看出,利用CARSamp;( L B P +
GLCM)的圖譜融合特征建立的BPNN模型對(duì)樣本SSC預(yù)測(cè)性能最佳。測(cè)試集中
最大,為0.9261,RMSEP最小,為0.3641。
表2\~4的結(jié)果表明,利用光譜特征構(gòu)建的模型預(yù)測(cè)效果優(yōu)于圖像特征構(gòu)建的模型,圖譜融合特征模型的預(yù)測(cè)效果優(yōu)于單一(光譜或圖像)特征模型。此外,BPNN模型的預(yù)測(cè)性能優(yōu)于PLS和SVM模型,這可能是光譜數(shù)據(jù)與圖像數(shù)據(jù)之間存在非線性相關(guān)的原因。

3結(jié)論
本研究提出一種基于高光譜圖譜信息融合的藍(lán)莓SSC無(wú)損檢測(cè)方法,并評(píng)估了不同特征提取算法和回歸模型的預(yù)測(cè)性能。通過(guò)對(duì)比光譜特征(MC-UVE、CARS和SPA)與圖像特征(LBP、GLCM和LBP+GLCM)的提取方法發(fā)現(xiàn),光譜與圖像特征融合的模型相比單一特征模型具有更優(yōu)的預(yù)測(cè)性能。特別是當(dāng)光譜特征采用CARS算法,圖像特征采用
算法時(shí),BPNN回歸模型的預(yù)測(cè)效果最佳,
,
。結(jié)果表明,高光譜圖譜信息融合方法能夠提高藍(lán)莓SSC預(yù)測(cè)精度,具有較大的應(yīng)用潛力。未來(lái)的研究將聚焦于從不同品種和生長(zhǎng)環(huán)境下獲取更多樣本,以進(jìn)一步提高模型的泛化能力。
參考文獻(xiàn)
[1]CHENYH,HUNGYC,CHEN MY,et al.Enhanced storabilityofblueberriesbyacidicelectrolyzedoxidizingwater application may be mediated by regulating ROS metabolism [J].Food Chemistry,2019,270:229-235.
[2]QIAO SC,TIANYW,WANGQH,etal.Nondestructive detectionofdecayed blueberrybased on information fusion of hyperspectral imaging (HSI) and low-field nuclear magnetic resonance(LF-NMR)[J]. Computers and Electronics in Agriculture,2021,184:106100.
[3]LIJL,SUNDW,CHENGJH.Recent advances in nondestructive analytical techniques for determining the total soluble solids in fruits:A review[J].Comprehensive Reviews in Food Science and Food Safety,2016,15(5): 897-911.
[4]張立秀,張淑娟,孫海霞,等.高光譜結(jié)合離散二進(jìn)制粒 子群算法對(duì)久保桃可溶性固形物含量的檢測(cè)[J].光譜 學(xué)與光譜分析,2024,44(3):656-662. ZHANGLX,ZHANGSJ,SUNHX,etal.Determination of soluble solid content in peach based on hyperspectral combination with BPSO[J]. Spectroscopy and Spectral Analysis,2024,44(3):656-662.
[5]常洪娟,蒙慶華,吳哲鋒,等.基于反向傳播神經(jīng)網(wǎng)絡(luò)和 高光譜成像的芒果可溶性固形物含量檢測(cè)[J].食品安 全質(zhì)量檢測(cè)學(xué)報(bào),2024,15(2):141-148. CHANGHJ,MENGQH,WUZF,etal.Detectionof soluble solids content in mango based on backpropagation algorithm neural network and hyperspectral imaging[J]. JournalofFoodSafetyandQuality,2024,15(2):141-148.
[6]QIAOSC,TIANYW,GUWJ,etal.Researchon simultaneous detection of SSC and FI of blueberry based on hyperspectral imaging combined MS-SPA[J].Engineering in Agriculture,Environment and Food,2019,12(4): 540-547.
[7] GAO S,XU JH. Hyperspectral image information fusionbased detection of soluble solids content in red globe grapes [J].Computers and Electronics in Agriculture,2O22,196: 106822.
[8]李斌,韓昭洋,王秋,等.基于高光譜成像技術(shù)的枇杷碰 傷等級(jí)檢測(cè)研究[J].光譜學(xué)與光譜分析,2023,43(6): 1792-1799. LI B,HAN Z Y,WANG Q,et al. Research on bruise level detection of loquat based on hyperspectral imaging technology[J]. Spectroscopy and Spectral Analysis,2023,43(6) : 1792-1799.
[9]蔣大鵬,高禮彬,陳金浩,等.木材抗拉強(qiáng)度的近紅外光 譜MC-UVE-IVSO建模方法[J].光譜學(xué)與光譜分析, 2023,43(8):2488-2493. JIANGD P,GAO L B,CHENJH,etal.Near infrared spectroscopy modeling method of wood tensile strength based on MC-UVE-IVSO[J]. Spectroscopy and Spectral Analysis,2023,43(8) :2488-2493.
[10]路皓翔,張靜,李靈巧,等.最小角回歸結(jié)合競(jìng)爭(zhēng)性自 適應(yīng)重加權(quán)采樣的近紅外光譜波長(zhǎng)選擇[J].光譜學(xué)與 光譜分析,2021,41(6):1782-1788. LU H X,ZHANG J,LI L Q,et al. Least angle regression combined with competitive adaptive re-weighted sampling for NIR spectral wavelength selection[J]. Spectroscopy and Spectral Analysis,2021,41(6) :1782-1788.
[11]宋子怡,常慶瑞,鄭智康,等.基于高光譜和連續(xù)投影 算法的弼猴桃葉片氮平衡指數(shù)的估測(cè)[J].江蘇農(nóng)業(yè)學(xué) 報(bào),2024,40(7) :1260-1267. SONG ZY,CHANG QR,ZHENG Z K,et al.Estimation of kiwifruit leaf nitrogen balance index based on hyperspectral and successive projections algorithm[J]. Jiangsu Journal of Agricultural Sciences,2024,40(7) : 1260-1267.
[12]趙玉清,賈奧瑩,王天允,等.基于機(jī)器學(xué)習(xí)的缺陷咖 啡生豆檢測(cè)[J].自動(dòng)化應(yīng)用,2024,65(11):1-6. ZHAOYQ,JIAAY,WANG TY,et al.Detection of defective green coffee beans based on machine learning[J]. Automation Application,2024,65(11) : 1-6.
[13]陳洋,陳孝敬,石文,等.基于激光散斑的食品包裝缺 陷檢測(cè)[J].激光與光電子學(xué)進(jìn)展,2025,62(6):1-15. CHEN Y,CHEN X J,SHI W,et al. Detection of food packaging defects based on laser speckle[J].Laser amp; Optoelectronics Progress,2025,62(6) :1-15.
[14] 張燕,賈陽(yáng),杜涓,等.偏最小二乘法和近紅外光譜技 術(shù)快速測(cè)定發(fā)酵黃芪莖葉中黃酮含量及抗氧化活性 [J].飼料研究,2024,47(18):70-75. ZHANG Y,JIAY,DU J,etal.Rapid determinationof flavonoidsand antioxidantactivityoffermented Astragalus membranaceus stems and leaves by partial least square method and near infrared spectroscopy technique[J]. FeedResearch,2024,47(18):70-75.
[15]邱騰煌,錢玉寶,季威.基于GA-BPNN混合智能模型 的鉆速預(yù)測(cè)[J].電子測(cè)量技術(shù),2024,47(15): 177-186. QIU TH,QIANYB,JI W.Drilling rate prediction based onGA-BPNN hybrid intelligentmodel[J].Electronic MeasurementTechnology,2024,47(15):177-186.
[16]房孝猛,王華來(lái),徐暉,等.基于SVM與近紅外TDLAS 技術(shù)的多組分痕量氣體識(shí)別與檢測(cè)[J].光譜學(xué)與光譜 分析,2024,44(10):2909-2915. FANGXM,WANGHL,XUH,etal.Identificationand detection of multi-component trace gases based on nearinfrared TDLAS technology based on SVM[J].Spectroscopyand Spectral Analysis,2024,44(10):2909-2915.
[17] YU KQ,ZHAO YR,LIU ZY,et al.Application of visible and near-infrared hyperspectral imaging for detectionofdefectivefeaturesinloquat[Jl.FoodandBioprocess Technology,2014,7(11) :3077-3087.
[18]HE X M,F(xiàn)U XP,RAO XQ,et al.Assessing firmness and SSC of pears based on absorption and scatering propertiesusing an automatic integrating sphere system from 400 to 1150 nm[J].Postharvest Biology and Technology, 2016,121:62-70.
[19]XUE JX,ZHANGSJ,SUN HX,et al.Detection of shelf life of Malus asiatica using near-infrared spectroscopy and softening index[Jl. Transactions of the Chinese SocietyforAgriculturalMachinery,2013,44(8):169-173.
[20] LIU F,HE Y,WANG L. Comparison of calibrations for thedeterminationofsolublesolidscontentandpHofrice vinegarsusing visible and short-wave near infrared spectroscopy[J].Analytica Chimica Acta,2008,610(2): 196-204.
[21]BALABIN R M,SMIRNOV S V.Variable selection in near-infrared spectroscopy:Benchmarking of feature selection methods on biodiesel data[J].Analytica Chimica Acta,2011,692(1/2) :63-72.
[22]COSTA RC,DE LIMAKMG.Prediction of parameters (soluble solid and pH) in intact plum using NIR spectroscopy and wavelength selection[J]. Journal of the Brazilian Chemical Society,2013,24(8):1351-1356.
[23] ZHANG DY,XUYF,HUANG WQ,et al.Nondestructive measurement of soluble solids content in apple using nearinfrared hyperspectral imaging coupled with wavelength selection algorithm[Jl.InfraredPhysicsamp; Technology,2019,98:297-304.
[24] ZHANG C,GUO C T,LIUF,et al. Hyperspectral imaging analysis for ripeness evaluation of strawberrywith support vector machine[Jl.Journal of Food Engineering,2016, 179:11-18.
[25]PANTT,CHYNGYZE,SUNDW,et al.Pathogenetic process monitoring and early detection of pear black spot disease caused by Alternaria alternata using hyperspectral imaging[J].Postharvest Biology and Technology, 2019,154:96-104.
[26]RICCIOLIC,PEREZ-MARIND,GARRIDO-VAROA. Optimizing spatial data reduction in hyperspectral imagingfor the prediction of quality parameters in intact oranges[J].Postharvest Biology and Technology,2021, 176:111504.