999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于特征選擇與特征提取融合的雞蛋新鮮度光譜快速檢測模型優化

2020-07-04 10:58:40段宇飛王巧華
食品科學 2020年12期
關鍵詞:特征提取檢測模型

段宇飛,王巧華

(1.湖北工業大學農機工程研究設計院,湖北 武漢 430068;2.華中農業大學工學院,湖北 武漢 430070;3.國家蛋品加工技術研發分中心,湖北 武漢 430070)

雞蛋新鮮度為雞蛋運輸、加工以及銷售等環節中所需要考察的重要指標[1]。隨著雞蛋新鮮度越來越受重視,新鮮度檢測水平亟待提高,其中優化新鮮度檢測模型、提高檢測效率至關重要。

近年來,國內外學者運用光譜分析[2-3]、介電特性[4-5]、電子鼻[6-7]、機器視覺[8-11]等檢測技術對雞蛋新鮮度無損檢測進行了相關理論研究。其中光譜分析技術因其具有采樣速度快、操作方便等特點一直都是雞蛋新鮮度常用且有效的檢測手段,通過采集雞蛋光譜數據結合數學運算處理方法獲取新鮮度信息。為了提高雞蛋新鮮度光譜分析速率,減少光譜噪聲信息的影響,通過對光譜數據進行相關處理以優化模型,例如楊曉玉等[12]獲取400~1 000 nm波長范圍雞蛋高光譜信息,運用遺傳偏最小二乘法對光譜數據進行特征選擇,建立的最小二乘支持向量機預測模型相關系數為83.2%,研究表明高光譜技術可以應用于雞蛋新鮮度檢測。王巧華等[13]分別利用無信息變量消除法和多模式共識法進行雞蛋光譜波長特征選擇,通過比較發現,多模式共識選擇出的39 個特征點結合偏最小二乘判別分析法建立雞蛋新鮮度預測模型效果更佳,識別準確率為91.23%。Lin Hao等[14]嘗試獨立成分分析和主成分分析對雞蛋近紅外光譜進行特征提取,并結合遺傳算法的人工神經網絡分別建立雞蛋新鮮度回歸預測模型,得出通過獨立成分分析提取特征后光譜數據所建立的模型性能最佳,預測集的相關系數達到87.9%。Saman等[15]采集400~1 100 nm雞蛋透射光譜,分別使用主成分分析特征提取和遺傳算法特征選擇兩種方法處理光譜數據,分析結果表明遺傳算法選擇的特征波長結合人工神經網絡建立模型得到的雞蛋新鮮度識別率優于其他方法。

通過上述研究表明,特征選擇和特征提取方法常用于光譜數據分析[16-20],不僅降低了光譜運算數據量提高雞蛋新鮮度檢測速率,而且盡可能消除無用干擾信息以取得較好的預測效果。雖然特征選擇或者特征提取在一定程度上降低了數據運算量、提高了檢測效率,但是使用中仍可能出現以下問題,一方面特征提取是將光譜數據從高維度空間通過運算映射到一個低維度空間中,再利用低維數據進行建模,其光譜數據參與運算的數量本質并沒有減少;另一方面特征選擇法獲得的波長個數可能出現較多的情況。因此,針對上述問題,本研究結合特征選擇和特征提取方法的優勢,將兩者進行有機融合,首先運用競爭性自適應重加權(competitive adaptive reweighted sampling,CARS)算法特征選擇獲取一階微分處理后雞蛋光譜的特征波長,然后利用非線性特征提取方法中的局部切空間排列(local tangent space alignment,LTSA)算法對特征波長進行有效信息再提取,結合支持向量回歸(support vector regression,SVR)建立雞蛋新鮮度定量預測模型,以期達到良好的檢測效果,方法融合后進一步提升雞蛋新鮮度光譜檢測效率,提高預測精度,優化檢測模型。

1 材料與方法

1.1 材料與儀器

隨機挑選蛋殼完好的1 日齡新鮮雞蛋220 枚,將表面擦拭干凈后共同放置于溫度25 ℃、相對濕度70%的恒溫恒濕培養箱中。

USB2000+微型光纖光譜儀(LS-3000系列高功率鹵素燈) 美國Ocean Optics公司。

1.2 方法

1.2.1 雞蛋光譜數據采集

為了獲得不同新鮮程度的雞蛋樣本,每3 d從恒溫恒濕箱中隨機選取30 枚雞蛋,使用采集裝置(圖1)獲取每個雞蛋的透射光譜數據。

圖1 雞蛋透射光譜采集系統Fig. 1 Schematic representation of the acquisition system of transmittance spectra for eggs

采集軟件設置積分時間50 ms、平滑寬度5、平均次數3、光譜采集范圍550~950 nm,獲取的雞蛋樣本原始透射光譜如圖2所示。

圖2 雞蛋樣本透射率光譜曲線Fig. 2 Transmittance spectra of egg samples

1.2.2 雞蛋新鮮度測定

每當采集完光譜,使用電子秤對雞蛋稱質量,然后破殼并水平放置于托盤中,將蛋白高度測定儀校正,測量離蛋黃1 cm左右3 處不同位置的蛋白高度取平均值,根據雞蛋質量和蛋白高度計算出哈夫單位值,以其表征雞蛋新鮮度。

1.2.3 樣本集劃分

表1 樣本集哈夫單位相關參數值Table 1 Haugh unit values of training and prediction sets

隨著貯藏時間的延長,雞蛋蛋白在實驗后期稀化嚴重,導致部分雞蛋的濃蛋白含量極低甚至少量雞蛋出現散黃現象,無法準確測量其哈夫單位值,因此本實驗共獲取了211 個有效的雞蛋樣本數據,利用光譜-理化值共生距離SPXY算法按照3∶1比例劃分為訓練集和預測集樣本。從表1可以看出,訓練集和預測集兩者的哈夫單位平均值以及標準差相對比較接近,說明實驗樣本集劃分合理,適用于模型建立與檢驗。

1.2.4 LTSA算法

LTSA是流形學習方法中的一種非線性特征提取方法,其基本思想是通過將數據鄰近點轉化到切空間坐標表示流形局部幾何空間結構,再由局部切空間映射尋求低維嵌入坐標[21-24]。

設雞蛋光譜篩選特征變量后所構成的樣本數據集X=[x1,x2,x3,…,xN],xm∈RC,d為變換矩陣映射后的光譜數據維數,其中d<C,其算法的實現計算過程如下:

1)針對每個雞蛋光譜樣本點xm,通過K鄰近算法獲取包含自身的雞蛋光譜樣本點鄰域,每個光譜樣本點構建一個鄰域矩陣XNm=[xm1,xm2,xm3,…,xmn],其中n=1,2,3,…,k(k為近鄰點數)。

2)求解每個雞蛋樣本點xm所在d維切空間的非零正交向量組Am以及鄰域矩陣中xmn點切空間中的正交投影矩為k鄰域平均值,Am選擇XNm-

矩陣中前d個最大左奇異向量,得到XNm局部坐標矩陣為

3)通過仿射變換將p個局部坐標轉化到全局坐標[φm1,φm2,φm3,…,φmk],計算全局空間重構誤差最小值獲取低維坐標,得到雞蛋光譜的低維空間數據。

2 結果與分析

通常在光譜采集過程中,環境、人為等因素的影響導致光譜數據存在大量隨機噪聲信息,不利于預測模型準確性的提高,光譜預處理對于建立穩定可靠模型必不可少[25]。前期研究中已經比較了不同光譜預處理數據建立的預測模型效果,確定了一階微分是雞蛋新鮮度光譜檢測相對較優的預處理方式,有利于消除基線漂移對雞蛋光譜數據的影響[26],因此以下研究中的雞蛋光譜處理與分析均基于一階微分處理后的光譜數據。

2.1 CARS特征選擇與建模分析

由于全光譜中存在的部分無效干擾信息降低了定量模型預測精度,同時數據量較多也增加了模型復雜度和運算時間,通過特征選擇方法能夠有效獲取光譜特征波長,提升模型檢測效率[27]。

CARS是一種以進化論“適者生存”為依據的特征變量篩選方法,結合衰減函數和自適應加權采樣對變量進行逐步保留與剔除,最終找出交叉驗證均方根誤差(root mean square error of cross validation,RMSECV)最小的光譜數據子集作為最優變量組合[28-30]。本研究利用CARS算法對訓練集中的雞蛋光譜數據進行波長優選,其中蒙特卡洛采樣次數設置為50,CARS算法選擇特征波長的運算過程見圖3。

表2 CARS選取的特征波長組合Table 2 Combinations of characteristic wavelengths selected by CARS

圖3 CARS特征波長選擇過程Fig. 3 Selection of characteristic wavelengths by CARS

由圖3a可知,伴隨著采樣次數的增加,參與運算的變量個數逐步減少,在采樣初期變量個數迅速遞減;由圖3b可以得出,由于每次采樣時光譜數據子集合發生變化,因此RMSECV會得到不同的結果,并呈現先下降后上升的變化趨勢,誤差值先下降說明采樣初期剔除了一些無用的光譜信息從而提高了模型精度,誤差值隨后上升說明隨著采樣次數的增加,變量個數逐步減少導致部分有效的光譜波長被消除,降低了模型精度;由圖3c所示,當采樣運行次數為21 次時,RMSECV達到最小值,說明此時采樣所得到的光譜數據子集合為最優波長組合,共選取了45 個光譜波長變量,表2為通過CARS算法最終選取的具體特征波長點分布。

利用SVR對CARS算法選取的特征波長變量建立雞蛋新鮮度定量模型,其中SVR的核函數采用徑向基函數,懲罰因子和核參數通過十折交叉驗證尋優。模型得到訓練集交叉驗證相關系數(Rcv)為0.880 5,RMSECV為8.59,預測集相關系數(Rp)為0.888 9,預測集均方根誤差(root mean square error of prediction,RMSEP)為8.42,其模型預測效果如圖4所示。

圖4 基于特征波長建立的SVR模型預測效果Fig. 4 Prediction performance of SVR model based on characteristic wavelengths

如表3所示,通過SVR結合特征選擇后的光譜數據建立雞蛋新鮮度定量模型結果相比于波長特征選擇前全光譜建模得到的RMSECV值減少了1.09,表明CARS特征選擇算法有效地篩選了雞蛋光譜變量,提高了模型精度,同時光譜數據量減少了355 個,簡化了檢測模型,每個雞蛋樣本平均檢測時間為0.053 s。

表3 CARS特征選擇前后的模型預測效果Table 3 Model prediction results before and after characteristic wavelength selection by CARS

雖然與全光譜相比數據量大幅減少,很大程度上提高了光譜檢測效率和精度,但是可以看出變量個數仍然相對較多,進一步提取有效光譜特征,減少參模數據量對于優化模型、提升檢測效率有利。

2.2 融合LTSA特征提取與建模分析

利用特征提取法對特征選擇獲取的波長變量進行再次提取,分析二者融合算法得到的雞蛋新鮮度檢測模型效果。

在LTSA對雞蛋光譜數據進行特征提取中,低維空間目標維數d和近鄰點數k是需要調節的兩個重要參數,不同參數對于提取結果以及模型精度會產生不同影響。為了得到最佳的參數組合,利用網格遍歷法對一定范圍內的參數進行逐個選取,通過SVR對不同參數組合特征提取后數據建模得到的RMSECV評價參數優劣。考慮k過小會導致構建的鄰域圖不連通,無法準確獲取低維嵌入坐標[31],因此d選取1~35,k選取45~100,d和k的步長都設置為1,對兩個參數的所有取值進行組合形成“網格”,結合不同參數組合進行LTSA特征提取,并分別建立比較特征提取后的多個檢測模型,其結果顯示,當d=31、k=88時,模型得到的RMSECV達到最小值。

通過選取d 29~32為例說明LTSA算法中k值對提取特征的影響,從圖5A觀察固定d時結合不同k值的結果,發現RMSECV值均變化平穩,說明k值選取的約束較小,確定d后k值對模型的影響不大;選取k 86~89為例說明LTSA算法中d值對提取特征的影響,從圖5B觀察固定k時結合不同d值的結果,發現RMSECV隨d值變化較大,得出在d較小時,RMSECV值較大,且大于特征提取前得到的模型誤差值,說明在提取維數較低時,部分有用信息被弱化導致模型精度差;隨著d值的增加,由于有用特征信息被有效提取出來,RMSECV值逐步變小,模型精度隨之提高,在d為31時RMSECV值達到最低;繼續增加提取維數,RMSECV值開始增大,表明提取的過大維數中存在干擾不利信息導致模型精度反而降低。

圖5 LTSA中d(A)和k(B)變化的影響Fig. 5 Effects of number of dimensions d (A) and nearest neighbors k (B)in LTSA on RMSECV

本實驗選取RMSECV最小時的d和k值作為LTSA算法最優參數,結合特征提取的光譜數據建立SVR新鮮度定量模型得到Rcv=0.896 0,RMSECV=8.04,Rp=0.898 3,RMSEP=8.18,其模型預測效果如圖6所示。將CARSSVR模型與CARS-LTSA-SVR模型分析比較,后者相比前者RMSECV值減少了0.55,RMSEP值減少了0.24,Rcv和Rp均有所提升,參模維數減少了14 個,可知CARSLTSA-SVR模型預測效果更好,每個雞蛋樣本平均檢測時間為0.032 s,模型運行時間更短,表明單一使用CARS特征選擇的波長中可能還是存在部分冗余信息,融合LTSA特征提取算法能夠進一步消除不利影響,不僅減少了模型復雜度,而且提高了模型運行效率,增強了模型穩定性與適用性。

圖6 基于CARS-LTSA光譜處理建立的SVR模型預測效果Fig. 6 Prediction performance of SVR model based on CARS-LTSA processing

3 結 論

本實驗將CARS算法特征選擇與LTSA算法特征提取相結合共同用于雞蛋光譜數據的處理加工中,再利用SVR建立雞蛋新鮮度(哈夫單位值)定量模型,獲得以下結論:1)采用CARS特征選擇對一階微分預處理后的雞蛋光譜進行特征變量選擇,使光譜維數相比于特征選擇前的預處理數據減少了355 個,RMSECV值相比于變量提取前的模型減少了1.09,表明CARS特征選擇在一定程度上有效地消除了無用信息的影響;2)利用LTSA對CARS選擇的特征波長數據進行特征再提取,與僅使用CARS算法處理后建模相比,光譜維數繼續減少14 個,模型精度再次提高,表明LTSA特征提取法能夠進一步在CARS特征選擇的數據中獲取有效信息,減少了冗余,簡化了模型,其模型精度及速率均高于先前的研究[26];3)CARS-LTSA融合算法共同處理雞蛋可見-近紅外光譜數據有效,所建立SVR定量模型用于雞蛋新鮮度光譜快速無損檢測可行,表明將特征選擇與特征提取方法綜合利用,在光譜數據分析處理中盡可能地減少光譜數據量、增強模型穩定性以及提高光譜檢測效率具有一定的優勢,可為光譜檢測模型的優化提供一定的參考依據。

猜你喜歡
特征提取檢測模型
一半模型
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
一種基于LBP 特征提取和稀疏表示的肝病識別算法
3D打印中的模型分割與打包
小波變換在PCB缺陷檢測中的應用
主站蜘蛛池模板: 亚洲精品午夜无码电影网| 伊人精品视频免费在线| 日本尹人综合香蕉在线观看| 精品国产91爱| 欧美午夜小视频| 免费一级毛片| 美女被操黄色视频网站| 黄色一及毛片| 996免费视频国产在线播放| 中文字幕中文字字幕码一二区| 日韩欧美中文亚洲高清在线| 亚洲日本在线免费观看| 无码区日韩专区免费系列 | 中文字幕日韩视频欧美一区| 国产日韩精品一区在线不卡| 国产SUV精品一区二区| 亚洲综合网在线观看| 免费毛片视频| 91亚洲视频下载| 波多野结衣亚洲一区| 国产一区成人| 亚洲Av激情网五月天| 欧美区一区| 韩国v欧美v亚洲v日本v| 一区二区午夜| 中文字幕色站| 欧美不卡二区| 久久这里只有精品8| 99热国产在线精品99| 99久视频| 77777亚洲午夜久久多人| 亚洲日韩高清在线亚洲专区| 成人午夜久久| 亚洲精品亚洲人成在线| 欧美性久久久久| 日韩精品一区二区三区免费在线观看| 国产91全国探花系列在线播放| 色婷婷国产精品视频| 精品超清无码视频在线观看| 欧美精品1区2区| 99精品在线视频观看| 日韩AV手机在线观看蜜芽| 国产精品无码制服丝袜| 99久久精品免费看国产电影| 一本无码在线观看| 视频二区欧美| 四虎免费视频网站| 99热国产这里只有精品无卡顿"| 国产女人18水真多毛片18精品| 亚洲一区第一页| 五月天综合婷婷| 国产女人水多毛片18| 漂亮人妻被中出中文字幕久久| 日韩在线成年视频人网站观看| 毛片a级毛片免费观看免下载| 华人在线亚洲欧美精品| 国产亚洲精品97在线观看| 看看一级毛片| 国产成人精品一区二区| 国产精品欧美亚洲韩国日本不卡| 97免费在线观看视频| 日韩福利视频导航| 国产一级裸网站| 3p叠罗汉国产精品久久| 午夜精品国产自在| 成人伊人色一区二区三区| 青青网在线国产| 日本一本在线视频| 色妞永久免费视频| 狼友视频一区二区三区| 又黄又湿又爽的视频| 欧美亚洲国产精品久久蜜芽| 亚洲成人黄色在线| 国产主播喷水| 国产成人亚洲无吗淙合青草| 国产精品99r8在线观看| 欧美天天干| 亚洲无限乱码| 亚洲高清在线播放| 天堂在线视频精品| 日韩在线播放欧美字幕| 婷婷色婷婷|