江 輝 劉良源 陳全勝
(1.江蘇大學電氣信息工程學院, 鎮江 212013; 2.江蘇大學食品與生物工程學院, 鎮江 212013)
收獲后花生在流通和儲藏過程中,容易受到霉菌的污染而發生霉變。其中,黃曲霉毒素在霉變花生中常被檢出[1]。而黃曲霉毒素B1(Aflatoxin B1, AFB1)毒性最大,是目前已知霉菌中毒性最強的。長期少量攝入該物質會引起慢性中毒,進而促使肝臟發生慢性損傷[2]。因此,AFB1被國際癌癥研究機構劃定為Ⅰ類致癌物,我國對花生及其制品中的AFB1限量指標為20 μg/kg。花生受到AFB1污染后不僅會降低花生的營養和商業價值,更重要的是影響花生及其制品的可食性和安全性[3]。因此,實現對花生AFB1的準確檢測具有現實意義。
糧食中AFB1的傳統檢測方法主要有薄層色譜法、高效液相色譜法、免疫學方法等[4]。目前,高效液相色譜法已經成為檢測糧食中AFB1的主要方法[5]。盡管該方法檢測精度高,但是其樣品檢測的前處理較為復雜且檢測時間長。此外,上述其他傳統檢測方法均屬于實驗室理化分析法,耗時費力、檢測成本高,難以滿足現代糧食中AFB1現場分析檢測的需求。因此,開發一種高效、綠色的檢測方法實現對花生AFB1的定量檢測十分必要。
嗅覺可視化技術是近年來發展迅速的無損檢測技術之一,它是一種新型嗅覺傳感器檢測方法[6]。該方法通過分析特定化學染料和待測物散發出的揮發性氣體反應前后的顏色差值來實現待測物的屬性分析[7]。近年來,該技術已經成功應用于食品和農產品品質分析領域[8-17]。在谷物霉變程度的定性識別方面也有成功應用[18-20]。但關于谷物真菌毒素的定量檢測方面相關報道甚少。此外,嗅覺可視化技術的核心是特異性強的色敏傳感器陣列的制備。但在傳感器的制備上,目前還沒有統一的理論來指導材料選型和制作流程。現有大多研究都是根據經驗或者通過嘗試來選擇化學染料制備色敏傳感器陣列。
鑒于此,本文首先利用頂空固相微萃取氣相色譜-質譜聯用技術(HS-SPEM-GC-MS)對不同霉變程度的花生樣本進行分析,然后根據分析結果選擇合適的化學染料來制備特異性色敏傳感器陣列。利用化學計量學方法挖掘傳感器圖像數據特征,構建非線性檢測模型以實現花生AFB1含量的嗅覺可視化技術定量檢測。
實驗所用花生樣本從當地大型市場購買,共10 kg。將所有花生均勻放置在兩個金屬托盤上并放入溫度28℃、相對濕度80%恒溫恒濕箱(天津宏諾儀器有限公司)中,每天取適量樣本進行理化實驗測定AFB1含量。結果發現,第5天取樣的花生樣本中檢出了AFB1,于是,此后每間隔一天從兩個托盤的不同位置取花生樣本20個,每個樣本10 g。第8天以后,花生樣本的霉變情況已肉眼可見,終止取樣。共采集了不同霉變程度的花生樣本100個。
1.2 黃曲霉毒素B1含量測定
對采集的花生樣本,按照GB 5009.22—2016中規定的第2種方法(高效液相色譜-柱前衍生法)對花生樣本中的AFB1含量進行檢測。
根據不同霉變程度花生樣本的HS-SPEM-GC-MS分析結果發現,花生在霉變過程中,醛類物質占比比較高且變化明顯,其中以己醛和壬醛為主;此外,2-正戊呋喃在花生霉變過程有增加的趨勢。因此,將己醛、壬醛和2-正戊呋喃作為花生霉變過程中產生的主要指示性特征揮發物。前期研究表明,大米、小麥等谷物劣變或霉變過程產生的揮發性物質中同樣也是醛類和呋喃類物質發生明顯變化[16,18-20],這與花生霉變過程中所產生的主要揮發性物質類似。因此,基于課題組前期研究基礎,選用同樣的化學染料(以卟啉類為主)來制備特異性強的色敏傳感器陣列,用于獲取不同霉變程度花生樣本的氣味信息。最終,色敏傳感器陣列制備所選用的化學染料分別為5,10,15,20-四苯基卟啉、四對甲氧苯基卟啉鐵、四苯基卟啉鐵、5,10,15,20-四苯基-21H,23H-卟吩銅(Ⅱ)、卟啉鈷、四苯基卟啉鋅、四苯基卟啉、2,3,7,8,12,13,17,18-八乙基-21H,23H-卟吩銅(Ⅱ)、八乙基卟吩、四苯基卟吩氧化釩、5,10,15,20-四苯基-21H,23H-卟吩羰基釕(Ⅱ)和2,3,7,8,12,13,17,18-辛乙基-21H,23H-卟吩釕(Ⅱ)羰基。
以聚偏二氟乙烯膜(Polyvinylidene fluoride, PVDF)(密理博公司,美國)作為基底來制備比色傳感器陣列,具體制備流程如下:① 將PVDF裁剪成4 cm×3 cm的長方形基底材料備用。② 將12種色敏材料各稱取8 mg分別溶于4 mL的二氯甲烷中,超聲10 min后即可得到2 mg/mL的溶液置于陰涼黑暗處備用。③ 用100 mm×0.3 mm的毛細管吸取1 μL溶液并利用陣列模板輔助點樣于疏水的PVDF上。靜置后即可得到色敏傳感器陣列。
利用平板掃描儀獲取色敏傳感器原始圖像數據。然后,取8 g經多功能粉碎機(德清拜杰電器有限公司)粉碎的花生樣本粉末置于直徑60 mm的培養皿中,色敏傳感器利用雙面膠固定在保鮮膜上(正面朝上),并用該保鮮膜將培養皿密封后靜置反應16 min后取出。最后,利用平板掃描儀獲取色敏傳感器反應后的圖像數據。
利用Matlab軟件對得到的色敏傳感器陣列的原始圖像和反應后的圖像分別進行中值濾波、閾值分割,再分別提取各色敏點周圍12個像素半徑內的R、G、B分量的灰度均值,并標準化到0~255之間。然后,利用反應后傳感器陣列上各色敏點的顏色數值減去原始傳感器陣列上各對應色敏點的顏色數值,這樣,就可獲取各對應色敏點的3個顏色差值分量ΔR、ΔG、ΔB。最后,對獲得的ΔR、ΔG、ΔB進行歸一化,疊加灰度圖像生成色敏傳感器特征圖像。在本文中,每個色敏傳感器陣列有12個色敏點,每個色敏點可以得到3個顏色特征分量。因此,每個花生樣本的色敏傳感器特征值有36個顏色分量。
反向傳播神經網絡(Back-propagation neural networks, BPNN)是一種按誤差逆傳播算法訓練的多層前饋網絡,是目前應用最廣泛的神經網絡模型之一[21]。BPNN網絡的主要特點是信號前向傳遞,誤差反向傳播,通過迭代優化網絡的權值,使BPNN預測輸出與期望輸出盡可能一致。BPNN的學習過程是一個權值不斷修正的過程,過程不斷重復直到達到設定的學習次數或者輸出誤差達到預設值。本文BPNN作為回歸器被用于遺傳算法(Genetic algorithm, GA)優化色敏傳感器陣列特征顏色分量。BPNN的參數設置如下:隱含層神經元節點數設為10,學習率為0.1,動量因子為0.95,初始權值為0.3,最小均方根誤差為0.001,最大訓練次數為100。
GA是一類借鑒生物界的進化規律演化形成的隨機化搜索方法[22-23]。本文利用GA對色敏傳感器陣列特征顏色分量組合進行優化。考慮到GA的隨機性,將GA獨立運行50次,并對50次獨立運行結果進行統計分析,以消除隨機性對優化結果的影響。GA參數設置如下:種群大小設置為20,交叉概率和變異概率分別設置為0.7和0.1,最大迭代次數設為100。
將GA嵌入到BPNN中用于優化傳感器的最佳特征顏色分量組合。在此過程中,每次GA迭代后得到的顏色分量組合分別作為BPNN的輸入,花生AFB1含量作為BPNN的輸出。100次迭代結束后,根據各GA-BPNN模型對花生AFB1含量(質量比)的預測值與參考值之間的平均誤差加權和最小原則來確定最佳顏色分量組合。GA的目標函數Y定義為
(1)
式中Nt——訓練集樣本數目
ei——訓練集中第i個樣本的AFB1含量與BPNN模型中預測值之間的差值
Np——預測集樣本數目
ej——預測集中第j個樣本的AFB1含量與BPNN模型中預測值之間的差值
支持向量回歸(Support vector regression, SVR)是屬于支持向量機(Support vector machine, SVM)的一種推廣,專門用于處理回歸分析問題[24]。SVR的主要思想是引入核函數將樣本空間中非線性回歸映射為高維空間中的線性回歸問題,即尋找一個最優分類超平面,使得所有訓練樣本離該最優超平面的誤差最小。回歸的目的是得到一個能夠盡量擬合訓練集樣本的模型,通常用的方法是構建一個樣本標簽與模型預測值的損失函數,使損失函數最小化,從而確定模型[25]。本文將徑向基函數(Radial basis function, RBF)作為核函數。
網格搜索(Grid search, GS)是最簡單、應用最廣泛的超參數搜索算法,它是指定參數值的一種窮舉搜索方法,該方法是將估計函數參數通過交叉驗證的方法進行優化以達到最優的學習算法[26]。麻雀搜索算法(Sparrow search algorithm, SSA)是2020年提出的一種新型群智能優化算法,SSA主要是受麻雀的覓食行為和反捕食行為的啟發[27],具有尋優能力強、收斂速度快、穩定性好、魯棒性強等特點[28]。利用GS和SSA優化的SVR的懲罰參數C和核參數g以獲取最佳性能的SVR模型,并對模型結果進行比較。在利用GS優化SVR參數C和g時,它們的取值范圍為[2-10, 2-9.5, …, 29.5, 210]。在利用SSA優化SVR參數C和g時,C的取值范圍設置為0.001~100,g取值范圍設置為 0.001~1 000,種群數量為20,最大迭代次數為100。
將訓練集和預測集的樣本劃分成兩部分。第1部分用于色敏傳感器特征組合的優化。為了消除各種隨機結果對優化結果的影響,對GA-BPNN算法獨立運行了50次。在優化過程中,采用隨機抽樣,將訓練集和預測集樣本按照3∶1的比例進行劃分。這樣,訓練集有75個樣本,預測集有25個樣本。第2部分用于SVR檢測模型的構建。為了使模型獲得更好的泛化性能,將所有樣本根據AFB1含量從小到大排列,然后依次將每4個樣本中間的任意一個放入預測集,另外3個放入訓練集。這就可以保證訓練集的樣本特征包含預測集的樣本特征。同樣,訓練集中有75個樣本,預測集中有25個樣本。表1為SVR構建時的樣本劃分情況。從表1可以看出,訓練集和預測集中花生樣本的AFB1含量平均值和標準差沒有明顯差異。

表1 訓練集和預測集中AFB1含量統計結果Tab.1 Statistical distribution of AFB1 values in training set and prediction set μg/kg
圖1為預處理后的不同AFB1含量花生樣本的色敏傳感器陣列特征圖像。從圖1可以看出,不同AFB1含量花生樣本的傳感器特征圖像是有明顯差異的。因此可以推斷出,花生在霉變過程中產生的揮發性物質成分發生了顯著變化,指示性揮發性物質的含量也在不同階段發生了特定變化,而這些變化可以被色敏傳感器陣列捕獲,并以不同的顏色灰度呈現出來。從圖1中還可以觀察到,有些顏色變化較大的色敏點肉眼就能清晰可辨,這說明所制備的色敏傳感器陣列能夠有效地反映不同霉變花生樣本氣味信息的變化情況。但是,也有一些色敏點顏色飽和度之間的差異較小,這可能是鄰近霉變階段揮發性物質變化較小導致了顏色反應沒那么明顯。這也間接地表明了不同色敏點之間的特征數據存在一定的信息冗余。因此,在SVR檢測模型構建前,有必要對色敏傳感器的特征顏色分量組合進行優化。

圖1 不同霉變程度花生樣本的差值圖像Fig.1 Difference images of peanut colorimetric sensor with different mildew degrees

圖2 50次獨立運行GA-BPNN算法后每個顏色分量 被選擇的累積頻次Fig.2 Cumulative frequency of each color component selected after GA-BPNN algorithm ran independently for 50 times
圖2為GA-BPNN獨立運行50次后各個顏色分量被選中的累積頻次。從圖2可以看出,所有顏色分量都有被選中,且被選中最低頻次的顏色分量都達到了10次。這間接說明了GA-BPNN在每一次的變量優選過程中保留了比較多的變量,這可能與GA優化準則有一定的關系。從圖2還可以看出,有多個顏色分量被選中的頻次比較高,尤其是第12、23、28個這3個顏色分量,它們的累積次數均超過了40次,這說明了在每次變量優化過程中,這3個顏色分量幾乎都被選到,這表明這3個顏色分量可能有效反映了霉變花生中AFB1含量的變化。而有些顏色分量所選次數較低,比如第6個和第26個等,這表明這些顏色分量與霉變花生AFB1含量之間的相關性較小。從圖2進一步分析可以發現,有13個顏色分量被選的次數超過30次,有7個顏色分量所選頻次超過35次,依次為第3、12、19、23、25、28、32個顏色分量。在7個顏色分量中,有3個分量累積頻次超過40次,依次為第12、23、28個顏色分量。因此,基于上述分析結果,將基于13、7、3個顏色分量的3種組合分別作為輸入特征來構建SVR模型,并比較不同SVR模型的預測性能。
表2為基于不同顏色分量組合分別建立的SVR模型結果。從表2可以看出,在GS-SVR模型中,模式2模型獲得了最佳的預測性能。盡管模式3下選用的顏色分量個數最少,但是建立的GS-SVR模型性能低于模式1和模式2兩種模式下得到的GS-SVR模型性能。這說明建模選用的特征變量過少在一定程度上不能很好地保留原始數據的內在特征,從而影響模型的預測性能。
從表2進一步分析可以看出,相較于GS-SVR模型,SSA-SVR模型整體上獲得了更好的預測效果。這可能是因為網格搜索法一般會先使用較廣的搜索范圍和較大的步長,然后會逐漸縮小搜索范圍和步長,來尋找更精確的最優值。這種操作方案可以降低所需的時間和計算量,但由于目標函數一般是非凸的,所以很可能會錯過全局最優值。而SSA具有高性能的搜索能力,使得其能夠很好地搜索全局最優的潛在區域,并且可以有效地避免陷入局部最優的問題。因此,該模型整體性能優于GS-SVR模型。

表2 基于不同顏色分量組合建立的SVR模型結果Tab.2 Results of different SVR models based on different combinations of color components
對于SSA-SVR模型,從表2可以看出,同樣是模式2下得到的SSA-SVR模型性能最佳,模式3下建立的SSA-SVR模型性能低于模式1和模式2兩種模式下建立的SSA-SVR模型性能,這與不同模式下GS-SVR模型的性能結果一致。由此可見,盡管利用更少的特征變量來建模可簡化模型結構,但所得到SVR模型的預測性能在一定程度上有所削弱。綜合考慮模型的性能和復雜度,認為模式2下得到的最佳SSA-SVR模型為最優模型。圖3 為最佳SSA-SVR模型在訓練集和預測集中的預測值和實測值之間的散點圖,其RP為0.914 2、預測均方根誤差為5.683 2 μg/kg、剩余預測偏差為2.392 6。

圖3 SSA-SVR模型預測值與測量值的關系Fig.3 Interrelationship between measured and predicted values in SSA-SVR model
針對花生霉變過程中指示性特征揮發性物質制備了特異性強的色敏傳感器陣列,實現了霉變花生AFB1的定量檢測。通過引入GA-BPNN算法對色敏傳感器的顏色分量進行優化,建立了基于不同優化特征組合的SVR模型,并比較了GS和SSA兩種優化算法對SVR參數優化的效果。結果發現,SSA-SVR模型性能整體上優于GS-SVR模型性能,且基于7個特征顏色分量組合的SSA-SVR模型得到了最佳預測結果,其RP為0.914 2,預測均方根誤差為5.683 2 μg/kg,剩余預測偏差達到2.392 6。結果表明,利用嗅覺可視化技術結合適當的化學計量學方法實現花生中AFB1含量的定量檢測是可行的,研究結果可為儲藏期花生等谷物中真菌毒素的定量、現場檢測提供一種新的技術方法參考。