倪 金,索麗敏,劉海龍
(黑龍江八一農墾大學 信息與電氣工程學院,黑龍江大慶 163319)
大米是我國主要的糧食作物之一[1]。隨著社會經濟的發展,大米的質量問題逐漸引起了人們的關注。其中,大米的陳化和摻假是一個突出的問題。傳統的大米鑒別方法主要依賴于人工經驗和化學分析技術,普遍存在分析周期長、操作復雜、成本高等問題[2-3]。因此,需繼續探索更加準確、快速、穩定的大米鑒別方法[4]。
本文在基于近紅外光譜數據的基礎上采用北方蒼鷹優化算法(Northern Goshawk Optimization,NGO)對核極限學習機(Kernel Extreme Learning Machine,KELM)的兩個重要參數進行尋優并建立模型[5-6]。提出一種新的大米定性鑒別和摻假定量分析方法。通過驗證,該方法在陳化大米的鑒別和摻假定量分析中取得了很好的效果,對于解決陳化大米鑒別和摻假問題具有重要的實際意義。
實驗樣品為2017年和2022年水稻成熟后,于黑龍江省建三江市七星農場采用五點式隨機采樣法獲取的五優稻4號,將其脫粒碾磨至精白米后作為研究樣品。其中新大米樣品為2022年收獲大米,摻假大米樣品為將2017年收獲的大米按照不同比例(25%、50%、75%)摻入2022年收獲的大米中,陳化大米樣品為2017年收獲大米。采用高精度電子秤(武義銀利電子有限公司)取(5±0.02)g作為一份樣品,共計新大米30份樣品、摻假大米90份樣品、陳化大米30份樣品。
TANGO近紅外光譜儀,德國布魯克(北京)科技有限公司。
1.3.1 光譜預處理
對原始光譜數據進行標準正態變量變換(Standard Normal Variate,SNV)預處理,用于消除顆粒不均等原因產生的噪聲信息,原理為樣品光譜數據各波數點的吸光度符合一定分布,計算時將每個樣品的原始光譜減去理想光譜,再除以標準差[7-8]。SNV公式為
1.3.2 模型的建立
極限學習機(Extreme Learning Machine,ELM)是提出的一種機器學習模型[9],由于其可以自動生成輸入層和隱含層之間的權重和偏差值,省去了參數的設定和迭代試錯,具有操作簡單、建模速度快等優點。為進一步提高ELM的性能,在其基礎上將核函數加入建模過程,構成核極限學習機(KELM),其原理是利用核函數代替ELM中隱含層的特征映射,達到將數據升維的目的,大幅提高了模型的計算精度與泛化能力,并且該模型在面對分類任務和回歸任務時都能表現出較好的效果。但KELM對建模中的核函數γ與正則化參數C過分依賴,二者的取值對預測結果有決定性作用。目前γ與C值的設定多采用人工調參選取,嚴重降低了建模時的快速性和穩定性。為解決這一問題,該文引入北方蒼鷹優化算法(NGO)對以上兩個參數進行尋優。NGO是一種模擬的北方蒼鷹捕獵行為的群體智能優化算法,其思想是在輸入模式與目標模式之間顯式地建立一個映射關系,通過不斷迭代尋得最優的建模參數。該算法在彌補了原有不足的同時也提高了預測準確率和置信度。
1.3.3 基于NGO-KELM的陳化大米定性鑒別方法
分別建立KELM分類模型和NGO優化后的KELM分類模型。將新鮮大米30份、摻假大米90份以及陳化大米30份共計150份樣本數據隨機按照7∶3的比例分為訓練集(105份)和測試集(45份)。采用訓練集和測試集的預測準確度和F1值作為模型的性能評價指標,并繪制混淆矩陣。
1.3.4 基于NGO-KELM的陳化大米摻假定量分析方法
基于上文定性分析,分別建立KELM回歸模型與NGO優化后的KELM回歸模型,對摻假樣品進行摻假量的定性分析,探討KELM模型和NGOKELM模型對新鮮大米中摻雜陳化大米量的預測能力。將新鮮大米30份(摻假量0%)、摻假大米90份(摻假量25%、50%、75%)、陳化大米30份(摻假量100%)共計150份樣本按照7∶3的比例隨機分為訓練集(105份)和測試集(45份)。對于定量預測模型采用決定系數R2和RMSE作為性能評價指標,并繪制柱狀圖來反映預測結果。
分別建立KELM模型和NGO-KELM模型,對比二者準確度和F1值并繪制混淆矩陣從而確定模型的性能,實驗結果見表1。NGO-KELM模型的訓練集和測試集準確度與F1值均高于未優化的KELM模型(NGO-KELM測試集的混淆矩陣見圖1),其測試集準確度提高約5%,說明NGO能有效提高KELM模型的分類準確度。

圖1 NGO-KELM模型在測試集上的混淆矩陣

表1 各模型結果對比
分別建立KELM模型和NGO-KELM模型進行實驗發現,利用NGO優化的KELM模型的定量預測表現也有顯著的提升,結果見圖2。

圖2 各模型定量預測結果對比
NGO-KELM模型測試集決定系數R2和RMSE分別提升了0.054 1和0.023 3,得到了較理想的摻假率檢測精度,見表2,該方法顯著優于傳統方法。

表2 各模型定量預測結果
基于NGO-KELM實現了陳化大米的定性鑒別和摻假定量分析。通過近紅外光譜設備采集標準樣品的信息,并采用NGO優化算法對KELM模型進行了優化。建立的模型具有較高的準確度和穩定性,可以有效鑒別陳化大米,同時能對其摻假進行定量分析,為陳化大米的定性鑒別和摻假定量分析提供了一種新的分析方法。