劉翠玲, 董秀麗, 孫曉榮, 吳靜珠, 吳勝男
(北京工商大學計算機與信息工程學院,北京 100048)
基于BP神經網絡檢測面粉中滑石粉含量的研究
劉翠玲, 董秀麗, 孫曉榮, 吳靜珠, 吳勝男
(北京工商大學計算機與信息工程學院,北京 100048)
利用近紅外光譜技術對摻雜滑石粉的小麥面粉進行了檢測,采用多元散射校正對譜圖進行預處理,利用BP神經網絡中的SCG反向傳播算法訓練函數建立了面粉中滑石粉的定量分析模型,并對校正集和預測集進行了定量分析,分析結果為R2=0.997 3,RMSEC=0.436 7,RMSEP=1.708 8.結果表明,BP神經網絡結合近紅外光譜技術檢測面粉中滑石粉含量具有快速、精度高、泛華能力強的優點,可用于面粉中滑石粉含量的快速準確檢測.
BP神經網絡;近紅外光譜;滑石粉;小麥面粉
面粉中摻雜滑石粉是食品安全問題中亟待解決的重要環節,研究者們針對此問題做了大量工作,目前有多種方法用于檢測面粉中滑石粉的含量,但是這些方法有的不夠精確,有的過程復雜耗時較長.根據實地調查,常用的檢測方法仍以傳統的物理-化學方法為主,尚無統一的更加快捷檢測面粉中滑石粉含量的方法和標準.針對此研究課題,本文使用BP神經網絡結合近紅外光譜技術,旨在研究面粉中滑石粉快速定量檢測的可行性[1].
小麥面粉及面制品是人們尤其是北方居民的主食,其質量的好壞對人們的身體健康有重要的影響,國標法對小麥粉面粉的檢測做了詳細的規定[2].國家對小麥面粉的添加劑種類做了明確的規定,然而,在暴利的驅動下,部分不法廠家向小麥面粉中添加大量的滑石粉,有些廠家甚至在25 kg面粉中添加多達3~4 kg的滑石粉.因此,對面粉中滑石粉的檢測急需找到一種快速簡便的方法,以保證廣大人民的身體健康[3].
滑石粉的主要成分是天然的水合硅酸鎂(Mg3[Si4O10](OH)2),為白色或類白色、微細、無砂性的粉末,手摸有滑膩感,無色無味,不溶于水、稀礦酸或稀氫氧化堿溶液,可作藥用.滑石粉中常含有對人體有害的重金屬,長期服用含有滑石粉的小麥面粉會增加肝臟的負擔,甚至會危及人的生命[4].
目前,國標法 GB/T21913—2008[5]對食品中滑石粉的檢測主要采用化學法測定鎂和二氧化硅的含量,間接換算成滑石粉的量,操作繁瑣且耗時較長,而且檢測成本較高.其他方法[6]等存在對樣品前處理試劑消耗量大的缺點,X 射線衍射分析法[7,8-12]需用有機試劑分離面粉或將面粉灰化后再進行檢驗,處理時間長且X射線對人體有輻射,不利于長時間工作.
與化學計量學方法結合使近紅外光譜技術得到廣泛的關注.近紅外光譜技術使用化學計量學方法建立可靠的校正模型,具有分析速度快、效率高、成本低等優點,可直接實現對樣品進行無損檢測,近年來在農業、食品、藥品、煙草等領域有著廣泛應用.
本文應用近紅外漫反射光譜法結合BP神經網絡建立面粉中滑石粉含量的定量分析模型,并用所建模型對預測集樣品進行預測,得到較好的結果,該方法有望成為一種代替現行面粉中滑石粉含量測定的快速綠色分析方法.
BP(back propagation)神經網絡是多層前饋網絡,采用誤差反向傳播的學習過程,輸入信號由輸入層接收并傳遞給隱含層,經隱含層信息變換處理后,傳遞給輸出層,并將此輸出與期望輸出進行計算得出誤差,若誤差不在可接受范圍內,則將誤差反向傳播給神經網絡,周而復始并以此計算各層的閾值和權值,直至得到可接受的結果,訓練結束[13].
BP神經網絡的權值訓練使用非線性可微函數,并且,只含有一個隱含層的BP神經網絡即可對任意連續函數進行任意精度的映射,因此本文亦采用3層BP神經網絡進行建模.使用BP神經網絡建模不必預知模型的各項參數即可對函數進行擬合,因此,BP神經網絡的建模能力和非線性映射能力很強,可以很容易進行復雜模型的建立[14].
由于沒有明確的隱含層神經元選擇公式和規范,BP神經網絡建模的難點之一為隱含層神經元數目的選取,隱含層神經元數目過多會導致模型過于復雜、過擬合和泛化能力差等問題,導致模型的預測效果極差.因此,通過多次調試選擇隱含層神經元數目,得到最優模型.
另外,由于訓練函數根據自身特點,需多次試驗選擇出最優訓練函數對神經網絡進行訓練.根據多次實驗結果,選擇量化共軛梯度(scaled conjugate gradient,SCG)反向傳播算法訓練函數.
VERTEX70紅外光譜分析儀,漫反射積分球附件,德國Bruker公司;光譜采集及分析軟件使用OPUS6.5.
試驗用的小麥面粉是來自北京古船食品有限公司不同批次的面粉,用電子分析天平準確稱量,在面粉中分別摻入濃度為0.4% ~20%的滑石粉,共制備了1~50號共50個摻雜樣本,并以摻雜后的面粉中滑石粉的濃度作為樣本的真值.
儀器工作參數設定為:譜區范圍12 500~4 000 cm-1,掃描次數32次;分辨率8 cm-1.將上述所配面粉樣本放置在旋轉臺的樣品杯中,開啟旋轉臺,室內掃描溫度25℃.每次掃描前儀器預熱30 min,以儀器內置參比做背景校正.
定量分析采用偏最小二乘法(PLS)建立近紅外光譜與小麥面粉中滑石粉含量的回歸模型.其評價標識有決定系數(R2)、交叉驗證標準差平方根(root mean square error of cross validation,RMSECV)和預測標準差平方根(root mean square error of prediction,RMSEP),其計算公式如下.

RMSECV和RMSECP表示近紅外測定值與真值間的相似程度,其計算公式如下.

其中,P為回歸因子數目;

圖1為用近紅外光譜儀掃描含滑石粉的小麥面粉所得原始近紅外光譜圖.由圖1可見,不同配比的摻雜滑石粉的小麥面粉樣本的近紅外光譜趨勢一致性較好,沒有光譜異常現象,且因化學值和光譜異常的判斷較為復雜,故在此不做異常樣品的剔除.
近紅外光譜往往包含一些與待測樣品性質無關的因素帶來的干擾,導致了近紅外光譜的基線漂移和光譜的重復,為了減弱或消除基線漂移、散射等各種非目標因素對光譜的影響,對近紅外光譜儀采集的摻雜滑石粉的小麥面粉光譜進行光譜預處理是必要的.本文分別以多元散射校正對光譜進行預處理后,建立定標模型;由于要限制頻率范圍到9 000 cm-1,故選用波段9 000 ~4 000 cm-1,可以達到滿意的效果.采用PLS對數據進行分析,可以有效濾除噪聲和背景對建模的干擾,同時也減少了變量個數和模型的隨機性,提高了模型的運算速度,改善了模型的預測精度和線性相關性.圖2為預處理后的面粉樣本光譜圖,其中橫坐標是波數(cm-1),縱坐標是吸光度.

圖1 含滑石粉的小麥面粉原始近紅外光譜圖Fig.1 Raw near-infrared spectra of talc-containing wheat flour

圖2 預處理后的面粉樣本光譜圖Fig.2 Flour sample spectra after pretreatment
根據光譜預處理結果,選擇7 502.1~6 098.1 cm-1波段的特征吸收峰對面粉中滑石粉建立定量分析模型.使用MATLAB R2009a神經網絡工具箱中量化共軛梯度(scaled conjugate gradient,SCG)反向傳播算法訓練函數(trainscg訓練函數),同樣采用以校正集為訓練樣本對網絡進行訓練和以平均絕對誤差(mean squared error,MSE)為性能函數,隱含層選為11個神經元,建模時對BP神經網絡訓練500次.所建立模型的各個評價參數為:R2=0.997 3,RMSEC=0.436 7,RMSEP=1.708 8.圖3為內部交叉驗證擬合結果,橫座標代表目標值即真實值T,縱坐標代表BP網絡輸出值即預測值Y,線性擬合函數為Y=0.99T+0.095,圓圈代表真實值,紅線代表擬合值,黑線代表Y=T;圖4為BP神經網絡對預測集的預測結果,橫座標代表樣本、滑石粉摻雜量,縱坐標藍線代表真實值、綠線代表預測值.

圖3 BP神經網絡內部交叉驗證擬合結果Fig.3 BP neural network internal cross-validation fitting results

圖4 預測集預測結果Fig.4 Prediction results
面粉中滑石粉的定量檢測,由于受到儀器精度及穩定性、實驗方法設計和實驗過程中的操作方法的影響,檢測結果往往和預想的結果有較大差距,化學計量學方法在面粉中滑石粉檢測技術中的應用是本課題的重要內容.本文通過對近紅外技術光譜數據的預處理,不但放大了特征信息,而且大大減小了后期的建模過程計算量.
結合近紅外光譜技術,使用BP神經網絡建立面粉中滑石粉的定量分析模型有效利用了近紅外光譜技術的快速、無損檢測特點和BP神經網絡非線性映射能力強、模型概括性和推廣型強的優點.
在使用BP神經網絡進行建模的過程中,最優訓練函數的選取和隱含層神經元數目的選擇是本文的難點之一,根據采用不同訓練函數和隱含層神經元數的BP神經網絡針對面粉中滑石粉特點所建立的模型的建模結果為:模型的相關系數在0.99以上,交叉驗證標準差和預測標準差分別為 R2=0.997 3,RMSEC=0.436 7,RMSEP=1.708 8,得到了較好的評價參數.試驗結果表明:BP神經網絡應用于面粉中滑石粉的檢測技術是可行的,但是,樣本集所包含樣本數對BP神經網絡建模結果的影響仍需要進一步研究.
[1]Osborne B G.Near-infrared spectroscopy in food analysis[J].Cereal Foods World,2000,45(1):11.
[2]國家質量監督檢驗檢疫總局.GB/T5055—2008.糧油檢驗灰分測定法[S].北京:中國標準出版社,2008.
[3]董福祥.面粉摻假方法介紹[J].寧夏農學院學報,2001,22(4):75-76.
[4]薛笑莉,周激.面粉及面制品中滑石粉-石膏-碳酸鈣含量的測定[J].山西化工,2003,23(2):33-34,61.
[5]國家質量監督檢驗檢疫總局.GB/T21913—2008.食品中滑石粉的測定[S].北京:中國標準出版社,2008.
[6]郭光美,王云清.面粉中摻有滑石粉的快速檢測方法[J].食品研究與開發,2000,21(1):40-42.
[7]王承明,潘峰.面粉中滑石粉的X射線衍射分析[J].分析科學學報,2006,22(6):651-654.
[8]金鳳,王冬.面粉中滑石粉的現場快速檢測方法及其裝置研究[J].食品與發酵工業,2008,34(3):160-163.
[9]魏峰,霍軍生,徐宇洋.面粉中滑石粉含量的檢測[J].黃山學院學報,2008,10(5):48-49.
[10]由健,劉成雁.面粉中滑石粉的X射線檢測法[J].科協論壇,2009(1):85-86.
[11]楊彥麗,林立.微波消解 電感耦合等離子發射光譜法測定面粉中滑石粉的含量[J].化學分析計量,2011,20(3):62-64.
[12]趙延華,韓旭.傅里葉變換 紅外光譜法快速測定面粉中滑石粉[J].理化檢驗化學分冊,2011,47(2):208-210.
[13]MATLAB中文論壇.MATLAB神經網絡30個案例分析[M].北京:北京航空航天大學出版社,2010:36-44.
[14]劉翠玲,索少增.BP神經網絡在ATR-FTIR技術微量農藥溶液檢測中的應用[J].北京工商大學學報:自然科學版,2011,29(4):64-67.
(責任編輯:王 寬)
Rapid Determination of Talc-containing Flour Based on BP Neural Network
LIU Cui-ling, DONG Xiu-li, SUN Xiao-rong, WU Jing-zhu, WU Sheng-nan
(School of Computer Science and Information Engineering,Beijing Technology and Business University,Beijing 100048,China)
Near infrared spectral technology(NIR)was used to test talc-containing wheat flour.The spectrum was preprocessed with multiplicative scatter correction.The quantitative analysis model of talccontaining flour was built using SCG back propagation algorithm training function of BP neural network,and the calibration set and prediction set were quantitatively analyzed.R2was 0.997 3,the root mean square error of calibration(RMSEC)was 0.436 7,and the root mean square error of prediction(RMSEP)was 1.708 8.The results showed that BP neural network with NIR for the determination of talc-containing flour has the advantages of fast,high precision,and the ability of Fanhua,and can be used for talc-containing flour.
BP neural network;NIR;talcum powder;wheat flour
TS205
A
1671-1513(2012)05-0077-04
2012-08-29
劉翠玲,女,教授,博士,主要從事食品安全檢測方面的研究;
董秀麗,女,碩士研究生,研究方向為食品安全檢測技術.通訊作者.