奉 軻,花中秋,2,伍萍輝,2*,李 彥,曾 艷,王天賜,邱志磊
(1.河北工業大學電子信息工程學院,天津 300401;2.天津市電子材料與器件重點實驗室,天津 300401)
近年來,研究表明糖尿病患者所呼出氣體中的丙酮含量較正常人明顯偏高,健康人群呼氣中的丙酮含量為0.3×10-6~0.8×10-6,而糖尿病患者呼氣中的丙酮含量高于1.7×10-6,部分患者高達12×10-6[1-3]。將人體呼氣中的丙酮含量作為糖尿病標志物,為實現無創糖尿病診斷提供可能。人體呼氣中含有多種化合物成分,包括水蒸氣、二氧化碳、氮氣等。單一氣體傳感器對人體呼氣中的丙酮含量的檢測結果一般不準確;而氣相色譜分析法雖然能夠勝任這樣的檢測,但是由于其造價昂貴且不適合即時檢測,不利于無創糖尿病診斷技術的推廣和應用。而由多個具有交叉靈敏特性的氣體傳感器組成的傳感器陣列并結合模式識別算法形成的人工嗅覺系統“電子鼻”可以對復雜氣體中含有的氣體成分進行定性或定量分析識別。同時,電子鼻也具有造價低廉,體積小、功耗低等特點,可實現便攜式設計。
目前,電子鼻已經在食品、農產品檢測、醫療領域得到廣泛運用[4-13]。鄒小波[14]、潘天紅[15]等采用電子鼻進行谷物霉變檢測,識別正確率分別為90%、92%。俞守華[16]采用電子鼻進行有害氣體NH3和H2S識別檢測,識別正確率為91%。該文通過設計一個基于金屬氧化物半導體氣體傳感器與BP神經網絡模式識別算法的專用電子鼻,用于痕量丙酮氣體的識別。由于收集糖尿病患者呼出的氣體較為困難,且儲存樣本氣體不方便,不利用前期算法設計與實驗的開展,所以實驗中將通過多個MFC模擬配制出糖尿病患者呼氣中含有的痕量丙酮樣本與另兩種干擾氣體樣本進行動態測試采樣。相對于靜態測試采樣,動態測試中的氣體濃度更接近于實際氣體濃度,減少了靜態測試中手動配氣帶來的實驗誤差;同時動態測試能提取氣體瞬態響應過程中更多有用的信息量。建立BP神經網絡模型進行識別分析,并通過PCA+BP算法相結合,壓縮了特征矩陣中的特征量,降低BP神經網絡模型的復雜程度,提高了算法的收斂速度,從而實現痕量丙酮氣體的準確識別,為后期電子鼻實現無創糖尿病檢測應用提供了參考。

圖1 電子鼻系統框圖
電子鼻系統由采樣模塊、數據采集模塊、模式識別分析模塊組成,其結構如圖1所示。采樣模塊由采樣氣室、不同敏感材料制備的氣體傳感器陣列和傳感器供電模塊組成,其中采樣氣室為電子鼻識別氣體提供一個相對穩定的測試環境。數據采集模塊包括調理電路、數據采集卡和上位機采集界面。數據采集模塊可采集傳感器陣列中多個傳感器的電壓值隨時間變化的信息Vn(t)。上位機采集界面通過USB通訊控制采集卡,并對采集的信號數據進行預處理。模式識別模塊基于MATLAB R2014a軟件平臺進行特征提取與算法模型建立,通過C#與MATLAB混合編程[17-18],實現采集樣本數據與模式識別分析的自動化與一體化。
實驗中,假設糖尿病患者呼出氣體由空氣(氮氣、氧氣、二氧化碳、水蒸氣)和稀有氣體(丙酮)混合而成。為配制模擬糖尿病患者呼出氣體樣本,通過3個MFC(氣體流量控制器)將純凈空氣與丙酮氣體按一定比例混合,配制出含有30×10-6丙酮的氣體作為糖尿病患者的模擬呼氣樣本,同時配制出另兩種干擾氣體樣本(30×10-6乙醇樣本、15×10-6丙酮與15×10-6乙醇混合樣本)。通過動態測試的方法,采集記錄在一個樣本時長(包括先通入目標氣體120 s,再通入純凈空氣對氣室進行清洗600 s)內的各個傳感器輸出的電壓值隨時間變化的數據。采集頻率為1 Hz,在720 s的檢測時間內,10個傳感器采集得到的數據可組成一個10×720的觀測信號矩陣X。對矩陣X的原始數據進行特征提取,得到樣本氣體的特征子集。通過自主設計的電子鼻系統分別對這3種目標氣體進行多次采集,得到訓練樣本。以BP神經網絡算法建立識別模型,并與PCA+BP神經網絡算法相結合,壓縮特征矩陣中的特征量,降低BP神經網絡模型的復雜程度,提高算法的收斂速度,最終實現痕量丙酮氣體的準確識別。
該電子鼻系統選取對低濃度氣體具有較高靈敏度的多種商用傳感器(包括5種費加羅:TGS2620、TGS2600、TGS822、TGS2602、TGS826,4種煒盛:MQ9、MQ7、MQ135、MQ3以及MS1100)構成傳感器陣列,且傳感器之間具有不同敏感特性。傳感器型號與敏感特性如表1所示。氣體傳感器放置在一個容積為100 mL的氣室中,通入氣室樣本氣體流速為100 mL/min。較小的容積使目標氣體在動態測試過程能迅速充滿氣室;而較低的氣體流速讓整個測試環境相對穩定,減少氣流對傳感器響應造成的波動影響。陣列中傳感器與目標氣體接觸后,由數據采集系統采集各個傳感器信號。傳感器陣列實物如圖2所示。

圖2 傳感器陣列實物圖

表1 傳感器與敏感特性
2.2.1 數據采集和數據預處理
采用16通道12 bit精度采集卡對傳感器陣列中10路獨立電壓信號進行采集,采集卡每個通道的采集速率為20次/s。為了減少外界環境對采集信號的影響,對采集的電壓信號V0進行預處理。每秒從20個樣點中隨機抽取8個點作為有效數據,并通過式(1)對電壓數據進行處理,得到第n秒匹配電阻的電壓值V0。
(1)
2.2.2 特征量的提取
該電子鼻系統中含有10個氣體傳感器,采集生成10個電壓隨時間變化的信息V1(t)、V2(t)…V10(t)。測試樣本采用的是動態測試方法,整個過程包含樣本氣體與敏感層材料吸附、解吸附和恢復3個階段,所以應提取包含整個瞬態響應過程特征的參數作為特征量。該識別模型將傳感器的相對最大響應Vmax、吸附階段1 min時相對響應Va、解吸附階段1 min時相對響應Vb、整個過程相對響應的積分值Vint4個特征量作為一個傳感器的特征子集,則10個傳感器組成包含40個特征量的特征矩陣。相對響應V由傳感器在目標氣體中的響應值與基線值求出,如式(2)所示:
V=Vs-V0
(2)
式中:Vs是傳感器響應信號,V0作為基線值,是吸附階段開始時傳感器在純凈空氣中響應信號。
傳感器相對最大響應Vmax:
Vmax=max|V|
(3)
吸附階段1 min時相對響應Va:
Va=Vs1-V0
(4)
式中:Vs1是吸附階段通入目標氣體1 min時傳感器響應信號。
解吸附階段1 min時相對響應Vb:

(5)

整個過程相對響應的積分值Vint:
(6)

為了給模式識別算法空間準備合適的數據,需要對特征矩陣中的元素進行歸一化處理,使每個元素處于相同數量級。將特征矩陣中的元素映射到[0,1]區間,如式(7)所示:
(7)
式中:x為特征矩陣中一個元素,xmin為特征矩陣中最小值,xmax為特征矩陣中的最大值,y為該元素歸一化后的結果。
該電子鼻的軟件設計在C#集成開發環境下完成,在C#編寫的界面中調用MATLAB,實現C#與MATLAB混合編程。通過編程實現控制采集數據,獲取傳感器陣列中各個傳感器的電壓信號,并將數據存入文本文件;同時對原始數據進行特征提取、歸一化處理等,再對3種測試樣本進行學習訓練,從而建立算法模型,最終實現對目標氣體的分析與識別。軟件設計流程圖如圖3所示。

圖3 軟件設計流程圖
該電子鼻系統利用BP誤差反向傳播算法對采集的數據進行分析。BP網絡通過學習和存儲訓練樣本的輸入與輸出映射關系,通過誤差反向傳播對網絡的權值和偏差進行反復調整,使實際輸出與期望輸出盡可能一致。含有多個隱含層建立的BP算法模型能夠適應任何非線性的映射,有利于電子鼻進行模式分類[19]。
該特征矩陣中包含了40個特征量,在進行識別分析時,計算量較大。為了提高識別速度與準確率,需要對特征矩陣中的元素進行壓縮,減小特征量之間的相關性。主成分分析法(PCA)是一種常用的數據壓縮和特征提取的多變量統計分析方法,能夠去除數據間的相關性[20]。因此,采用主成分分析法對現有40維的樣本空間進行某種正交組合變換,產生新的學習樣本空間,并降低其維數、縮小分量之間相關性。將這些新的學習樣本作為BP神經網絡的輸入,能降低BP神經網絡的復雜程度,是一個理想的降維方法。
實驗開始前,先對傳感器進行24 h老化試驗,使各傳感器基線穩定。單次測試過程如下:通過MFC配置氣體樣本,采用動態測試的方法將目標氣體通入氣室120 s,再通入純凈空氣清洗氣室600 s。采集頻率為1 Hz,則整個瞬態響應過程中將記錄采集的720個數據點作為原始數據。傳感器陣列對3種樣本氣體的響應曲線如圖4~圖6所示。可見,部分傳感器對于3種樣本氣體響應差異性很小,比如S1傳感器TGS822、S3傳感器MQ9、S9傳感器MQ3和S10傳感器MQ135,客觀反映單個氣體傳感器的交叉敏感性問題。

圖4 30×10-6丙酮響應曲線

圖5 15×10-6丙酮與15×10-6乙醇混合響應曲線

圖6 30×10-6乙醇響應曲線

圖7 各主成分貢獻率
對傳感器的原始數據進行特征提取與歸一化處理后,使用PCA主成分分析法對特征數據進行降維處理。圖7是PCA處理后前4個主成分的貢獻率。由圖可見前4個主成分的累計貢獻率達到96%,說明前4個主成分已經包含原始特征數據中主要的信息。通過PCA處理后的結果,將40維的特征數據壓縮到4維,而包含的信息量只損失了4%,降低了數據的復雜程度。
圖8是前兩個主成分繪制的二維PCA圖譜,可見對于3種樣本的分布呈現一定規律,30×10-6丙酮樣本集聚于圖中左上方,15×10-6丙酮與15×10-6乙醇混合樣本集聚于圖中中部,而30×10-6乙醇樣本集聚于圖中右下方,說明前兩個主成分特征數據已經能很好地區分不同樣本氣體(其中第一主成分占有40%的信息量,第二主成分占有37%的信息量)。

圖8 3種樣本主成分分析結果
根據上述分析,對建立算法模型優化。將前4個主成分作為BP神經網絡輸入層的輸入;輸入節點為4,隱含層節點數設置為3;輸出層節點數設置為2,設定30×10-6丙酮的期望輸出為(0,1),30×10-6乙醇的期望輸出為(1,0),15×10-6丙酮15×10-6乙醇混合期望輸出為(1,1)。圖9是對3種樣本氣體分別進行20次采集測試識別的結果。前20個為丙酮氣體樣本,錯誤識別2個;中間20個為乙醇氣體樣本,錯誤識別1個;后20個為混合氣體樣本,錯誤識別2個,總體的識別準確率為91.7%。隨機抽取6個識別的結果,如表2所示。

圖9 模型預測分類結果

表2 定性分析結果
為實現無創糖尿病診斷,以金屬氧化物半導體氣敏傳感器陣列為核心,設計了一個用于檢測糖尿病標志物丙酮氣體的專用型電子鼻。該電子鼻系統通過3個MFC模擬配制糖尿病患者呼出的氣體,采用動態測試方法,并提取整個瞬態響應過程中相對最大響應Vmax、吸附階段1 min時相對響應Va、解吸附階段1 min時相對響應Vb、整個過程相對響應的積分值Vint4個特征量,從而更近似于人體呼出氣體過程。相對于靜態測試中只把穩態響應值作為特征量,動態測試能提取識別氣體更多的信息量,提高了電子鼻系統對氣體的定性分析能力。通過PCA+BP算法相結合,壓縮了特征矩陣中的特征量,降低BP神經網絡模型的復雜程度,提高了算法的收斂速度。通過對模擬糖尿病患者呼氣樣本(30×10-6丙酮)與另兩種干擾氣體樣本的識別結果表明,電子鼻能夠解決單個傳感器交叉敏感性的問題,具有較高的痕量丙酮氣體識別率。為后期電子鼻實現無創糖尿病檢測應用提供了參考。
[1] Di Natale C,Paolesse R,Martinelli E,et al. Solid-State Gas Sensors for Breath Analysis:A Review[J]. Analytica Chimica Acta,2014,824:1-17.
[2] Teshima N,Li J,Toda K,et al. Determination of Acetone in Breath[J]. Analytica Chimica Acta,2005,535(1):189-199.
[3] Righettoni M,Schmid A,Amann A,et al. Correlations Between Blood Glucose and Breath Components from Portable Gas Sensors and PTR-TOF-MS[J]. Journal of Breath Research,2013,7(3):037110.
[4] 殷勇,郝銀鳳,于慧春,等. 基于多特征融合的電子鼻鑒別玉米霉變程度[J]. 農業工程學報,2016,32(12):254-260.
[5] 石志標,黃勝全,范雪冰,等. 基于生物嗅覺的電子鼻研究[J]. 中國機械工程,2007,18(23):2810-2813.
[6] 陳星.呼吸檢測電子鼻及其在肺癌診斷應用中的研究[D]. 浙江大學,2008.
[7] 裴高璞,史波林,趙鐳,等. 典型摻假蜂蜜的電子鼻信息變化特征及判別能力[J]. 農業工程學報,2015,31(增刊1):325-331.
[8] 徐賽,陸華忠,周志艷,等. 基于電子鼻的果園荔枝成熟階段監測[J]. 農業工程學報,2015,31(18):240-246.
[9] Marco F L,Sabino C,Tuti G S,et al. Electronic Nose for Pesticides Detection:A First Realization[C]//Metrology for Aero Space(Metro Aero Space),2017 IEEE International Workshop on. IEEE,2017:403-407.
[10] Chiu C,Zhang Z. The Air Quality Evaluation Based on Gas Sensor Array[C]//Semiconductor Technology International Conference(CSTIC),2017 China. IEEE,2017:1-5.
[11] Zhu F,Iwata K,Kishimoto N. Assessing Production of Medicinal Liqueur Using an Electronic Nose[C]//Olfaction and Electronic Nose(ISOEN),2017 ISOCS/IEEE International Symposium on. IEEE,2017:1-2.
[12] 尹芳緣,曾小燕,徐薇薇,等. 基于電子鼻的芒果儲存時間預測方法研究[J]. 傳感技術學報,2012,25(9):1199-1203.
[13] 傅均,黃燦欽,章鐵飛,等. 便攜式智能電子鼻系統及其葡萄貨架期評價研究[J]. 傳感技術學報,2017,30(5):782-788.
[14] 鄒小波,趙杰文. 電子鼻快速檢測谷物霉變的研究[J]. 農業工程學報,2004,20(4):121-124.
[15] 潘天紅,陳山,趙德安,等. 電子鼻技術在谷物霉變識別中的應用[J]. 儀表技術與傳感器,2005(3):51-52.
[16] 俞守華,董紹嫻,區晶瑩,等. 豬舍有害氣體NH3、H2S的電子鼻定量識別[J]. 農業工程學報,2009,25(7):153-157.
[17] 李誠剛,趙佳寶,陳兆榮,等. Visual C#與MATLAB混合編程在可視化軟件中的應用[J]. 軟件,2012,33(2):78-83.
[18] 焦綱領,鄧建輝,韓嘯,等. MATLAB與Visual C#混合編程[J]. 海軍航空工程學院學報,2008,23(1):109-111.
[19] 李廣超,賀鵬程,孫瑋偉,等. BP網絡算法在模式識別中的應用[J]. 應用技術,2014,1:79-81.
[20] 梁勝杰,張志華,崔立林,等. 基于主成分分析與核獨立成分分析的降維方法[J]. 系統工程與電子技術,2011,33(9):2144-2148.