余 華 ,黃程韋,趙 力*, 鄒采榮
1.南京信息職業技術學院,南京 210013;
2.東南大學水聲信號處理教育部重點實驗室,南京 210096
情緒是我們智力的基礎,也是人類道德與自尊的基礎,因為所有精神的高級功能都需要情感的伴隨,或是意圖和情感共同協調產生的思維。隨著認知神經科學與情感神經科學的發展,越來越多的證據表明情緒是推理和判斷過程中必不可少的一部分,并對學習和記憶過程產生重要的影響[1]。
人的情感是一種主觀意識,但情緒的變化通常對神經系統的影響有多方面的表現,諸如面部表情、生理指標(如心電, 體溫)、語音、動作與手勢等等[2]。我們在開展“兒童生理參數與情緒狀態”的研究項目中,通過記錄伴隨情緒發生的生理變化,如心電、血管收縮、皮膚電反應等活動,對兒童情緒狀態與認知活動進行觀察與研究,了解他們的發育水平和個體差異,幫助他們正確處理情感交流和智力發育過程中出現的問題。為了讓測試兒童處在一個相對自然的狀態,使情緒識別結果的可信度更高,我們設計了一套便攜式生理參數采集系統,供研究人員分析生理參數與兒童情緒之間的關系。本文介紹了便攜式兒童情感電生理參數采集系統的設計方案以及利用情感電生理參數監測與判別兒童情感的方法。
本系統中我們主要考慮了兩種情感電生理參數的采集與處理,即心電和體溫,系統組成如圖1所示。其中控制電路主芯片選用的是STC89LE58RD+,主要工能是控制A/D轉換和數據的傳輸,并執行來自于PC機的命令。

圖1 系統結構
心電信號是心臟搏動時在人體表面形成的電位差,通過分析心電信號,可以了解心臟的搏動狀態。原始的心電信號非常微弱,幅度只有0 ~4 mV,頻帶為0.05 ~100 Hz,其中混雜有大量的干擾噪聲,尤以50 Hz工頻干擾最為厲害。此外,電極接觸噪聲、運動偽跡、肌電噪聲、放大器直流溫漂、呼吸引起的基線漂移等均會對心電信號的放大與檢測帶來困難。針對心電信號的特點,設計了前置放大、高通濾波、50 Hz陷波、低通濾波和信號放大電路[3-4]。
前置放大器的作用是提高心電信號采集電路的輸入阻抗以獲取更多的原始心電信號,同時還能抑制信號中的共模干擾,提高信噪比。前置級由輸入跟隨器,儀用放大器,右腿驅動三個部分組成,是整個心電放大器中很關鍵的部分。儀用放大器選擇AD620,它只需在1腳和8腳外接電阻就可以構成一個性能很好的單片集成儀用放大器。盡管儀用放大器可以很好地抑制共模干擾,但因為原始心電信號的信噪比太小,所以還必須設法減少這些共模噪聲的絕對值,用提高信噪比的方法來提高信號質量。右腿驅動電路的設計思路是把混雜于原始心電信號中的共模噪聲提取出來,經過一級倒相放大后,再返回到人體,使它們相互疊加,從而減小人體共模干擾的絕對值,提高了信噪比,共模信號的提取和反饋電路設計如圖2所示:

圖2 右腿驅動電路
低頻噪聲主要集中于0.03 Hz~2 Hz,但心電信號中的ST段和Q波頻率分量集中于0.05 Hz~2 Hz之間,所以不能簡單地把高通濾波器的截止頻率定為2 Hz,否則將使心電信號的波形出現較大失真。根據美國心臟協會的建議,去除心電信號中的直流成分的高通截止頻率不得超過0.05 Hz,所以設計時把高通截止頻率設為0.035 Hz。由于心電信號的頻譜主要分布不超過100 Hz,所以該頻率以外的分量均可視為噪聲,設計時把低通截至頻率設定為120 Hz。
心電信號經過上述處理后,仍摻雜很大的工頻干擾,所以我們還設計了一個陷波器來消除其中的50 Hz噪聲。陷波器的實現方案有多種,其中應用最為廣泛的是稱為“雙T帶阻濾波”的電路,原理如圖3所示。

圖3 雙T帶阻濾波器原理圖
其中w0是阻帶中心頻率, Q為品質因數, B為阻帶帶寬。為避免電路產生自激振蕩, 必須滿足AV<2。在這個約束條件下, AV越大,則Q越大,于是阻帶帶寬越窄,陷波器的選頻特性就越好。但這種形式的陷波器受元器件參數變化的影響較大,稍有不慎,就會造成阻帶中心頻率出現較大偏差。所以, Q不宜過大,一般選取Q≤10。
雖然在模擬電路中對信號進行了簡單的濾波,但通過大量的采集數據發現信號仍存在基線漂移現象,在電平提升時還引入了直流分量,同時50 Hz及其倍頻的存在也影響了信號的觀察。所以我們在程序中再次加入了針對這些干擾的FIR數字濾波器,借助于MATLAB軟件很容易設計。經過濾波后,心電信號中參雜的各種噪聲得到了有效控制,特征點都比較好地展現出來。
QRS波群由于幅度大,占據的時間窄, 成為心電圖(Electrocardiogram, 簡稱ECG)檢測的重要依據。目前,有很多方法可用于QRS波群的檢測,如差分閾值法、模板匹配法、神經網絡法等等[5]。采集系統是為分析兒童情感設計的,它要求把數據信息及時、準確地呈現給研究者,差分閾值法算法簡單,處理速度快,易于實現,這正符合我們的要求。
差分閾值算法的原理是基于QRS波群的幅值與斜率均為最大的特點,首先確定QRS波群的閾值,當ECG數據的差分值不低于閾值時即可判斷為檢測到一個QRS波群。以5點差分為例,首先根據心電數據xn計算差分值yn:yn=xn+1-xn-1+2(xn+2-xn-2)。取出yn中最大的10個值并計算其平均,則閾值可設定為平均值的0.7倍和0.8倍之間的某個數。由于在R點附近波形變化較快,所以當ECG某點的差分值達到閾值時,認為檢測到一個QRS波群。根據差分閾值的公式可知, R峰值點的閾值應該為零或者處于最接近零的位置,所以從該點開始往后一段距離內,閾值為零或者最接近零的點就是R點。設相鄰兩個R波的間隔為n,心率(次/min)的計算公式為:心率=采樣頻率×60÷n。如果發現前后間隔差別過大,則可認為出現了漏檢R點的情況,在這種情況下,通過適當減少閾值,再對該段心電數據重新進行檢側,以定位漏檢的R波。反復進行幾次,如果還沒有發現R波,則可判定為心率不齊的表現。
我們還使用了一種通過平均值來檢測QRS波群的方法,首先把屏幕顯示范圍內的數據作為分析數據,求這些數據的平均值,并把超過平均值的數據歸入下一次要分析的數據。按照上述方法再重復3次,最后當有數據超過第4次的平均值時,認為檢測到了R波,該點周圍的最高點即為R點。這種方法更為簡單,運算量小,實際使用中很可靠。圖4顯示一段實時心電檢測的結果,其中為了方便觀測者分析,我們T波和P波間的數據作了11點平滑濾波。

圖4 心電檢測的結果圖
體溫是個非電量,各種工頻噪聲,肌電噪聲等電磁干擾對體溫采集電路的影響遠遠小于心電采集電路,而且體溫還是個變化十分緩慢的生理信號,在頻譜上可以把它看成一個直流信號。所以與心電信號采集電路比起來,體溫采集電路要簡單得多。在設計體溫采集電路時沒有過多考慮如何實現抗干擾,而是要求電路簡單,易于調試。溫度傳感器采用的是北京森恩傳感器技術公司的MF5E系列產品,它實際上是一個熱敏電阻,通過外圍電路實現非電量到電量的轉換。圖5為所設計的體溫采集電路圖,其中R為傳感器。

圖5 體溫采集電路
我們都知道,生理信號存在明顯的非平穩特性,而且個體差異很大。不同人之間,心電和體溫都是不一樣的,特別是心電信號的個體差異十分顯著。即便是同一個人,在不同的環境、不同的時間、不同的情緒狀態下,心電信號都會發生或多或少的改變。因此,為實現情緒狀態的識別,我們必須能夠從所采集的心電和體溫等生理信號中提取出最有效的特征來用于分類。
特征選擇有兩種基本法方法:一是由專門領域內的專家利用其知識挑選出那些對分類最有影響的特征;二是用數學的方法進行篩選比較,找出最有分類信息的特征。伍德和霍根森(Wood&Hokanson)在1965年就已證明, 心率是情緒反應的良好生理指標之一。所以,本文選擇心率為第一個特征。除心率以外, 我們還選擇心電波形中的R波幅度及其寬度為第 2 和第 3 特征。文獻[2]指出,這兩個特征會隨著情緒狀態的變化而發生明顯變化。北大心理學系1973年的研究發現[2],在情緒狀態改變時,呼吸系統在速度和深度上會有所變化,繼而引發血管容積發生變化。無論血管是處在收縮狀態還是處在舒張狀態,它都將引起人體溫度的變化,所以,本文選擇體溫為第4個特征。
應用統計方法解決模式識別問題時,經常遇見的問題之一就是維數問題。在低維空間里解析或計算上行得通的方法,在高維空間里往往不行。因此,降低維數有時就成了處理實際問題的關鍵所在[6]。
從數學上說,把d維空間的樣本投影到一條直線上,形成一維空間總是可以辦到的。然而,即使樣本在d維空間里形成若干緊湊的互相分得開的集群,若把它們投影到任意一條直線上,也可能使幾類樣本混在一起而變得無法識別。 Fisher(1936)所要解決的基本問題就是如何找到一條最好的,最易于分類的投影線,使在這個方向的直線上,樣本的投影能分開得最好。為了實現分類,我們總是希望在一維Y空間里各類樣本盡可能分得開一些,即希望兩類均值之差(~m1-~m2)越大越好;同時希望各類樣本內部盡量密集,即希望類內離散度越小越好。
基于Fisher準則的線性鑒別是目前已經被公認的最好的特征抽取的方法之一,但它也存在一些缺點。Fisher線性判別模型的基本思想是對樣本進行變換,將樣本投影到一條直線上,使樣本的投影能分得最好,也就是說變換后的樣本類別間離散度達到最高,類內的樣本離散度達到最低,從而提高各個類別之間的區分能力[7]。樣本在這些投影軸上的投影系數可作為樣本的特征向量,利用這些特征向量,便可進行樣本的分類識別。
設ω1, ω2, …, ωc為c個模式類,模式x為n維實向量。設sb, sw和st分別表示訓練樣本的類間散布矩陣,類內散布矩陣和總體散布矩陣。由其定義[8]知, sb, sw和st均為非負定矩陣,且滿足st=sb+sw,Fisher準則函數定義如下:

Fisher準則函數非常巧妙地將樣本在投影矢量上的類間離散度和類內離散度結合在一起,為我們確定最優投影方向提供了一個非常完美的準則。取極大化目標函數JF(w)的矢量x作為投影方向,其物理意義是:特征樣本在x上投影后,類間離散度和類內離散度之比達到最大。
至此, 我們已經找到了基于 Fisher準則函數JF(w)的最好的投影方向w。只是我們暫時還沒有解決分類問題,即采取什么樣的分類決策。然而,我們已經把d維空間分類問題轉化為一維空間分類問題了,所以只要確定一個閾值Y0,將投影點Y與Y0相比較,就可做出分類決策。
根據中心極限定理,當d維X空間的各類樣本數Ni很大時,其均值向量 ˉXi趨向于正態分布。則經過投影后,各類樣本均值ˉYi也滿足正態分布。這樣,問題就轉化為尋找多元正態概率型下的Bayes最小錯誤率的判別函數和決策面。其中,最簡單的一種情況是各個類別的協方差矩陣Σi都相同(記為Σ),并且各個類別先驗概率P(ωi)也都相等(i=1,2表示類別號)。
根據文獻[9 -10]可以知道,此時的最佳判決邊界方程為wTx+w0=0其中

為使Fisher準則函數JF(w)最大化的w與Bayes最小錯誤率判決邊界方程中的w是同一個方向。這樣,對于正態、等概、等協方差的Bayes最小錯誤率判別函數與決策面將與Fisher線性判別等價。
由式(2)可知,最佳決策面是通過m1和m2連線的中點并與連線正交的一個超平面。在二維空間里,最佳判決面是一條直線;而在一維空間里,它退化為一個點,也就是我們現在所要尋找的閾值Y0。
這樣,對于任意給定的未知樣本,只要計算它的投影點yy=w*Tx。
再根據決策規則

就可判別x屬于什么類別。
利用兒童情感實驗室提供的數據庫,我們進行了基于生理參數的情緒識別實驗。在數據庫中,有五男五女,共十人。每個人有兩類情緒狀態(分別是緊張與高興),而每類情緒狀態下的采樣數據有50組,總共有樣本1000組。
首先,我們對每個人進行分別處理。將每個人在每類情緒狀態下的采樣數據中隨機取出20組作為訓練樣本,用于設計分類器;剩下的30組數據作為測試樣本,檢測分類器的性能。
然后取十個人的平均值,得到以下結果:緊張的正確識別率為94.4%;高興的正確識別率為91.2%。
本文對基于生理參數的兒童情緒識別進行了初步的探討。在實驗中,本文首先對心電波形進行了平滑與降噪,接著進行特征提取,然后再利用Fisher線性判別函數設計分類器。除此以外,本章還就Fisher準則函數與多元正態概率型下的Bayes最小錯誤率判別函數及決策面之間的關系作了簡單說明。最后,通過實驗來測試我們所設計的分類器的性能。實驗結果表明在兩類條件下,該分類器已達到較低錯誤率。
[ 1] 蔡莉莉.基于數據融合的語音情感分析與識別[ D] .東南大學碩士學位論文, 2005.
[ 2] 周建中.兒童情緒的實驗室研究[ R] .東南大學學習科學研究中心研究報告, 2004.
[ 3] 陳明計,周立功.嵌入式實時操作系統Small RTOS51原理及應用[ M] .北京:北京航天航空大學出版社, 2004:426-279.
[ 4] 李玉華,劉金琪.基于模式識別的體外反搏系統的設計與實現[ J] .計算機測量與控制, 2005.
[ 5] 郭航遠.簡明臨床心電圖手冊[ M].上海:復旦大學出版社,2002:790-810.
[ 6] 蘇麗,趙國良,李東明.心電信號QRS波群檢測算法研究[ J].哈爾濱工程大學學報, 2003, 26(4):21-26.
[ 7] 劉健,錢猛,張維明.基于Fisher線性判別模型的文本特征選擇算法[ J] .國防科技大學學報, 2008.
[ 8] 劉永俊,陳才扣,趙根林,等.新的非線性鑒別特征抽取方法及人臉識別[ J] .計算機工程與設計, 2008.
[ 9] 邊肇祺,張學工.模式識別[ M] .清華大學出版社, 2002.
[ 10] V.Vapnik.Statistical Learning Theory[ M].New York:John Wiley&Sons, 1998.