摘 要:在序空間中進行信號處理是近年來提出的解決神經信息編碼的新方法,不過其有效性還有待進一步驗證。本文嘗試結合H-H神經元模型和基于圓映射的處理方式在序空間設計一個生物神經計算模型模擬生物聲納系統依靠聲波到達雙耳的相位差信息來得到聲源方位信息的功能。實驗結果從一個角度驗證了在序空間中進行信號處理的可用性,具有一定的理論價值。
關鍵詞:脈沖神經網絡;H-H方程;符號動力學;圓映射;生物聲納
中圖分類號:TP183文獻標志碼:A文章編號:1671-7953(2009)01-0064-05
Research on Spiking Coding Mechanism of Biosonar Neural System
CHEN Qian1,CHEN Pan2
(1.Department of Computer Science,DongGuan University of Technology,Dongguan 523808,China;
2.Software Colleage of ZheJiang University of Technology,ZheJiang University of Technology,hangzhou310023,China)
Abstract: Signal procession in ordered spaces is a new research direction for building coding mechanism of Biosonar Neural System. But its effectiveness has not proved yet. This paper explored a new method using H-H spike neural network model,circle mapping and symbol-dynamics theory which is a simulator designed for modeling the Echolocation function of biosonar neural system based on measuring the interaural time difference(ITD) .The result of experiment verified the assumption of signal processing can be performed in ordered spaces in one aspect.
Key words: spiking neural networks;H-H equation;symbol-dynamics;circle mapping;biosonar
生物聲納神經系統一直是國內外研究的熱點,對國防和國民經濟發展有著重要的意義。但是,到目前為止較多的研究還只是停留在基礎生理現象研究上,例如文獻[1]對海豚判斷方位的準確性研究,只是對外圍的一些現象進行了統計和研究,而對生物聲納系統的神經回路的研究少之又少。Jeffress曾在文獻[2][3][4]中提出很多類似于神經回路結構生物的聽覺模型的假設,后來人們稱之為Jeffress模型。文獻[5][6]提及的關于神經回路中一些回路結構,對生物聲納的研究提供了極有利的幫助。
本文對生物聲納系統研究的基礎是第三代神經網路-脈沖神經網絡[7]。在構建H-H脈沖網絡模型的基礎上,運用非線性的理論方法對生物聲納的機理進行了探討和研究,從理論的角度對生物聲納神經信息系統接收外界刺激信號并作轉化、傳遞、處理等等這些過程做出了假設和解釋。
1 生物聲納神經計算基礎
文獻[8][9]指出生物的神經系統是在序空間內進行信息處理的。因為所有的感覺器官所感受到的刺激(如聲、光、氣味等)信號都有一個基本的特性-有序性。聲音有強弱之分,光有明暗之分,氣味有濃淡之分。所以,在序空間中的測量可以只測相對大小,不測絕對數值。如果將有序的脈沖信號刺激神經元,經神經元體處理后的輸出脈沖也存在有序性,那么就可以根據輸出脈沖的有序性來判斷輸入信號的有序性,測得相對大小。
H-H脈沖神經模型是本文研究神經計算的基礎。第三代神經網絡-脈沖神經網絡(SNNs)根據脈沖觸發的時序進行編碼,例如用脈沖觸發的準確時間順序來編碼[10]。本文的所有實驗都是從H-H方程出發,應用H-H方程對神經元的膜電位進行仿真分析。H-H基本方程如下:
dudt=[Iin-gNa#8226;m3#8226;h(u-ENa)-gk#8226;n4(u-Ek)-gl #8226;(u-El)]/Cm(1)
公式(1)中, Iin為H-H模型的輸入信號,取參數:gNa=120mS/cm2、gK=36mS/cm2 和 gl=0.3mS/cm2為電導系數,EN2=54.98mV、Ek=-71.967mV和El=-49mV為平衡電位,Cm=1μF/cm2為電容。
當在神經元上輸入一串等間隔的神經脈沖信號(刺激信號)時,通過H-H方程計算,其輸出是一串周期性但很不規則的脈沖序列η=δ0δ1δ2…δi……。根據文獻[11][12][13]取圓映射的方法,將輸出的脈沖序列轉換為相位序列{θi}=θ1θ2θ3…θn,經分析可得θn+1=φ(θn)(2)
雖無法求得的具體函數,但是可以根據公式相位序列{θi}=θ1θ2θ3…θn畫出它的曲線,見圖1,分析可得:θn與θn+1之間存在著非常有規律的函數。
圖1 輸入脈沖周期為2.6ms時,神經元輸出的圓映射圖,圖中取相對坐標ǒ=θi/τ,其中τ為輸入信號周期
由此可見,這是一個很好的良序映射,根據初始相位θ1就可確定θ2,依次類推,得到的一串相位序列與實際神經脈沖所取得的相位規律是一致的。
假設有一串神經元輸出脈沖序列η=δ0δ1δ2…δi…(3)
按照規則[]取符號:
SiP1(當δi和δi-1在同一周期格內)
P2(當δi和δi-1所在周期格后第1格)
P3(當δi和δi-1所在周期格后第2格)
……
Pr(當δi和δi-1所在周期格后第r-1格)(4)
按上面的規則就能把神經脈沖序列{δ}=δ0δ1δ2…δi……變成符號序列:
{Si}=S1,S2,S3…Si(5)
其中Si=p1,p2,p3…pi,… 。
一個初始相位為θ1的脈沖確定了一串脈沖序列,每一串脈沖序列{δi}可得到一串符號序列{Si},每一串符號序列{Si}可按初始相位θ1進行排序,其規則如下:
假設有兩串符號序列:
{ai}=a1a2a3……an ai=p1,p2 ,…,pi,…pr
{bi}=b1b2b3……bn bi=p1,p2 ,…,pi,…pr
比較兩個符號序列的第一個符號a1與b1有規律:
p1<p2 <p3<…<pi<…<pr(6)
比較兩個以上的符號序列有
p1<p2<p3<…<p4(7)
其中a1a2a3…ai=b1b2b3…bi是前i位相同符號部分。
每一個初始相位都對應著一串序列,按圓映射的符號動力學原理,我們可以得到,這每串序列之間的大小排序與初始相位大小排序相同。相反我們不必知道各初始相位θ1的大小,只要知道每一初始相位θ1所對應的符號序列就可知道它們之間誰大誰小。
2 生物聲納神經系統脈沖編碼機理
2.1 生物聲納神經系統測聲源相對位置原理
在自然聽音中,聽覺系統的聲源的定位,取決于多個物理因素。Rayleigh在提出了雙元學說理論(duplex theory),該理論是基于正弦波為刺激信號的實驗結果。實驗結果顯示兩耳之間的聲音級差(IID)和聲音到達耳朵時的時間差(IID)對聽覺定位的影響很大[14]。
同一個聲源離兩耳的距離不同,發出的聲波信息到達雙耳聽覺中樞的時間有差異,稱為耳間時差。時間差(IID)與聲源的方位角 α有關。
圖2 生物聲納判斷目標方位原理圖
如圖2中,L,R分別代表左耳和右耳,兩耳之間的距離為D ;A,A ′,B為聲源,其中,A和A ′到L,R的距離差相等,即d=AL-AR=A ′L-A ′R,位于同一雙曲線上[15-16],其方位角都約為α;B位于L,R的中線上,其方位角為0°。由于離中心點越遠的地方,其雙曲線就越接近它們各自的漸進線[17],因此A和A ′偏離中心線的角度α=arcsin(d/D)。方位角α隨聲音到達兩耳的距離差d增大而增大,我們可以通過觀測距離差的變化得知方位角的變化,從而得知聲源方位的變化信息。
2.2 實驗模擬
生物利用聲波到達雙耳的相位差來得到聲源的方位信息,將具有相位差的輸入脈沖同時輸入刺激神經元,產生輸出脈沖。圖3中,L和R來自兩耳神經系統接收到聲音所產生的兩串脈沖序列,L與R之間存在因時間差而產生的相位差,通過神經元Neuron的突觸刺激神經元,使神經產生一個響應輸出脈沖序列C(另一串神經脈沖序列)。 通過觀測輸出脈沖C的變化得知輸入脈沖的相位差的變化,從而觀測聲源相位角的變化。
圖3 兩脈沖序列相位差的神經系統圖
實驗根據H-H方程構建H-H模型(H-H方程的具體參數與公式(1)相同),輸入脈沖L和R采用圖4方波形式,其中,amp1、amp2為輸入電流脈沖的振幅;width1、width2為輸入電流脈沖持續的時間長度;delay1、delay2為兩個輸入電流脈沖之間的時間間隔。
圖4 輸入脈沖示意圖
定義輸入脈沖L和R的相位差 σ:
σ=2π(Δt/τ)(8)
Δt為L和R實際的時間差,τ為輸入脈沖的周期。在正常情況下,生物兩耳之間的距離一般只有2cm-30cm,且聲音在空氣中傳播的速度為340m/s,兩耳的時間差一般不會超過1ms,所以Δt是[0ms,1ms] 之間的實數。
當σ為零時,輸入脈沖L和R之間不存在相位差,表示聲源在正前方;當σ不為零且不斷變化時,表示聲源處于不同的方位角。當L和R的相位發生變化時,輸出脈沖C也會發生變化,我們通過C的變化來觀測L和R之間的相位變化。接下來將通過一系列的實驗來證明上述結論。假設L和R都是單頻的輸入脈沖,L和R處于不同頻率段的實驗如下:
實驗一:輸入脈沖L、R的頻率為500Hz,即fL=fR=500Hz,輸入脈沖的參數為:width=1ms,delay=1ms,周期τ=2ms;Δt∈ [0,1],步
長為0.1ms;相位差σ取不同的值得到表1的輸出符號序列。由實驗1的結果可以觀察到:隨著相位的增加,輸出符號序列對應的值也在慢慢增大,呈現出了良好的單調性。所以,反過來,根據輸出符號序列的大小就可以判斷兩列輸入序列的相位差大小,進一步可以判斷出目標所在的位置是由正前方在向兩邊移動。
實驗二:降低輸入脈沖L,R的頻率,fL=fR=450Hz,輸入脈沖的參數為:width=1ms,delay=1.3ms,周期τ=2.3ms;Δt∈[0,1],步長為0.1ms,即Δt以0.1ms逐步增加;相位差σ取不同的值得到表2的輸出符號序列。
實驗結果顯示相位差從0到0.48π變化時,輸出序列符號值明顯增大,和實驗一有相同的效果。當相位差再增大時,輸出序列符號值變化不大,并趨向同一值。
表3 輸入L、R脈沖序列頻率為800Hz時,輸出脈沖C的符號序列
輸入脈沖的相位差σ輸出脈沖符號序列
01099999910999999
0.16π1099999109999999
0.24π10999910999999910
0.32π10999109999910999
0.4π109910999910999910
0.48π109910999109991099
0.56π10910999109991099
0.64π109910999109991099
0.72π109991099910999910
0.8π10999910999910999
0.88π1099999910999999
實驗三:增大輸入脈沖L、R的頻率,即fL=fR=800Hz,輸入脈沖的參數為:width=0.62ms,delay=0.63ms,周期τ=1.25ms;t∈[0,1],步長為0.1ms;相位差σ取不同的值得到表3的輸出符號序列。
由表3得到的結果顯示,當頻率增大的時候,隨著相位差的增大,輸出符號值慢慢增大,但是,到后面,輸出值開始不遵循單調遞增的規律,甚至開始減少。
從圓射角映射理論分析和三個實驗的結果可以發現,如果要得到相對比較完美的單調遞增輸出序列符號值,要求輸入脈沖序列的頻率在一定的范圍內,(本實驗是500hz左右),頻率過高或過低都會影響到輸出序列值的單調性。這也說明了生物神經計算的參數取值和輸入脈沖信號的頻率有關,當輸入信號的頻率變化時,生物神經系統必須通過調整自己的參數,才能達到比較好的效果。
3 結束語
本文從H-H脈沖神經網絡模型和基于圓映射的脈沖編碼理論出發建立模型模擬了生物聲納系統的聲源定位功能,具體方法就是將具有相位差的輸入脈沖同時輸入刺激神經元,產生輸出脈沖。利用圓映射和動力符號學的脈沖編碼方法將轉化為符號序列,由符號序列的變化觀測輸入脈沖的變化,測得聲源的相對位置。實驗結果也驗證了這種脈沖神經網絡計算模型的有效性。
參考文獻
[1] ZAITSEVA K A,KOROLEV V I,ROTIN V. Adaptive Changes of Spatial Characteristics of Hearing in the Dolphin Tursiops Truncates[J]. Evolutionary Biochemistry and Physiology,2002,38(4):475-482.
[2] JEFFRESSL A.A place theory of sound localization [J]. Journal of Comparative and Physiological Psychology 1948,(41):35-39.
[3] 李啟虎.進入21世紀的聲納技術[J].應用聲學,2002,21(1):13-18 .
[4] SANDDEL T T , TEAS D C,FEDDERSON W E,JEFFRESS L A,Localization of Sound from Single and Paired Sources[J].The journal of the acoustical society of America,1955,(27):842-852.
[5] 李朝暉,遲惠生. 聽覺外周計算模型研究進展[J].聲學學報.2006,31(5):449-464.
[6] 顧凡及,周耀華,岳志誠等.聽覺外周對語音信號的處理和聽覺外周模型[J].國外醫院生物醫學工程分冊,1997,20(1):5-12.
[7] VAN R R,GAUTRAIS J,DELORME A,THORPE S. Face processing using one spike per neuron [J]. Biosystems,1998(48):229-239.
[8] JEAN P R,PETR L,PATRICIA D V,et al. Spiking frequency versus odorant concentration in olfactory receptor neurons. BioSystems,2000(580):133-141.
[9] LESTIENNE R. Spike timing, synchronization and information processing on the sensory side of the central nervous system [J]. Progress in Neurobiology,2001(65):545-691.
[10] VANRULLEN R,GUYONNEAU R,AND THORPE S J,Spike times make sense[J].Trends in Neurosciences,2005,28(1):1-4.
[11] KIM S,OSTLUND S. Universal scaling in circle maps [J].Physical,1989(39):365-392.
[12] ZHANG Z. J.,CHEN S. G. Symbolic dynamics of the circle map [J]. Acta Physica Sinica,1989,38(1):1-8.
[13] 陳式剛. 圓映射[M].上海:上海科技教育出版社,1998.
[14] WENZEL E M,The relative contribution of intramural time and magnitude cues to dynamic sound localization[C]. IEEE ASSP Workshop on Applications of Signal Processing to Audio and Acoustics,1995:80-83.
[15] ROBERT E I. Multimodal sensory integration for localization in a Humanoid Robot[C].IJCAI-97,Computational Auditory Scene Analysis,1997:55-59.
[16] YASUYUKI A,TSUYOSHI Y,JIE H,Noboru Ohnishi Acquiring the Ability of Object Localization by Vision and Audition througn Motion [J].Technical Report of IEICE,NC96-196,1997:315-322.
[17] HIROMICHI N,NOBORU O,Learning sound source localization by interaction between motion and sensing in a non-linear motor system [C]. Proc. OCONIP’98,1998:861-864.