張夢超 劉巧云 盧海丹 黃昭鳴 杜曉新 孫喜斌
言語信號經過濾波后,外在冗余度下降,隨著截止頻率降低,個體需要動用更多聽處理能力提取其聲學特征。識別時所需的聲學特征越少,說明個體的聽處理能力越強。早在1954年,Bocca等首先使用低冗余度的濾波言語作為聽處理障礙患者的測試材料[1],并發現病變對側耳的濾波言語識別得分降低。隨后幾十年間,濾波材料開始被應用于中樞病變的診斷。上世紀80年代,程錦元等編制了一部分低通濾波言語測聽詞表,并在中低頻區域劃分了7檔截止頻率,有350、500、750、1 100、1 600、2 500和3 500 Hz[2]。2006年蘇金霏等的研究發現,500~8 000 Hz是健聽成人言語識別的重要頻帶,單音節詞是外在冗余度最少的語音單位,比有意義詞更難聽懂,言語測聽最好使用單音節詞[3]。為探討識別低通濾波漢語到底需要多大的通帶范圍及不同聲韻母會受到何種因素的影響,本研究選取漢語聲母中的塞音,將塞音開頭的單音節詞作為言語識別材料,通過改變通帶范圍的方式,獲得健聽成人識別低通濾波清塞音所需的最小通帶及影響因素,為進一步完善聽處理相關的言語測聽材料作前期探索,報告如下。
1.1研究對象 本實驗對象為華東師范大學33名在讀大學生,其中男17人,女16人,年齡19~24歲,平均21.5±1.2歲,雙耳各頻率聽閾均在25 dB HL以下。
1.2研究方法
1.2.1測試材料 本實驗選用漢語清塞音與韻母/a/組合的單音節(表1)為言語測試材料,聲調均為一聲,實驗材料由一名25歲的成年女性用標準普通話朗讀,平均言語基頻為236.67 Hz。在隔聲室內用Sony Soundforge 7.0軟件單聲道錄制聲音材料,采樣頻率為44 100 Hz,錄制后對材料進行音量歸一化。采用言語聽覺科學教育部重點實驗室開發的LabView平臺下的低通濾波語音識別軟件,由一根音頻線連接至GSI 61聽力計,通過聽力計控制輸出音量在65 dB SPL,通過TDH 50壓耳式耳機播放聲音。

表1 實驗測試音節
1.2.2測試程序 首先選擇5名在讀大學生進行預實驗,采用100階巴特沃斯低通濾波器,設置起始截止頻率為300 Hz,受試者在聽某一音節時,若報告錯誤,則以100 Hz的步長上升,直至受試者在連續增長的十個步長中均正確識別。要求受試者口頭報告所聽到的音節,報告完全正確記“1”,報告錯誤記為“0”,并由測試者在軟件中輸入受試者實報的音節作為錯誤走向。通過預實驗,研究者在正式實驗中作了以下調整:①預實驗中當截止頻率為500 Hz以下時,受試者均表示無法識別,因此在正式實驗中提高了截止頻率;②預實驗中步長200 Hz的結果與100 Hz的情況基本一致,因此在正式實驗中調整了步長,縮短了實驗時間;③排除了實驗操作中可能存在的硬件、軟件問題。
正式實驗采用100階巴特沃斯低通濾波器,設置起始截止頻率為500 Hz,步長為200 Hz,受試者連續正確報告5次時停止放音,并記錄5次連續正確報告中的最低截止頻率,作為該受試者識別該音節的截止頻率,其余流程與預實驗基本一致。整個實驗在隔聲室內完成,本底噪聲低于45 dB SPL。
1.3統計學方法 本實驗用Microsoft Office Excel 2007進行數據記錄,用SPSS 16.0作數據分析處理。采用2×3×3的三因素混合實驗設計,受試者間變量為性別,有男、女兩個水平;受試者內變量為送氣方式和發音部位,其中送氣方式有送氣和不送氣兩個水平,發音部位有雙唇、舌尖、舌根三個水平。因變量為低通濾波塞音正確識別的最低截止頻率。
清塞音音節的平均截止頻率見表2。可見,識別/pa/所需的最低截止頻率均值高于6 000 Hz,其余清塞音的最低截止頻率均值均在3 000 Hz以下。識別清塞音的截止頻率由低到高依次為/ka/、/ga/、/ba/、/ta/、/da/、/pa/。

表2 不同性別受試者低通濾波漢語清塞音識別的最低截止頻率
對獲得的截止頻率進行一元方差分析,發現送氣方式和發音部位的主效應均極顯著,說明送氣方式、發音部位影響濾波塞音的識別;受試者性別的主效應不顯著。送氣方式、發音部位的交互作用極顯著;其余的交互效應均不顯著(表3)。對發音部位進行多重比較后,發現雙唇音與舌尖音(P<0.01)、雙唇音與舌根音(P<0.01)、舌尖音與舌根音(P<0.01)之間差異均有顯著統計學意義。
在同一發音部位上,雙唇送氣音/pa/與不送氣音/ba/、舌尖送氣音/ta/與不送氣音/da/、舌根送氣音/ka/與不送氣音/ga/低通濾波的最低截止頻率差異均有顯著統計學意義。其中,雙唇送氣塞音/pa/比雙唇不送氣塞音/ba/的均值高,但舌尖音、舌根音的情況下,都是不送氣塞音比送氣塞音的均值高(表4)。

表3 送氣方式、發音部位和性別對低通濾波漢語清塞音識別的影響

表4 同一發音部位不同送氣方式的影響
注:*差值=不送氣塞音最低截止頻率均值-送氣塞音均值
在不送氣塞音水平上,雙唇音/ba/與舌尖音/da/、舌尖音/da/與舌根音/ga/低通濾波的最低截止頻率的差異有極顯著統計學意義,雙唇音/ba/與舌根音/ga/的差異無統計學意義。在送氣塞音水平上,不同發音部位間兩兩差異均有顯著統計學意義(表5)。

表5 同一送氣方式不同發音部位的影響
本研究發現,影響清塞音識別的低通截止頻率的第一個主要因素是發音部位:當送氣方式相同時,除了/ba/與/ga/之間差異沒有統計學意義外,其余不同部位之間差異均有顯著統計學意義,說明發音部位影響了大部分清塞音識別的低通截止頻率。第二個主要影響因素是送氣方式:當兩個塞音的發音部位相同時,識別送氣音與不送氣音的截止頻率差異均存在顯著統計學意義。此外,發音部位和送氣方式之間還存在交互效應。舌相關的塞音(舌尖音、舌根音)中,不送氣音的截止頻率高于送氣音,唇相關的塞音(雙唇音)中,送氣音的截止頻率高于不送氣音。
從文中結果看,識別/ka/、/ga/、/ba/、/ta/、/da/的最低截止頻率均處于低中頻區域,說明識別/ka/、/ga/、/ba/、/ta/、/da/發音部位和送氣方式的聲學信息基本集中在低中頻區域。以/ka/為例,其截止頻率均值約為1 700 Hz,說明截止頻率1 700 Hz的/ka/包含了舌根送氣音的聲學線索,1 700 Hz以上的聲學信息就可作為冗余信息。
/pa/的識別情況比較特殊,與其他清塞音比較其截止頻率在高頻范圍。從聲學分析的角度來說,識別塞音發音部位可依靠輔音共振峰判斷[4],雙唇音/b/、/p/的第二共振峰在1 100~1 500 Hz左右的低頻部分[4,5]。結合本研究結果,發現/pa/在1 500 Hz時識別率曾達到50%,而在2 300~5 700 Hz的頻段之間,/pa/大量誤聽為/ta/,錯誤率超過70%,直至截止頻率達7 000 Hz以上時,/pa/的識別率才達到70%以上。吳宗濟發現/pa/中的/p/除了在中低頻區有一共振峰[5],還有一個7 kHz左右的輔音共振峰,本實驗也從另一方面證實了這點。從聽覺感知的角度來說,曾有研究提示低通截止頻率為3 500 Hz時言語基本能被識別[2],但該類實驗采用了階數較低的低通濾波器,過渡帶中遺留大量聲學信息助于識別。本實驗采用高階濾波器,排除了過渡帶的影響。結合兩者可知,聲學分析與聽覺感知之間存在著一定差異,/pa/中/p/的發音部位體現在其高頻的輔音共振峰。
男、女受試者識別低通濾波的最低截止頻率沒有差異,說明性別不影響低通濾波清塞音識別,在今后的實驗中可以不考慮男女受試者比例。
綜上所述,健聽成人識別/ba/、/da/、/ga/、/ta/、/ka/所需的截止頻率在3 000 Hz以下,識別/pa/需7 000 Hz以上。識別清塞音所需的低通截止頻率受送氣方式和發音部位的影響,但不受性別影響。同一部位不同送氣方式時,舌塞音中不送氣音的截止頻率高于送氣音,唇塞音中送氣音的截止頻率高于不送氣音。采用高階的低通濾波器可以降低過渡帶的冗余信息,更符合中樞聽覺處理評估的低冗余信息測試材料。本實驗獲得識別/ba/、/da/、/ga/、/ta/、/ka/的最小截止頻率,能為選擇低通濾波單音節詞的通帶范圍提供參考。此外,聽覺感知的機理與聲學分析之間的差異也值得進一步探索,在后續研究中將對不同韻母類型的情況及其他漢語聲母進行研究,并加入單、雙耳的比較,為進一步完善濾波言語測聽提供依據。
4 參考文獻
1 Bocca E,Calearo C,Cassinari V. A new method for testing hearing in temporal lobe tumors: preliminary report[J]. Acta Otolaryngo,1954,44:9.
2 程錦元,胡逢昶,龐慧娟,等.濾波漢語清晰度的初步介紹[J].中華耳鼻咽喉科雜志,1983,18:138.
3 蘇金霏,王寧宇,張秋航,等. 測試材料的濾波通帶對言語識別率的影響[J].中國實驗診斷學,2006,10:750.
4 曾進興. 語言病理學基礎(第二卷)[M]. 臺北: 心理出版社,1996.48~51.
5 吳宗濟,林茂燦. 實驗語音學概要[M]. 北京:高等教育出版社,1989.127~129.