薛珮蕓,張雪英
(太原理工大學 信息與計算機學院,太原 030600)
殘障人群的醫療及教育一直是我國非常重視的領域,近年來科研也逐步轉向幫助有需求的群體。根據中國殘疾人事業發展統計公報,2017年中國的聽力殘疾人群已達到40.7萬。因此,本文探究聾啞患者與正常人發音器官運動差異及聲學特性差異,精確量化患者發音障礙程度,從而為聾啞患者的診斷和治療提供可靠的臨床根據與技術支持,達到矯正各種語言缺陷、提高患者語言表達能力的目的。
近年來,發音障礙的分析方法大多是通過聲學信號特征參數研究。JAFARI et al[1]對比了聾啞患者與正常人的波斯語元音發音,研究發現元音/a/,/i/的第一共振峰和元音/a/,/o/的第二共振峰存在顯著性差異。NICOLAIDIS et al[2]在研究聽力損傷患者的發音時,對共振峰和發音時長在重讀和非重讀的情況進行了分析統計研究。TSENG et al[3]研究了聾啞患者普通話元音/a/,/i/,/u/的第一共振峰和第二共振峰的特性,還進一步探究了共振峰元音空間與可懂度的聯系。BAUDONCK et al[4]在研究佩戴助聽器和植入人工耳蝸的患者時發現,相對與正常人,聽障患者的共振峰數據有較高的標準差。
發音是一項由肌肉控制的極其復雜的運動,涉及呼吸、發音及運動系統[5]。因此,分析聾啞患者的發音情況亟需將運動學與聲學方法相結合,以提供更為全面的評估與分析。目前大部分研究借助于電子腭位儀器(EPG)、X-Ray跟蹤和磁共振成像(MRI)等方法[6-7]。三維電磁發音儀(electromagnetic articulography,EMA)(AG501;Carstens Medizinelektronik GmbH,Germany)是一種新型的可以同時采集聲學和運動學數據的高精度設備[8-10]。它是通過醫用生理膠將微小的傳感器粘于發音器官(例如唇、舌、下頜等),記錄發音時微小復雜的動作[11]。目前國內外基于EMA儀器的研究多運用于帕金森病,腦癱或肌萎縮性脊髓側索硬化癥,口癡等[12-14],但針對聾啞患者發音情況的研究頗少。
本研究將普通話6個元音/a/,/i/,/u/,/o/,/e/,/ü/的發音作為研究對象,使用EMA AG501采集聾啞學生和正常學生的發音數據,首次從聲學和運動學的角度分析兩組被試學生元音發音的差異性,進一步探究了統計學差異顯著性和相關性,因而對聾啞患者的發音評估更為全面、準確。
本項研究針對24名母語為中文的被試進行。其中病人組 (HI) 由12名來自太原聾人學校的聾啞學生組成 (6名男生和6名女生,平均年齡為16歲,范圍14~18歲),均有佩戴助聽器及接受5年以上語言康復訓練經歷,除聽力受損外,無口腔運動障礙或其它畸形,具體信息如表1所示。正常組(NH)由12名來自太原理工大學的學生組成(6名男生和6名女生,平均年齡18.5歲,范圍18~19歲),普通話水平均為二級甲等及以上,均無任何發音和聽力損傷及精神病史。

表1 聾啞學生基本信息表Table 1 Descriptive characteristics of the adolescents with hearing loss
測試材料為漢語普通話中的6個元音/a/,/i/,/u/,/o/,/e/,/ü/.以自然平穩的響度和語速、聲調統一為一聲,每個音讀3遍,最清楚的一次選作分析,測試材料出現的順序為隨機的。
利用EMA采集聲學和運動學數據,采樣頻率為250 Hz,語言測試環境噪聲控制在50 dB以下。聲學信號通過匹配的電容麥克風(the t.bone EM9600,Musikhaus Thomann e.K.,Germany)收集,將麥克風置于被試者口部前方15 cm左右,調整舒適坐姿。運動學信號通過一系列的傳感器收集,與聲學信號同時記錄在電腦上。將傳感器用無毒害的牙科粘合劑(PeriAcryl 90,Glustitch Inc.Delta,BC,Canada)粘在發音器官上。2個測試點位于舌尖表面和下唇表面,3個參考點位于鼻梁、右左耳后,用于頭部校準。
提取被試每個元音發音的第一共振峰和第二共振峰。在語音信號分析中,共振峰是一個最基本的表征語音信號特征的參數。共振峰是指在聲音的頻譜中能量相對集中的一些區域,共振峰不但是音質的決定因素,而且反映了共振腔的物理特征。元音的第一共振峰(F1)和第二共振峰(F2)與發音器官發音時的位置有著非常密切的關系。共振峰可反映說話人元音發音的質量,對語言可懂度有直接影響,因此對發音障礙患者共振峰的研究是必不可少的。其次,提取被試每個元音的發音時長。發音障礙患者多是由于肌肉運動遲緩或舌部運動缺陷造成發音不準確。發音持續時長是影響正確發音的重要因素,其通過語速、音素間間隔等來體現。語音數據用Praat(version 6.0.18,Holund)軟件分析。
提取被試舌部和唇部在元音發音時的最大位移(相對于初始狀態)。其次,提取被試舌部和唇部在元音發音時速度的峰值。正確的發音要求器官相互配合,產生準確的發音動作。舌頭和唇部是發音中的重要器官,其通過改變口腔的共鳴,產生不同的發音。特別是舌部對發音的影響頗大,其發音位置不準確是造成患者發音障礙主要的問題。運動數據用VisArtico(0.9.9,France)軟件分析。
采用數理統計軟件SSPS21.0分別對聲學和運動學數據進行獨立樣本t檢驗,當P<0.05時有顯著差異,具有統計學意義,再對聲學和運動學數據進行Pearson相關性分析。
聾啞學生和正常學生元音發音共振峰F1和F2的對比結果如表2所示。對于第一共振峰,聾啞學生在所有元音/a/,/i/,/u/,/o/,/e/,/ü/發音時F1的值均高于正常學生,其中聾啞學生和正常學生只有在元音/i/和/e/有顯著性差異,具有統計學意義(P<0.05).對于第二共振峰, 聾啞學生在元音/a/,/u/,/o/,/e/發音時F2的值高于正常學生,在元音/i/和/ü/發音時F2的值低于正常學生,其中聾啞學生和正常學生在所有元音/a/,/i/,/u/,/o/,/e/,/ü/發音時存在顯著性差異,具有統計學意義(P<0.05).此外,聾啞學生在所有元音共振峰的標準差明顯大于正常學生。

表2 兩組被試者普通話元音共振峰F1和F2的比較結果Table 2 Comparison of formant frequencies between hearing impairment and normal-hearing groups
聾啞學生和正常學生元音發音時長的對比結果如表3所示。聾啞學生在所有元音/a/,/i/,/u/,/o/,/e/,/ü/的發音時長均高于正常學生。并且聾啞學生和正常學生的發音時長在所有元音上都有顯著性差異,具有統計學意義(P<0.05).此外,聾啞學生在所有元音發音時長的標準差明顯大于正常學生。

表3 兩組被試者普通話元音發音時長的比較結果Table 3 Comparison of vowels duration between hearing impairment and normal-hearing groups
聾啞學生和正常學生元音發音時唇部和舌部最大位移的對比結果如圖1所示。對于唇部的位移數據,聾啞學生在所有元音/a/,/i/,/u/,/o/,/e/,/ü/的最大位移均明顯高于正常學生;對于舌部的位移數據,聾啞學生只有在元音/i/的最大位移明顯高于正常學生,在元音/a/,/u/,/o/,/e/,/ü/的最大位移低于正常學生。此外,聾啞學生在所有元音發音時唇部和舌部最大位移的標準差大于正常學生。
聾啞學生和正常學生元音發音時唇部和舌部最大速度的對比結果如表4所示。對于唇部的速度數據,聾啞學生在所有元音/a/,/i/,/u/,/o/,/e/,/ü/的最大速度均高于正常學生,其中聾啞學生和正常學生只有在元音/i/和/e/有顯著性差異,具有統計學意義(P<0.05);對于舌部的速度數據,聾啞學生在元音/a/,/u/,/o/,/e/,/ü/發音時的速度均低于正常學生,組間沒有顯著性差異。只有在元音/i/發音時的速度高于正常學生,組間有顯著性差異,具有統計學意義(P<0.05).此外,聾啞學生在所有元音發音時唇部和舌部最大速度的標準差大部分大于正常學生。

圖1 兩組被試者普通話元音唇部和舌部最大位移的比較結果Fig.1 Comparison of maximum displacement for lip and tongue between hearing impairment and normal-hearing groups
聾啞學生和正常學生元音發音聲學和運動學參數相關性結果如表5所示。對于元音/a/,發音時長與唇部的最大位移呈顯著的正相關性。對于元音/i/,F1和發音時長與唇部的最大位移和最大速度均呈顯著的正相關性,F2與唇部的最大位移和最大速度均呈顯著的負相關性,發音時長與舌部的最大位移和最大速度呈顯著的正相關性。對于元音/u/,F2與唇部的最大位移呈顯著的正相關性。對于元音/o/,F1、F2與唇部的最大位移和最大速度均呈顯著的正相關性。對于元音/e/和/ü/聲學和運動學參數差異不具有統計學意義。
本文通過對普通話元音/a/,/i/,/u/,/o/,/e/,/ü/發音進行數據采集,對聾啞學生和正常學生發音時聲學和運動學數據進行分析對比研究。在聲學方面,與正常學生相比,聾啞學生在所有元音的F2上有顯著差異具有統計學意義。共振峰上的差異性由多方面原因造成,由于聽覺的缺失造成反饋系統的不完整,無法正確的糾正錯誤發音,此外,聾啞學生的發音時長高于正常學生且具有統計學意義;在運動學方面,與正常學生相比,聾啞學生唇部的最大位移高于正常學生,舌部的最大位移除元音/i/之外均低于正常學生,同樣,聾啞學生唇部的最大速度均高于正常學生,舌部最大速度低于正常學生。這可能是由于聾啞學生在康復訓練中,比較容易看到唇部的發音動作,卻很難觀測到舌部的運動軌跡[15],導致唇部發音動作夸大而舌部發音動作缺失。此外,本文探究了聲學和運動學參數的相關性。與舌部運動相比,唇部的運動數據與元音發音的聲學數據具有顯著相關性參數的更多。與F1相比,F2與運動學數據具有顯著相關性參數的更多。聲學參數發音時長也是影響運動學參數的重要影響因素。

表4 兩組被試者普通話元音唇部和舌部最大速度的比較結果Table 4 Comparison of maximum speed for lip and tongue between hearing impairment and normal-hearing groups

表5 聲學參數和運動學參數相關性結果Table 5 Correlation results of acoustic and kinematic parameters
綜上所述,聾啞學生在元音發音時聲學和運動學數據都與正常學生存在較大的差異。由于聾啞患者通過視覺反饋可以清楚觀測到唇部的運動趨勢而難于看到舌部的正確發音位置,導致唇部運動較為夸大而舌部運動較小,不準確的唇部和舌部位置最終導致元音發音的缺陷。本文的研究可為聾啞患者的康復治療提供參考依據,具有理論和臨床意義。