古扎麗努爾·德力木拉提,古力努爾·艾爾肯,米吉提·阿不里米提,艾斯卡爾·艾木都拉
非漢語母語者的普通話元音和輔音感知研究
古扎麗努爾·德力木拉提,古力努爾·艾爾肯,米吉提·阿不里米提,艾斯卡爾·艾木都拉
(新疆大學信息科學與工程學院,新疆烏魯木齊 830046)
語音感知研究是語音學主要研究內容之一。為了解學習者對普通話元音和輔音的感知情況,并為漢語教學提供借鑒,拓寬言語學習模型的應用領域,減少教學的盲目性,根據第二語言習得理論模式,采用實驗語音學和統(tǒng)計學的方法,設計辨認實驗和區(qū)分實驗,分別對普通話水平處于高級和初級水平的20名維吾爾族大學生元音、塞音、擦音和塞擦音的感知情況進行研究。辨認實驗考察學習者對元音和輔音的感知反應時間和感知準確率。在區(qū)分實驗中,計算元音對的頻譜距離,輔音對的頻譜距離,以及它們的時長差異,對學習者的區(qū)分能力進行分析。實驗結果顯示高級水平學習者的感知元音和輔音的能力明顯高于初級水平學習者。學習者對發(fā)音部位靠后的元音反應時間快且感知準確率高,對于發(fā)音部位靠前的元音反應時間較慢且感知準確率低,對塞擦音的辨認準確率高,對擦音的辨認準確度最低。元音對的頻譜距離和輔音對的時長差異會影響到學習者的區(qū)分能力,但輔音對的頻譜距離和區(qū)分情況不存在密切聯(lián)系。
辨認實驗;區(qū)分實驗;語音感知;頻譜距離;時長差異
語音感知研究是語音學的課題之一,是一個動態(tài)的、多科學的研究方向[1-2],通過語音感知研究而得到的語音近似度的結果可以為語音學的研究提供現實依據。感知研究也是語音習得過程中的第一個步驟。對第二語言(L2)音系的感知模式是中介語音系的組成部分[3]。語音感知(speech perception)指的是大腦經由聽覺器官傳導而來的聲波進行語音識別的過程,在生理上,語音由耳廓收集傳入耳道,經過耳膜和聽小骨的擴大之后傳入耳蝸,再由聽覺神經傳到大腦,被大腦解碼以及編碼,即大腦對語音學特征及聽覺印象二者關系的處理過程來表現[4],感知與產出之間的相互關系已經在第二語言(L2)語音學和音韻學中進行了討論,一些研究表明,感知在第二語音的產出中起著非常重要的作用[5]。通過實驗獲取學習者的感知數據已成為第二語言習得研究中的重要環(huán)節(jié)。
本文從語音學的角度出發(fā),采用辨認實驗(Identification task)和區(qū)分實驗(Discrimination task)的方法對普通話單元音/a/, /o/, /?/, /u/, /y/, /i/和/i/元音的兩個音位變體/?/, /?/(/?/出現在zi, ci, si中, /?/出現在zhi, chi, shi, ri中)[6],雙元音/ai/, /ei/, /ao/, /ou/, /uo/, /ia/, /ie/, /ua/以及普通話塞音(/b/, /d/, /g/, /p/, /t/, /k/),塞擦音(/zh/, /z/, /j/, /c/, /ch/, /q/),擦音(/x/, /sh/, /s/)進行感知研究。基于以往影響普通話元音和輔音感知的因素,在本文中揭示了元音及輔音知覺和語言熟練程度之間的潛在關系,也調查了語言熟練程度在第二語言習得過程中的作用。
本研究實驗數據通過X-perception工具記錄和計算。為使實驗結果更加科學、可信,辨認實驗和區(qū)分實驗使用相同的學習者。辨認實驗中學習者需要用相應的按鍵來選擇所聽到的元音和輔音。通過此工具計算出學習者選擇每一個刺激之間的時間間隔,得出選擇元音和選擇輔音的正確率,再對實驗數據進行方差分析,用值和值考察兩組學習者在反應時間和準確率上的差異(值是用來評估組間差異,值表示整個擬合方程的顯著程度,越大,表示方程越顯著,擬合程度也就越好;值是衡量控制組與實驗組差異大小的指標,值小于0.05,表示兩組存在顯著差異,值小于0.01,表示兩組的差異極其顯著)。
區(qū)分實驗采用AB形式的實驗。刺激將會以ABB,BBA,AAB,BAA四種命令出現,其中AB兩個音有微小差別,中間的音則與AB中的某個音相同。實驗中所聽到的音,若跟A一樣,學習者選擇A鍵。如果跟B一樣,就選擇B鍵。再通過計算元音的頻譜距離和輔音頻譜距離以及時長差異的方法,討論學習者區(qū)分元音和輔音的能力。
計算頻譜距離需要兩個音的共振峰頻率(),所以用PRAAT語音分析軟件提取標準普通話話語者產出的目標音的第一共振峰(1)和第二共振峰(2)。用提取出來的元音共振峰參數(1、2)計算/?/-/?/、/?/-/i/、/?/-/?/之間的頻譜距離以及/uo/-/o/、/uo/-/ou/、/a/-/ia/之間的頻譜距離。用輔音共振峰計算/s/-/c/, /b/-/p/、/d/-/t/、/q/-/x/、/x/-/sh/之間的頻譜距離和提取時長參數計算時長差異。
計算頻譜距離公式為

本研究所用到的感知語料是在專門的錄音室對4名標準普通話發(fā)音人錄音而得到的。本實驗的元音感知實驗語料是256個辨認實驗語音刺激[8(單元音)或8(雙元音)×4(連續(xù))×4(發(fā)音人)]和132個區(qū)分實驗語音刺激 [11(元音組合)×4(命令)×3(發(fā)音人)]。輔音感知實驗所用的是72個辨認實驗元音刺激 [36個(帶有輔音的單子節(jié)詞)×2個(發(fā)音人)]和80個區(qū)分實驗語音刺激[10(輔音組合)×4(命令)×2(發(fā)音人)]。
本研究選取年齡為20~24歲的20位在校非漢語母語者大學生作為研究對象(均無聽力障礙)[7]。根據學習者的少數民族漢語水平等級考試(Minzu Hanyu Kaoshi, MHK)成績把學習者分為低水平組和高水平組,分組情況如表1所示。

表1 被試分組情況
2.1.1 元音辨認實驗
本實驗中學習者將對256個語音刺激進行判斷,通過工具記錄學習者選擇所聽到元音的感知反應時間以及準確率。學習者對普通話單元音和雙元音的感知反應時間如表2所示。
由表2可知,無論是高水平還是低水平學習者,對前元音/y/、/?/和元音/?/的反應都較慢,對后元音/a/, /o/, /e/的反應較快。學習者對/ua/, /uo/, /ie/和/ai/, /ou/的反應較慢,對/ei/, /ao/和/ia/的反應相對較快。通過以上結果可以推出學習者對后元音的感知反應時間比前元音的短,從而可知元音發(fā)音部位可以影響到學習者的元音感知辨認能力。

表2 元音感知反應時間(ms)
從表2還可以發(fā)現學習者對雙元音和單元音的感知反應時間有所差別,漢語跟維吾爾語屬于不同的語系,維吾爾語有8個單元音,沒有雙元音。漢語普通話不但有單元音,還有9個雙元音和4個三合元音。單元音發(fā)音時唇形和舌位不變。雙元音包含兩個因素,發(fā)音時由一個元音向另一個元音滑動。在語音學中,當聯(lián)合的兩個元音作為一個整體出現時,兩個目標元音之間有平滑的過度,也就是說,雙元音的發(fā)音牽涉到兩種不同的舌位,并且從其中一種舌位滑動到另一種舌位。雙元音發(fā)音時由起始元音以不同的平滑程度過渡到后接元音,通常兩個元音成分中有一個比較突出,另一個相對不突出。從單元音和雙元音的感知反應時間和感知準確率可知,因為雙元音對于維吾爾族學習者來說是全新的概念,所以學習者對雙元音的感知反應較慢,但是學習者母語中沒有雙元音,沒有直接受到母語的影響,雙元音的感知準確率比單元音的高。
通過對高水平和低水平普通話學習者單元音和雙元音感知反應時間分別進行單因素方差分析,得到以下結果,對于單元音,低水平組:(2.23)= 4.12,<0.01;高水平組:(2.46)=3.86,<0.01。由此可見這兩組學習者在單元音的感知反應時間上存在顯著差異。對感知反應時間進行分析,得到低水平組:(2.23)=2.16,>0.05;高水平組:(2.46)= 1.21,>0.05,由此可得兩組學習者在雙元音反應時間上不存在顯著差異。
圖1和圖2為學習者對普通話單元音和雙元音的感知準確率。
由圖1可知,低水平學習者對前元音/y/、/?/和后元音/o/、/?/的感知準確率較低,對后元音/a/、/e/、/u/和前元音/i/的感知準確率較高。舌尖元音/?/、/?/是/i/元音的音位變體,主要依靠舌尖用力的元音,舌尖元音不僅在語音性質上是特殊的,在語音系統(tǒng)的位置也是特殊的,這些音只能出現在/z/、/c/、/s/和/zh/、/ch/、/sh/中。學習者如果母語沒有舌尖元音的相似元音,對舌尖元音發(fā)音部位和發(fā)音方法的理解就會有欠缺。由圖2可知,學習者對雙元音/ia/、/ie/、/uo/的感知準確率較低,對/ai/、/ao/的感知準確率較高。

圖1 單元音感知準確率

圖2 雙元音感知準確率
通過分別對單元音和雙元音的感知準確率進行單因素方差分析,得到了單元音感知準確率高水平組:(2.14)=13.84,<0.001;低水平組:(2.13)=12.53,<0.001。由此可知兩組學習者在單元音的感知準確率上有顯著差異。雙元音感知準確率,高水平組:(2.13)=2.42,<0.05;低水平組:(2.13)=2.35,<0.05。可以得出學習者在雙元音的感知準確率上存在明顯差異。通過元音辨認實驗發(fā)現學習者對后元音的反應較快,如元音/a/、/o/、/e/、/u/;對前元音/i/、/y/的反應慢且感知準確率較低;對后響元音/ia/、/ie/、/ua/、/uo/的反應較快且準確率高;對前響元音/ai/、/ou/的反應較慢且準確率低。
2.1.2 元音區(qū)分實驗
在區(qū)分實驗中,學習者將對132個語音刺激進行區(qū)分。本實驗要求學習者根據兩個元音的相似性區(qū)分元音。再根據計算的頻譜距離結果,討論元音區(qū)分的難度。
圖3是單元音/?/-/?/、/?/-/?/、/?/-/?/、/?/-/?/、/i/-/?/、/?/-/i/的錯誤選擇次數。從圖3中可以看到/?/-/?/、/?/-/?/、/?/-/?/的區(qū)分比較難,/?/-/?/、/i/-/?/、/?/-/i/的區(qū)分比較容易。圖4為/uo/-/o/、/o/-/uo/、/uo/-/ou/、/ou/-/uo/、/a/-/ia/、/ia/-/a/的錯誤次數。從圖4中可以看出/o/-/uo/、/uo/-/o/和/uo/-/ou/的區(qū)分較難,但是/ou/-/uo/、/a/-/ia/、/ia/-/a/相對來說區(qū)分錯誤次數較少,容易區(qū)分。

圖3 元音區(qū)分實驗1的結果

圖4 元音區(qū)分實驗2的結果
元音對之間的頻譜距離計算結果如表3所示。

表3 元音對的頻譜距離和時長差異
范疇性知覺是指連續(xù)的元音刺激被感知為離散的、數量有限的語音范疇,人們對同一范疇內的語音難以區(qū)分,而對范疇間的語音則很容易識別[8]。對于單元音來說,/?/和/?/的頻譜距離小,分析雙元音得知,/uo/和/o/的頻譜距離最小,因此很難區(qū)分。/?/和/i/的頻譜距離大,因此容易區(qū)分。元音的時長差也會影響到學習者的區(qū)分能力,如/uo/-/o/、/?/-/?/之間的時長差較小,較難區(qū)分。最后進一步研究較難區(qū)分的部分元音,如圖5所示。
從圖5可以看到學習者還對后元音/?/和前元音/i/、前元音/y/和后元音/u/的區(qū)分較難,對/ao/-/ou/、/ie/-/i/的區(qū)分比較容易。通過區(qū)分實驗基于兩個元音聲學距離越大就越難區(qū)分,反之越容易區(qū)分的理論,可以得到元音的區(qū)分難度。區(qū)分實驗中還發(fā)現學習者將雙元音聽成單元音,比如/uo/-/o/、/ia/-/a/等情況。低水平學習者比高水平學習者對元音的區(qū)分能力差。隨著語言熟練程度的提高,元音區(qū)分更容易。這說明學習者的普通話水平會影響元音區(qū)分能力。

圖5 元音區(qū)分實驗3的結果
2.2.1 輔音辨認實驗
實驗中學習者將對輔音刺激語音進行判斷,表4為兩組學習者對普通話輔音的感知反應時間和感知準確率。

表4 輔音感知反應時間和準確率
由表4可知,兩組學習者對塞音的反應時間較短,對擦音的反應時間相對長一些。利用單因素方差分析對兩組學習者的輔音感知反應時間進行進一步分析,可得低水平組:(2.01)=1.51,0.05,分析表明低水平組在感知反應時間有顯著差異;高水平組:(2.01)=3.45,>0.05,高水平組對不同輔音的感知反應時間沒有顯著差異。兩組學習者感知塞音的準確率最高,感知擦音的準確率最低。高水平組和低水平組對輔音的感知反應時間和準確率存在差異,前者不僅感知反應時間短,而且感知準確率也高。在第二語言語音范疇習得中,同樣也涉及到用母語音位范疇來對第二語語音進行分類的認知過程[9]。學習者在第二語言習得過程中將經歷一個“音系重構”的過程,即學習者對已有的母語語音范疇進行修正或擴展以適應第二語言語音感知的需要[10]。維吾爾語和普通話在音位和發(fā)音方法之間有相似性,也有不同之處,維吾爾語輔音音位的發(fā)音區(qū)比普通話的發(fā)音區(qū)靠后。維吾爾語中的塞音及塞擦音是與清/濁相對應,而漢語中的塞音及塞擦音是與送氣/不送氣相對應。維吾爾語中沒有普通話中的舌尖后音/zh/、/ch/、/sh/及舌尖前音/c/;普通話中有舌尖前及舌尖后輔音,維吾爾語輔音音位中沒有這些部位的輔音。因此學習者對于這些音的辨認有一定的難度。維吾爾語的/b/, /d/, /g/和普通話的/p/, /t/, /k/是兩組發(fā)音較相近的輔音,其差別在于/b/, /d/, /g/發(fā)音時聲帶振動,是一組濁音音位;/p/, /t/, /k/發(fā)音時聲帶不振動,是一組不送氣清輔音音位。學習者會把普通話中送氣/不送氣的特征同化為母語中的一個范疇,由于送氣特征存在于維吾爾語清塞音的音位變體中,即學習者有送氣的語音經驗,可能會把維吾爾語中的清塞音的音位變體對應普通話的送氣塞音,這就表明維吾爾族學習者對于不送氣/送氣音位具有一定的區(qū)分能力,且會把非母語的送氣/不送氣特征都感知為母語中的清音范疇。因此學習者的母語可能會影響到學習者的感知準確率。本文用統(tǒng)計分析的方法計算學習者輔音感知錯誤次數,列出了學習者的感知錯誤矩陣,結果如表5所示,表中的數字表示學習者對輔音的感知辨認錯誤次數。由表5可知,學習者對塞擦音/z/、/zh/的辨認準確率高,辨認準確率最低是擦音/s/,學習者便把/s/音聽成塞擦音/c/、/c/音也被聽成/s/和/z/。學習者在塞音和塞擦音之間容易混淆,在感知塞音/b/、/p/上也有些困難。由此可知,輔音的發(fā)音方法會影響學習者輔音的辨認能力。

表5 輔音感知錯誤矩陣
2.2.2 輔音區(qū)分實驗
實驗中,學習者對80個語音刺激進行區(qū)分。要求學習者判斷每個三聯(lián)體中的哪個音與其余的音不同。從語言熟練程度等方面分析區(qū)分實驗的正確性。圖6所示是20位學習者對輔音對的區(qū)分實驗結果。
根據圖6中的柱狀圖來看,學習者對/s/-/c/, /c-s/和/x/-/sh/, /x/-/q/的區(qū)分能力比其他幾組刺激音差,容易混淆,對/b/-/p/, /d/-/t/較容易區(qū)分。

圖6 輔音區(qū)分實驗結果
表6是輔音對的時長差異和頻譜距離結果。由表6可見,因為/q/-/x/, /x/-/sh/, /s/-/c/的時長差小于其他輔音組,所以學習者容易在區(qū)分上感知模糊,產生混淆。/b/-/p/, /d/-/t/時長差比其他三組輔音的時長差大。從而可知輔音之間的時長差可以影響到學習者的區(qū)分能力。輔音頻譜距離大小排序為Sp(/x/-/sh/) 表6 輔音對的時長差異和頻譜距離 由輔音感知實驗可知,高水平組學習者的辨認準確率優(yōu)于低水平組學習者,辨認反應時間也是前者消耗的時間小于后者的反應時間。對于塞擦音和擦音的感知準確率和反應時間,兩組學習者對塞音的感知辨認準確率相對較高且反應時間短。從而可知,學習者辨認準確程度和反應時間成正比關系。本文為進一步考察學習者對輔音的感知情況設計了區(qū)分實驗,通過計算各輔音對的時長差異和頻譜差異,將計算結果和學習者的實驗數據結合在一起研究區(qū)分情況。研究發(fā)現,輔音對的時長差異可以決定學習者的區(qū)分能力,時長差異越大,越容易區(qū)分,反之會較難區(qū)分。但是輔音間的頻譜差異跟區(qū)分準確率存在一定的差異。可以推斷,輔音間的頻譜差異對學習者的區(qū)分準確率不一定會有影響。學習者對一些時長差異小的輔音容易混淆,較難區(qū)分,如:/q/-/x/、/x/-/sh/、/s/-/c/。 本文采用感知實驗的方法對普通話元音和輔音的感知問題做了研究。通過辨認實驗和區(qū)分實驗,對不同普通話水平學習者的漢語感知模式進行了研究,發(fā)現學習者的感知模式隨其第二語言水平的變化而變化。高水平組學習者感知普通話元音和輔音的能力優(yōu)于低水平組學習者。元音間的頻譜距離和輔音時長差異是影響學習者對元音對和輔音對感知區(qū)分能力的主要原因。 總之,語音感知的研究可以指導學習者了解普通話元音和輔音的發(fā)音部位。深入學習普通話元音和輔音的特征,使學習者能夠提升普通話發(fā)音的準確性,能夠對聽覺障礙患者有一定的幫助,能夠為語音識別和語音通信等應用性能的提高提供理論指導,為建立自然和諧的人機交互奠定基礎。 [1] 余爽. 適用于語音感知認證體系的信息隱藏方案研究[D]. 蘭州: 蘭州理工大學, 2016. YU Shuang. Research on information hiding in speech perception authentication system[D]. Lanzhou: Lanzhou University of Technology, 2016. [2] 顏永紅, 李軍鋒, 應冬文. 語音中元音和輔音的聽覺感知研究[J]. 應用聲學, 2013, 32(3): 231-236. YAN Yonghong, LI Junfeng, YING Dongwen. Perception of vowels and consonants in speech[J]. Journal of Applied Acoustics, 2013, 32(3): 231-236. [3] 王韞佳. 韓國,日本學生感知漢語普通話高元音的初步考察[J]. 語言教學與研究, 2001(6): 8-17. WANG Yunjia. A preliminary study of the perception of high vowels in mandarin by Korean and Japanese learners[J]. Language Teaching and Linguistic Studies, 2011(6): 8-17. [4] 楊柳新, 歐蘭清, 于洪志, 等. 漢語語音感知研究綜述[J]. 西北民族大學學報(自然科學版), 2014, 35(4): 51-56. YANG Liuxin, OU Lanqing, YU Hongzhi, et al. A survey of Chinese speech perception research[J]. Journal of Northwest University for Nationalities(Natural Science), 2014,35(4): 51-56. [5] KLUGE D C, RAUBER A S, REIS M S, et al. The relationship between the perception and production of English nasal codas by brazilian learners of English[C]//2007: 2297-2300. [6] 鄧丹. 跨語言相似度與美國學習者漢語元音習得研究[J]. 漢語學習, 2017(3): 71-84. DENG Dan. Cross-language similarity and American learners' Chinese vowel acquisition[J]. Journal of Chinese Language Learning, 2017(3): 71-84. [7] 帕麗扎提·克依木, 古力努爾·艾爾肯, 米吉提·阿不里米提, 等.不同水平的普通話學習者單字調聲調感知研究[J]. 聲學技術, 2020, 39(1): 61-68. Parizat Keyim, Gulnur Arkin, Mijit Ablimit, et al. Study on the perception of monolingual tone of mandarin learners at different levels[J]. Technical Acoustics, 2020, 39(1): 61-68. [8] 張錦玉. 漢語普通話塞音的知覺研究[J]. 云南師范大學學報(對外漢語教學與研究版), 2014, 12(3): 58-64. ZHANG Jinyu. Stop consonants in Mandarin in the perspective of perception[J]. Journal of Yunnan Normal University(Teaching and Research on Chinese As A Foreign Language Edition), 2014, 12(3): 58-64. [9] 梅麗. 泰國學習者漢語普通話塞擦音知覺的實驗研究[C]//第九屆中國語音學學術會議論文集, 2010. MEI Li. An experimental study of Thai learners' putonghua perception[C]//Proceedings of the 9th China Conference on Phonetics, 2010. [10] 薛娣, 龔箭. 學習者英語水平對其英語輔音知覺同化及識別的影響[J]. 景德鎮(zhèn)學院學報, 2017, 32(4): 15-20. XUE Di, GONG Jian. The Effect of the learner's English proficiency on the assimilation and recognition of English consonant perception[J]. Journal of Jingdezhen University, 2017, 32(4): 15-20. Research on Mandarin vowel and consonant perception based on comparative analysis Guzalnur Dilmurat, Gulnur Arkin, Mijit Ablimit, Askar Hamdulla (Institute of Information Science and Engineering, Xinjiang University, Urumqi 830046, Xinjiang, China) Speech perception research is one of the main research contents of phonetics. The purpose of this research is to understand the learner's perception of Mandarin vowels and consonants, and to provide a reference for Chinese teaching, broaden the application field of speech learning models and reduce the blindness of teaching. According to the theoretical model of second language acquisition, this paper uses experimental phonetics and statistical methods and designs identification experiments and distinction experiments to study the perception abilities of vowel, consonant, plosive, fricative and affricative for the 20 Uyghur college students who are at the advanced and junior levels of Putonghua respectively. The identification experiment examines the learner's perceived response time and perceived accuracy of vowels and consonants. In the distinction experiment, the spectral distances of vowel pairs, the spectral distances of consonant pairs and their duration differences are calculated to analyze the learner's distinction ability. The experimental results show that the ability perceiving vowels and consonants of the advanced level learners is significantly higher than that of the primary level learners; the learner's response time to the vowel at the back of the pronunciation is fast and the perception accuracy is high, however, the response time to the vowel at the front of the pronunciation is slow and the perception accuracy is low; in addition, the recognition accuracy of the affricative is high, and the lowest is for the fricative; the differences in the spectral distance of vowel pair and in the duration of consonant pair affect the learner's distinction ability, but the spectral distance of consonant pair is not closely related to distinction. identification task; discrimination task; speech perception; spectral distance; duration difference H107 A 1000-3630(2020)-02-0214-06 10.16300/j.cnki.1000-3630.2020.02.015 2018-09-05; 2018-11-22 國家973項目(2013CB329301)、國家自然科學基金項目(61662078)資助 古扎麗努爾·德力木拉提(1993-), 女, 維吾爾族, 新疆博樂人, 碩士研究生, 研究方向為語音信號處理。 艾斯卡爾·艾木都拉, E-mail: askarhamdulla@sina.com
3 結論