張勁松,吳 靜,王穎陽
(1.北京語言大學漢語國際教育研究院,北京100083;2.北京語言大學信息科學學院,北京100083)
焦點(focus)和重音(accent)是兩個不同領域的術語。焦點是句法語義學層面的概念,國內外學者對這一概念的定義不盡相同,Ladd(1980)認為,焦點是語句中需要強調、突出的信息,根據語境又可以分為寬焦點和窄焦點。寬焦點是指整個句子都是焦點,而窄焦點是指句中的某個成分作為焦點。重音是韻律層面的概念,通常認為,重音是發音時比較用力且在語流中聽起來相比其他音節更為突出的音節(林燾,1992),根據其作用范圍可被稱為詞、短語或句重音。焦點的實現手段有詞匯、句法及語音等形式,其中句重音是窄焦點的主要實現形式,亦稱為焦點重音(focal accent,曹文,2010),它是人們語音交際中常用的重要手段。
從語音的聲學表現來看,前人研究表明,漢語焦點重音具有“三區段”特征(趙元任,1968;曹文,2010;Xu,1999,2001;王蓓,2002;賈媛,2008),當焦點音節的聲調為含有高音點的一、二、四聲時,高音點上升且調域擴大;焦點后音高驟降且調域壓縮,焦點前音高變化不大。當焦點音節為缺少高音點的三聲時,大家報告的聲學線索則有不同的看法:Xu(1999)發現焦點三聲的低音點明顯下降,王蓓(2002)則認為三聲負載重音時雖有低音點下降但更多的表現為相鄰音節的上升,賈媛(2008)則得出了焦點三聲變化復雜沒有規律性的結論。除了音高特征外,時長變化也是焦點重音的是重要輔助手段:大家一般都傾向于認為焦點音節往往時長顯著加長(趙元任,1968;Xu,1999;賈媛,2008),而曹文(2010)則認為時長是音高的輔助手段,音高受限時時長會作彌補手段,音高特征存在時則有加強重音的作用。
以往的研究顯示在對外漢語教學實踐中,焦點重音的教學是最薄弱的環節之一(魯健驥,1984)。無論是母語語調為節奏重音的英語母語學習者(Chen,2012)、亦或音高重音的日語母語學習者(朱川,1997;肖瑤,2018)、或者聲調語言的泰語母語學習者(劉妍李,2009;王功平,2018),甚或漢語方言之一的粵語學習者(魯莎莎,2014)等,他們在學習漢語的焦點重音時都存在困難,表現出焦點重音音高升幅較小、時長延長不足和少有音高落差等問題(陳文芷,1981;楊立明,1989;肖瑤,2018)。焦點重音產出不到位問題被認為是“洋腔洋調”的重要原因(魯健驥,1984;曹文,2010),改善重音教學效果是對外漢語教學的重要要求。
針對留學生在漢語焦點重音產出中存在的問題,已有的研究主要從以下兩個方面尋找解決方法:
(1)語音學知識講解為先:在向學生講清楚焦點重音的語音特點基礎上再進行焦點重音的產出教學(曹文,2010;林茂燦,2015)。
(2)聽覺模仿為主:在課堂教學實踐中,以聽覺模仿為主,試圖用比較法和模仿法來幫助學生產出焦點重音(林燾,1996;李曉朋,2012)。
以上的語調教學方法主要適用于課堂教學。囿于課堂教學中教師與學生“一對多”的模式,這些方法耗時耗力且很難大范圍推廣。并且學生的語音練習大都發生在課堂之外,單憑關于焦點重音的理論知識以及聽覺模仿方式,學生難以自檢產出焦點正確與否,進而影響到其對于語調產出的掌握。
近年來,隨著計算機語音技術發展,人們提出了利用人機交互方式,以實時圖形的方式給出語音語調的視覺反饋,從而達到幫助學生不僅可以聽到,還可以“看到”語調的目的,引導學生理解、模仿并掌握二語的語調。例如Anderson-Hsieh(1992)使用Visi-Pitch軟件讓學生同時對比教師和自己的基頻曲線,通過修正二者之間的差異改善英語語調產出;Minematsu(2017)提出了一個日語語調視覺反饋教學系統,可以實時對比基于語音合成系統生成的基頻輪廓和學生的發音參數,引導學生進行日語語調練習;Ding(2016)提出一種突出語調特征的可視化方案,可以用于研究及幫助二語學習者產出英語作為二語的語調。
相對于其他語言,針對基于實時圖形視覺反饋的漢語語調教學研究則幾乎是空白。曹文、王瑞(2010)曾經提出過利用音高曲線示意圖的漢語雙音節句焦點重音的教學方案,不過并沒有付諸教學實踐。由于漢語是聲調語言,音高曲線不僅受到語調重音的影響,還要受到聲調的調制,其可視化設計方案設計需要在表達語調作用之外,還要考慮聲調的影響。能否設計出一套有效的可視化方案,尚是一個挑戰。
基于以上考慮,本文以日本留學生為對象,研究可視化方法在漢語焦點重音訓練中的應用,具體問題包括以下幾個方面:(1)能否基于漢語焦點重音的聲學表現設計一套有效的可視化方案?(2)視聽訓練能否幫助日本學生改善焦點重音的產出?(3)基于可視化的視聽訓練與傳統的聽覺模仿訓練是否存在差異?如果存在那么差異又有什么具體表現?
針對語音語調的即時可視化視覺反饋方案,目前主要分為兩類:一類是計算機實時提取學習者的聲學參數并以圖形形式展示給學生,目前主要是反饋語音的基頻輪廓曲線,如Minematsu et al.(2017)的工作;另一類則是在聲學參數的基礎上進一步提取與音系特征有關的物理參數,再以特征凸顯的方式示意給學生,例如在Ding(2016)的工作中,他們以“圓圈”圖案表征每個音節,圓心的高度代表音節的平均音高,圓圈的直徑代表音節的絕對時長。
比較上述兩種視覺化方案,我們認為音系特征凸顯示意方案更加合理。原因在于:一方面受限于學習者的語言能力和認知能力,輸入語音中充滿了眾多的變量,如詞匯、語法、音段、音高、時長、停延、能量等等,學習者難以即時處理語音頻譜及基頻輪廓曲線中眾多的聲學變量,從而影響學習的效果。另一方面,特征凸顯原則是語音教學中被證明為行之有效的教學原則,例如李曉朋(2012)就認為教師應將夸張法與模仿法相結合,在示范重音發音時應將重音音節的音高和時長過分提高或增長,使學生留下深刻印象。因此,我們提出借鑒Ding(2016)中所使用的語調方案,根據漢語特點稍作修正,用于漢語焦點重音訓練的視覺反饋。
i.在時間橫軸-音高縱軸的xy二維平面上以圓圈代表漢語音節;
ii.圓圈圓心的x值代表音節在句中的序列號,y代表聲調的特征點音高值。聲調一、二、四聲取高音點,三聲則取低音點;
iii.圓圈的直徑大小代表音節的時間長短;
iv.音高采用半音表示,且教師模板采取男性、女性兩套發音人數據,用于減小說話人調域差異的影響;
v.時長采用相對時長表示,用于克服語速、音段、不正常停頓所造成的影響。
音高的赫茲-半音轉換公式如下:

其中St表示半音,f0表示基頻值,fref表示話者調域基頻下限值。
相對時長的計算公式如下:

其中i、j表示音節序號,di、dj表示第i、j個音節的時長,dri表示第i個音節的相對時長。需要說明的是,二語學習者的語音中經常有不正常的停頓,這部分時間被剔除在總時長的計算之外。
音節的時間切分信息來自于語音識別系統。學生的語音輸入計算機后,即經由語音識別系統進行強制對齊處理,得到聲母、韻母層級的對齊信息,進而得到各音節的相對時長參數。
圖1 給出了一個我們所開發的焦點重音可視化訓練的交互界面示意圖。在圖中我們可以看到:界面分為三個部分,上部是同文異焦錄音文本提示框,A 句為語境提示信息,B 句為發音文本,其中焦點詞以紅色提醒,按錄音按鈕即可錄入聲音;左下部為教師標準發音語調示意圖,學生會被事先提醒注意高音點、音高落差及相對時長等主要聲學特征,下面的播放按鈕按下后會播放教師的發音;右下部為學生發音的語調示意圖,在學生錄音后即時呈現,供學生對比本次發音與標準音的相似與否,其下的播放按鈕按下后可重復播放錄入的聲音。
為了評估上述所提焦點重音可視化方案的合理性,我們進行了基于視覺信息的焦點聲學特征驗證實驗?;痉椒ㄊ窃谌鐖D1 所示的顯示界面上,文本框給出同文異焦文本,在左右兩個語調示意框內給出兩個不同的焦點聲學示意圖,讓漢語母語被試判斷哪一個為同文異焦句B 文本對應的語音特征。本次實驗不提供語音信號作聽辨用。

圖1:焦點重音可視化訓練方案示意圖
實驗語料為同文異焦句(吳宗濟,2004)??紤]到雙音節組合是語調的基本單元,且雙音節可以蘊含句子的重音/焦點分布信息,可被認為是“語調核心單元”(曹文,2006),語料從雙音節句入手,共有雙音節句和三音節句。又因考慮到三聲作為焦點時的聲學表現在前人的研究中沒有一致的結論,且三聲低音點難以精準測量,本文實驗的聲調組合中排除三聲。如此,雙音節句中有9 種組合,涉及兩種焦點狀態(前焦、末焦),共18(=9×2)句話,三音節句首、末音節同調,可表示為TXT,其中T={一聲,二聲,四聲},X={一聲,二聲,四聲},三音節句中有9 種組合,涉及三種焦點狀態(前焦、中焦、末焦),共27(=9×3)句話,實驗語料總共45(=18+27)個短句。
本次實驗被試為10 名普通話水平二級甲等及以上的中國北方人,均為北京語言大學學生,平均年齡26 歲,皆無聽力障礙。其中,男性4 名,女性6 名。
實驗界面由PowerPoint 呈現,屏幕內容如圖1 所示,要求被試在沒有音頻輔助的情況下選出文本所對應的可視化圖形。在正式實驗之前,有關于漢語焦點重音聲學表現知識的簡單培訓以及少量適應性質的練習。
10 名被試關于圖示信息判斷結果的正確率如圖2 所示,個人正確率在88%到100%之間,平均值為96%。

圖2:漢語母語者判斷正確率
驗證實驗結果顯示,母語者可以僅憑借可視化程序所呈現的圖形來準確判斷漢語焦點所在的位置(實驗中96%的準確率),這表明本文所使用的焦點可視化方案能夠有效地作為焦點的視覺表征。我們如果使用該可視化方案作為焦點重音訓練的視覺提示線索,作為留學生語音學習過程中的視覺反饋,應該能夠起到“可理解性輸入”特征的作用(Krashen,1981)。根據Krashen 的輸入假說理論,這種特征作為略高于學習者現有水平的可理解性輸入,可以激活學習者已有的知識,將能夠幫助學習者理解所學內容并最終提高語言能力。
為了考察上文所提出的焦點重音視覺反饋方案對于留學生習得漢語重音的作用,我們開展了基于此方案的重音視聽訓練實驗。為了對比,我們做了另外兩組對照實驗,一組聽覺組參加傳統聽覺模仿的重音訓練實驗,另一組普通對照組則只參加實驗的測試。
4.1.1 實驗語料
實驗語料分為訓練語料、測試語料和泛化測試語料三部分,設計思路與實驗一基本一致,均為同文異焦句和與之同文本的自然焦點句?;诮虒W“由易到難”的原則,訓練語料按句子長度分為雙音節、三音節和五音節句。其中,雙音節句共9 種組合,焦點模式分前、后及無三種,總計27 句話(=9×3);三音節句為首、末音節同調的TXT 格式,共9 種組合設計,36 句話(=9×4)。五音節句不可避免地涉及到詞重音,同樣被設計為首、末雙音節同調,可表示為TT`XTT`,其中T/T`={一聲,二聲,四聲},共9 種組合設計,36 句話(=9×4),X 被固定為高平調“飛”,選用高平調的原因是:可以幫助日本學生最大程度地練習聲調的升高與降低。因此訓練語料總共99(=27+36+36)句。測試語料與訓練語料結構相同(均為同文異焦句),數量相同但所選音節不同。
音節的選取遵循以下原則:(1)選HSK5級以下較為簡單的詞匯和漢字;(2)盡量不選日本學生習得困難的聲韻母,如后鼻音韻尾,輔音 l、r、zh、ch、sh 等。
為了避免訓練過程中的練習效應,在訓練結束后,通過17 個同文異焦句對被試進行泛化測試。泛化測試語料與測試語料相比,或是句子結構相同但音節數不同,或是句子結構和音節數均不同。
4.1.2 被試
實驗被試為24 名北京語言大學在讀日本留學生,均出生于日本,母語為日語,學習漢語 1~3 年,HSK 水平 4~5 級,平均年齡 22 歲,均無聽力障礙。他們被隨機平均分配到視聽組、聽覺組及對照組中。其中,視聽組有8 名被試 (2 男 6 女),聽覺組有8 名被試 (2 男6女),對照組有8 名被試(1 男7 女)。
4.1.3 實驗流程
整個實驗采用“前測-中測-后測”的設計,流程示意圖如圖3 所示。實驗周期為8天,第1 天、第8 天僅做測試,其余6 天兩個訓練組每天進行45 分鐘左右的視聽或聽覺訓練,對照組則不參與任何訓練,第4 天訓練后加做一次中間測試。具體內容如下:

圖3:實驗流程示意圖圖
·培訓:三組被試皆參加實驗前的培訓。由實驗主試借助Praat 軟件對其進行漢語聲調音高特征、焦點重音聲學特征、語音感知、焦點產出測試等基本知識和概念進行指導。
·前測/中測/后測:被試依據測試語料的同文異焦句文本進行錄音,保存為16K 采樣率的wav 文件。錄音在安靜的錄音室進行。
·泛化測:被試依據泛化測試語料錄音,保存為wav 文件。
·視聽/聽覺訓練:訓練時,每個句子的引導界面如圖4 所示,界面提供引導句文本、語音提問、以及增加語境自然度的相關圖片。學生錄入自己的發音后,聽覺組可以對比標準發音和自己的差異,反復練習;視聽組則進入圖1 所示的焦點重音可視化訓練界面,再進行對比練習。訓練期間,主試在旁監督,如果有音段或聲調錯誤,則予以指出讓被試改正。
泛化測結束后,我們對三組被試進行了問卷調查,問題主要圍繞著關于產出焦點重音的意識、自我滿意度等主觀感受。
通過母語者聽辨、聲學參數分析、被試問卷調查三種方法對母語者及日本被試的前測、中測、后測和泛化測數據進行分析。
·母語者聽辨:日本被試每個句子焦點表達的正確與否,由3 名語言學專業的漢語母語者通過聽辨來判斷,三人不一致的情況下采用少數服從多數原則。
·聲學參數分析:提取以下音高和時長參數來考察日本被試的焦點重音產出的發展情況。

圖4:訓練引導界面示意圖
·焦點音節相對時長的話者規一化z分數
·被試問卷調查:統計問卷調查的被試主觀感受。
·統計檢驗:以重復測量方差分析及事后多重比較分析為主。
4.3.1 焦點重音產出情況分析
基于漢語母語者的聽辨結果,圖5 給出了日本被試焦點重音產出錯誤率。圖中橫軸表示不同的測試階段,縱軸表示錯誤率。整體而言,兩組訓練組(視聽、聽覺)的產出錯誤率在中測、后測階段都顯著下降,而對照組則趨勢平緩,變化較小。比較兩組訓練組,則試聽組錯誤率下降幅度更大。
對視聽組和聽覺組的數據進行事后多重比較分析,結果顯示,前測和中測(t=0.520,p=0.045;t=0.48,p=0.001),前測和后測(t=0.625,p=0.01;t=0.49,p=0.001) 均存在顯著性差異,中測和后測(t=0.105,p=0.473;t=0.01,p=0.802)均不存在顯著性差異。分別對前測、中測及后測這三個時間點上的數據進行分析,結果發現,在前測時,三組均無顯著性差異,在中測時,視聽組與對照組存在顯著性差異(p=0.003),視聽組與聽覺組無顯著性差異(p=0.496),在后測時,視聽組與聽覺組、視聽組與對照組均存在顯著性差異(p=0.011,p=0.001)。

圖5:三組被試前、中、后測焦點重音產出錯誤率
泛化測試的正確率如圖6 所示,視聽組、聽覺組與對照組的正確率分別為91%、72%和54%,統計分析的結果發現視聽組與對照組差異顯著(p=0.006),但聽覺組與對照組之間無顯著性差異。
以上結果表明,在訓練日本學生產出漢語焦點重音的實驗中,視聽訓練優于聽覺訓練,這種優勢在中測時就已顯現,在后測時達到最大化,并且這種產出效果可以泛化到新的句子結構中。

圖6:視聽組、聽覺組與對照組泛化測正確率
4.3.2 聲學參數分析
為了考查視聽訓練及聽覺訓練在提高漢語焦點重音產出中的具體表現,以下從焦點音節高音點、調域、時長三個方面的聲學參數展開討論,下文圖7~9 中橫軸皆表示不同測試階段,縱軸表示經規一化處理的聲學數據。
(1)焦點音節高音點發展變化
焦點音節高音點z 分數的發展變化如圖7所示。總體而言,視聽組、聽覺組和對照組都呈上升趨勢,視聽組上升幅度最大,聽覺組在中測時達到最大值,隨后基本保持不變,對照組的上升幅度最小。視聽組在中測時已達到母語者水平,并在后測時達到最優訓練效果,聽覺組在后測時也達到母語者水平,但與視聽組相比差距較大。
對各組日本被試的數據進行事后多重比較分析,結果顯示,無論是視聽組還是聽覺組,前測和中測(p=0.000,p=0.001)均存在顯著性差異,中測和后測(p=0.238,p=0.857) 均不存在顯著性差異。分別對前、中、后測這三個時間點上的數據作統計分析,結果顯示,前測時三組被試與母語者(p = 0.000,p = 0.000,p = 0.000) 均差異顯著,中測時視聽組與聽覺組、視聽組與母語組無顯著差異,后測時視聽組、聽覺組分別與母語者差異不顯著,但視聽組與聽覺組(p=0.008)差異顯著。

圖7:焦點音節高音點發展變化圖
以上結果說明,視聽訓練和聽覺訓練均能有效幫助被試提高焦點音節高音點的產出,視聽訓練的效果優于聽覺訓練。對照組也有提高,但是幅度較小,推測改善來自于測試的重復效應。
(2)焦點音節音域發展變化
焦點音節音域z 分數的發展變化如圖8 所示,三組日本被試呈現出不同的發展趨勢。視聽組不斷上升并在后測時達到了母語者的水平,聽覺組先上升后下降,在中測時達到了母語者水平,但在后測時回落到最初水平,對照組基本保持不變。

圖8:焦點音節音域發展變化圖
對日本被試的數據進行事后多重比較分析,結果顯示,視聽組前測和中測(p=0.013)存在顯著性差異,中測和后測不存在顯著性差異,聽覺組前測和中測(p=0.000),中測和后測(p=0.000)均存在顯著性差異,前測和后測不存在顯著性差異。分別對前、中、后測這三個時間點上的數據作多重測量方差分析,結果發現,前測時三組被試均與母語者差異顯著,但彼此間差異不顯著,中測時視聽組和聽覺組分別與母語者差異不顯著,但聽覺組與視聽組(p=0.039)差異顯著,后測時視聽組與母語者之間差異不顯著,但母語組與聽覺組(p=0.000),視聽組與聽覺組 (p = 0.000) 差異顯著。
以上結果說明,視聽訓練可以提高被試焦點音節音域的產出能力,聽覺訓練在短期內可以看到效果,但經過幾天的訓練又迅速退步,可見并不能真正提高被試音域的產出能力。對照組沒有明顯改善效應。
(3)焦點音節相對時長發展變化
焦點音節相對時長z 分數變化趨勢如圖9所示,總體的趨勢為:視聽組基本保持不變,聽覺組于中測后快速上升,對照組中測上升但后測又回落到較低水平。
對日本被試的數據進行重復測量方差分析,結果發現:視聽組內部存在不顯著性差異,聽覺組前測和后測之間(p=0.043)、中測和后測之間(p=0.038)均存在顯著性差異。分別對前、中、后測這三個時間點上的數據作進行重測量方差分析,結果發現,前測時三組被試分別與母語者存在顯著差異(p=0.045,p=0.047,p=0.03),中測時視聽組與聽覺組分別與母語組存在顯著性差異(p=0.041,p=0.036),但母語者與對照組之間不存在顯著性差異,后測時視聽組、對照組分別與母語組存在顯著性差異(p=0.036,p=0.043),但母語者與聽覺組之間不存在顯著性差異。

圖9:焦點音節相對時長發展變化圖
這說明視聽訓練不能改善學習者的焦點時長,我們推測可能是受音高特征影響,被試關注視點更多在于高音點。聽覺組在中測時相對時長延長并在后測時達到了類似母語者的水平,一個可能的原因是他們借助音高來表達焦點的能力有限,需要用時長來彌補,形成補償機制,這與曹文(2010)的結論相似。對照組在中測時由于掌握了焦點音節時長更長這一理論知識,機械地將音節時長拖長,但在后測時回落顯著,不過仍高于前測,這說明延長焦點音節時長對日本學生而言并沒有以往研究(史有為,2012)中所認為的那么難。
4.3.3 日本學生反饋分析
圖10 為日本學生關于焦點重音產出能力自我評價分數的示意圖。橫軸為7 度量表分數,縱軸為三個組別。三組被試在試驗后的評分均高于訓練前,說明視聽訓練和聽覺訓練均能提高被試的焦點產出能力,視聽訓練的效果更優,對照組自我評價得分的小幅增長,主要得益于練習效應和實驗前的指導。

圖10:日本學生焦點重音產出能力自我評價分數示意圖
針對對外漢語教學實踐中焦點重音教學困難的問題,本文提出了一套突出語調特征的可視化教學方案,并以日本留學生為被試進行了教學實驗,結果表明使用此套方案進行發音訓練的試驗組學生在正確率上取得了顯著改善,表明了該方法的有效性?;貞灾刑岬降娜齻€問題,下面進行進一步的討論。
(1)能否基于漢語焦點重音的聲學表現設計一套有效的可視化方案?
根據前人研究的結果,漢語焦點重音的聲學特征具有“三區段”特征?;诖颂卣?,我們參照Ding(2016)中的語調圖示方案,設計了凸顯焦點音節高音點、音節時長以及音高落差特點的視覺即時反饋方案,并通過漢語母語者的視覺辨別實驗,證明此方案有助于母語者準確判斷漢語焦點的位置。
(2)視聽訓練能否幫助日本學生改善焦點重音的產出?
通過三組被試,我們對比了視聽訓練、聽覺(模仿)訓練及無訓練三種方式對于焦點重音產出的影響。實驗結果表明,無論是視聽訓練,還是聽覺訓練,效果都顯著好于對照組,這表明兩種方法都有助于改善焦點重音的產出。在兩種訓練方法中,視聽訓練取得了更高的正確率,表明參加視聽訓練的被試能夠更好地掌握焦點重音正確的產出方式。另外,泛化實驗表明改善的產出能力,還可以泛化到新結構的句子中。
(3)基于可視化的視聽訓練與傳統的聽覺模仿訓練是否存在差異?如果存在那么差異又有什么具體表現?
實驗中,兩種訓練方法都顯著改善了焦點重音的產出正確率,由圖5 可見,兩種訓練之后平均錯誤率下降都超過50%。不過,二者之間也存在程度差異:聽覺(模仿)訓練的改善為51%,視聽訓練則為63.5%,視聽法的改善效果顯得更顯著。由圖6 泛化測的結果更可見:視聽法結果的正確率比聽覺(模仿)法高近20%,進一步驗證了視聽法的優越性??疾煊柧毥Y果的細節,由圖7 和圖8 可見:視聽法訓練對于提升焦點音節高音點和音域范圍都持續有效,而聽覺(模仿)訓練法對于音高這兩個關鍵特征在后期都出現了下降和衰退現象。由圖9 的相對時長結果可見:視聽組的時長特征幾乎沒有改善,而聽覺組則在后期取得了接近漢語母語者的性能。
針對以上結果原因開展分析,我們認為與以下幾種因素有關:視聽的多通道性、輸入的可理解性、視覺的監控性和選擇性注意。首先,視聽的多通道性認為多模態(視覺、聽覺)的信息有利于促進語音的感知和產出。無論是在視聽,還是在聽覺(模仿)訓練方法中,系統提供的語音及視覺信息在訓練過程中都充當了“可理解性輸入”(Krashen,1981)的角色,有利于幫助學生加強對于焦點重音聲學特征的理解,從而有助于提高產出的正確性。相較于單純的教師語音線索,直觀生動的焦點重音視覺信息更易于學生對于所學對象的理解。正如諸多前人的工作所示,基于多模態信息的視聽訓練效果往往優于基于單一聲學刺激的聽覺訓練(Massaro,1998;Hardison,2003;Hazan,2005;洪煒,2019)。
其次,雖然在某些前人研究中對于視覺信息的貢獻尚有異議(賈琳,2013),但是本文所設計的焦點重音視聽訓練方法不僅僅為學習者提供了關于焦點重音易于理解的多模態輸入信息,更提供了一種針對學習者語音產出正確與否的即時正音反饋信息。如圖1 所示,左邊提示了教師語音的關鍵特征,右邊則即時描繪學習者的練習語音特征。通過視覺比對,學習者可以獲得關于剛才發音質量的主觀評價。這樣的視覺信息即充當了提醒學生修正發音錯誤的“監控者”的角色,起到了日漸受二語教學屆廣泛重視的糾正性反饋的作用(Hossein 2017),正與“監控假說”(Krashen,1981)中“有意識的監控才能使二語者不斷地修正、練習從而最終轉換為直覺性習得”的觀點相符合。
再次,學習者的選擇性注意機制可能也在其中發揮了重要的作用。人的一切心理活動都以注意為前提(Kahneman,1973),如果同時給被試呈現多個維度的信息,他們可以選擇性地注意其中一個維度。從實驗結果來看,視聽組被試的選擇性注意可能聚焦于焦點音節的音高特征上,而對于表征時長的圓周周長采取了忽視策略。對于聽覺組的日語母語學習者而言,母語經驗中的時長敏感機制令他們選擇性地優先注意焦點音節的時長變化,雖然初期的語音學知識培訓令他們注意到焦點音高的特征,但是這一能力隨著時間進程逐漸有所退化。
最后,本研究有兩點值得注意的地方:(1)實驗二的結果與最初的可視化設計的預期不完全相符:可視化圖形中,焦點音節高音點和時長均為凸顯的視覺信息,但實驗二的結果表明視聽組被試更關注高音點而忽視時長。這可能是因為視覺通道的信息量較大且彼此間形成注意資源競爭,容易形成高知覺負載(Lavie,1995),在實際聽感上較為突出的高音點捕獲了被試大部分注意力,時長信息因此被忽視。(2)聲學參數結果和聽辨結果不完全相符:聽辨結果顯示聽覺組的訓練效果在后測時達到最佳,但在聲學參數上,僅相對時長與這一結果相符,高音點和音域與之不相符合。這可能是因為停頓的作用,聽覺組可能由于難以產出焦點,在焦點前有較長時間的停頓,而這無意中與重音前增加停延邊界(曹劍芬,2002)這一規律相符。
本研究尚存在不少待改善的空間:1)為了對比視覺信息與聽覺信息在焦點重音產出中的作用,更為嚴謹的做法應是在僅有視覺信息的情況下考察被試的訓練效果。2)本研究實驗語料均為經過設計的陳述句,但王韞佳等(2006)認為相比自然語料,較為簡單的實驗句語料可能會掩蓋研究問題的復雜程度,以后的研究可以加入適當的自然語料及其他語氣的語料。3)在聲學參數的選擇上,本研究中將焦點音節的高音點作重要衡量指標之一,但有研究認為二聲、四聲的升幅也是漢語焦點重音的表現(Shih,2000)。以上反思對后續研究應有一定的啟發。