普通話水平測試工作在全國已經開展了近二十年,它對普通話的推廣發揮了巨大的作用。但是近年來,普通話水平測試步入了一個上下波動甚至瓶頸時期,主要表現為以下兩大方面:
眾所周知,近年來,為了更好地推進普通話水平測試現代化建設,國家語言文字部門會同相關科研單位開發了計算機輔助普通話水平測試系統(以下簡稱“機測系統”),經過驗證和試點后,已經在全國范圍內使用,基本替代了人工測試的方式。但是令人遺憾的是,使用之初所發現的不足,如對于高分數段達到一級甲等和低分數段三級乙等及以下的樣本評判的準確度等不夠理想;對于港澳地區考生的測評也不適應等問題依舊未能很好地改進。另外,機測系統是根據人工測試評分細則來進行開發設計,但實際運行中,卻采用模糊綜合評價方式來打分,對考生在每道題目測試中所反映的語音語調等問題不能很好地描述統計,以備需要時準確全面地反饋給考生,為日后進一步學習提高普通話水平提供參考。
除此之外,在全國各地推廣機測系統過程中,還遇到了以下一些問題:
(1)機測系統運行不穩定。隨著越來越多的測試站和測試員使用機測系統,機測系統不斷出現擁塞或者頁面異常等現象。盡管造成這樣的問題有多種原因,可能是公眾互聯網的問題,也可能是測試員使用的電腦配置等軟硬件問題,但一個不爭的事實是,機測系統使用的不穩定頻率越來越高,這極大影響了測試的效率。測試員經常會遇到這樣的情況:別的頁面打開都正常,但唯獨機測界面無法打開,或者打開極慢;有時候機測系統的登錄界面很快打開,但輸入用戶賬號、密碼及驗證碼等信息后,卻反復提示錯誤信息;最令人難以忍受的情況是,當聽完一個考生錄音,填寫完所有測評信息后,尤其是復審全部四題時,頁面崩潰,白白浪費了測試員精力,需要反復重新進入,重新聽評,重新填寫信息。每當遇到類似異常情況時,卻得不到及時的技術支持,嚴重影響了普通話水平測試工作的進程。
(2)機測系統評分界面設計仍有諸多不合理之處。機測系統評分界面目前主要分第四題說話項聽評和全四題復審兩種。盡管大部分信息填寫和分數輸入都設計較友好,但有一些細節雖幾經改進卻仍有不合理之處。比如,評分細則特別是針對計算機輔助測試中出現的新問題所制定的補充細則里提到的“朗讀文本”等現象未設置打分區域(見圖1,P92),只能借用別的評分項填寫。有時在填寫一些備注信息說明考生問題時,提供的文本框可錄入字數有限,不能完整表述。
另外,之前的機測版本比較好的功能卻因故取消,比如對第四題說話項自動統計考生缺時時間,供測試員參考。取消之后,很多說話不流暢考生斷斷續續地停頓,需要測試員人工反復回聽,在遇到網絡不暢,經常因為緩沖而暫停播放錄音時,還要眼睛不離屏幕地去關注。花費大量的精力來做這種沒有技術含量的工作,非常不值。
打分對象框的字號大小和醒目程度也存在一定問題,每道題扣分的數值通常是最重要的信息,而記錄錯誤個數信息僅是參考。但目前的界面卻把語音錯誤個數、缺時等信息凸顯出來,經常造成測試員在操作填寫信息時,忘記了輸入扣分項,出現失誤。

圖1
除此之外,在提交評分前的確認提示框里所顯示的各項扣分信息也很不醒目,同樣容易造成誤操作。
盡管該系統對每位擁有機測帳號的測試員都設計了工作量統計等管理信息。但是在分類排序、測試信息的顯示上非常不直觀,不能簡明清晰地反應一段時期測試員完成的工作量情況,對各測試站發放薪酬、評價測評誤差等業務水平帶來了很大的困難。同時很多任務編號(見圖2)在顯示的時候,完全雷同,例如“測試任務名稱”“測試任務編號”等不能明顯區別各測試錄音文件,這些對測試員而言意義不大的信息完全可以屏蔽,取而代之顯示一些對測試員有幫助的文字信息。

圖2
第四題說話項是兩位測試員背對背打分,會出現一些分差較大的結果,只能將這批錄音再發送給另一批測試員重聽。盡管這樣的方式有助于更公平公正評價成績,但一批數據只要有一例成績異常,就會影響整批成績的確定,大大延長了成績確認的周期,這種現象亟待改善。
盡管從中央到地方,早就開展了很多語言文字科研工作,也取得了很多令人矚目的成果。但相比之下,普通話水平測試領域的科研則一直處于不太被看重的地位。特別是近些年,計算機輔助普通話水平測試系統的開發和使用,更加暴露了科技攻關、抱團發展的不足。目前只有安徽科大訊飛一家技術公司在進行普通話水平測試智能化的科研及市場化運作。但是在使用過程中,技術人員和一線測試員之間的信息互通明顯不夠,造成了很多實際測試中遇到的特殊問題沒有能夠及時應對。而基層測試員在測試過程中記錄的考生情況,相關的數據上傳到主服務器后也無法共享并開展對比研究。掌握大量機測數據的技術部門沒有精力和能力去做進一步的研究改進,而一線測試隊伍想開展相關研究,卻無法得到詳盡的數據,甚至是本測試站的數據也無法獲取。這極大挫傷了各基層測試站開展科研工作的積極性,降低了出高質量實用性強的科研成果的可能性,嚴重阻礙了普通話水平測試現代化手段改革的步伐。
在實行機測的過程中,出現了一些新的情況,盡管一些地區測試管理部門積極出臺了一些應對措施,但還沒有統一上升到全國一把尺子的地步。各種補充規定,隨著機測工作的不斷深入,還需要不斷改善,但這些工作明顯滯后。比如,目前機測中,不少考生為了走捷徑,通過網絡平臺或者其他社會輔導途徑,將很多說話話題照搬套用,一個“番茄炒雞蛋”過程被很牽強地用于多個話題中,并出現大量重復雷同的語料。但從現有的離題和無效語料的判定依據上,很多爭議未能得到及時解決,思想認識未統一。
自從上世紀90年代以來,國家語委普通話培訓測試中心已舉辦了50多期國家級普通話水平測試員培訓班,培養了數千名國家級普通話水平測試員。同時各省市自治區測試中心也分別培養了數倍于國家級測試員數量的省級普通話水平測試員。他們為我國普通話水平測試工作做了大量的艱苦工作,為在全社會推廣使用普通話作出了重大貢獻。取得測試員資格的過程是嚴格規范、公平公正的。但是近年來,隨著機測工作的普及,測試員在測試工作中所扮演的角色越來越不重要,測試員幾乎成了機測系統的陪襯,各級測試員都沒有權限在測試中掌握一些相關信息,十分被動和不透明地執行評分任務。盡管這樣的方式在一定程度上有助于公平客觀的評判,但是對于臨界情況,以及復審時骨干測試員無法掌握出現問題的全貌,可能會造成一些重復冗長的再審過程。加上測試工作的繁重,以及所得到的勞動薪酬過低,造成了大量優秀測試員的轉型和流失,經常遇到在分配測試任務時,看起來很龐大的測試員隊伍,但是測試水平穩定的可用人數卻捉襟見肘,現狀堪憂。
目前經過國測中心培訓合格的國家級測試員,在回到各地后,并沒有被跟蹤了解測試業務水平。不少省級測試中心對省級測試員則有3年一回爐,省內骨干測試員1-2年進行業務培訓考核等后續業務監管措施,基本能保證測試能力不出現大的波動。但是對于國家級測試員,各省沒有權限進行考核和管理。導致少數獲得了國家級測試員資格但之后長久不參加測試工作,業務生疏的測試員難以管理的局面。
盡管目前國測中心和各省一級測試中心,幾乎每年都舉辦新測試員培訓,不斷壯大測試員隊伍。但是隨著機測手段的全面推廣,實際參與測試工作的人數越來越少,大批測試員工作量嚴重不足,業務能力自然容易生疏下降。并且,實行機測后,測試員平時接觸的機會變得稀少,彼此在一起對業務進行交流探討變得不可能,不利于保持測試員群體對評分認識的統一。盡管目前有各種網絡通訊交流平臺,但是語言的面對面交流所產生的作用是無法替代的。同時,一個不爭的事實是,無論之前的人工測試還是機測中只聽第四題,支付測試員的勞動報酬都非常低廉,這在一定程度上,也挫傷了一些優秀測試員繼續從事該項工作的積極性,轉而把精力放在其他更有前途的學科領域研究和實踐上去了。尤其對于經常復審機測錄音的骨干測試員而言,同樣聽第四題,但往往聽到的都是評分有較大爭議、錄音比較特別的樣本,所花的精力和時間會更多,對應的勞動所得卻和普通聽評錄音樣本一樣,明顯有失公允。
盡管早在2000年國家就頒布了《中華人民共和國國家通用語言文字法》,給新時期的語言文字工作帶來了極大的促進作用。但是隨著這些年語言文字相關法規的具體實施,逐漸遇到了不少無奈和擔憂:
作為語言文字工作的重要示范窗口和表率,廣播電視電影表演行業在上世紀90年代曾一度掀起了學習強化普通話水平的熱潮,相關領域的法規、辦法也提及各級媒體從業人員應該達到的等級,對應的獎懲待遇等。比如省級及以上廣播電視媒體播音員主持人上崗前,普通話水平必須達到一級甲等。通過一甲送審情況可以看出,在1999年全國廣電系統等送國家語委普通話水平測試中心復審數達到了高峰,那時廣電系統對普通話的要求也最嚴格。但是隨著當時的廣電從業人員整體參加了普通話水平測試之后,陸陸續續加入廣電行業的新從業人員參加普通話水平測試的積極性和組織性都大幅下降,而近年來,從中央到各地方媒體,廣播電視播音員、主持人以及影視劇演員的普通話水平呈明顯滑坡狀態,各級主管部門也沒有進一步強化相應的管理措施,普通話水平在專業考核中所占比重越來越低。并且廣電文化系統在普通話業務交流上同語言文字部門的合作也不夠理想,長此以往,對整個社會的示范作用將帶來極大的負面影響。
在語言文字法頒布實施的頭幾年,各級政府和企事業單位都很積極地響應法律法規中的要求,在各自領域中開展了一系列推普及普通話測試工作。但是測試高潮過后,就沒有后續的跟進,測試工作和學習提高普通話的工作沒有持續地結合起來,造成了為了測試而測試,測試過后無事可做的局面。
普通話水平測試工作開展這么多年來,高校測試站扮演了主力軍的作用。無論是測試人次還是測試工作的持久性,學校的先天條件和氛圍,都能保證測試工作源源不斷地開展。尤其是一些非師范專業類別的高校,如武漢理工大學,在國家語言文字法的大框架下,修訂了自己的培養計劃,將普通話學習和達標列入必修素質學分范疇,極大地促進了校園普通話的推廣工作。但是令人惋惜的是,從全國范圍來看,這樣的高校太少,以至于七八年過去了,大多數高校,甚至文科比重占多數的高校,一直未能跟進,普通話水平培訓和測試的新局面始終未能進一步打開。甚至一些先期采取了普通話學習硬性舉措的高校,不斷受到考生和社會的質疑,解釋說服工作重復開展,令人無奈。
上世紀90年代開始施行的普通話水平測試,在發放的等級證書里,存在一個越來越引起爭議的環節:沒有有效期,這樣很容易產生一證管終身的弊端。我們知道,很多技能,特別是語言的學習和提高,是一個循序漸進、不斷使用不斷鞏固提高的過程,這樣才能保證水平的穩定。而現行的普通話水平等級證書,可以考多次,拿多本證書,但是卻沒有有效期。這樣對普通話培訓和測試事業將不可避免地帶來阻礙,無法保證可持續發展。為獲得普通話水平證書容易產生集中突擊、急功近利的行為。
綜上所述,普通話水平測試工作開展了近二十年,盡管取得了令人矚目的成就,開創了語言文字工作的新局面。但是在發展中遇到的各種問題,也必須正視,并且需要各方通力合作、統一步調,及時處理好這些問題,保證普通話推廣事業能穩步、健康地持續發展!
[1]宋欣橋:《普通話水平測試員實用手冊》,商務印書館2005年版。
[2]齊影:《普通話水平測試一級甲等復審十年》,第四屆全國普通話培訓測試學術研討會論文集2009年版。