孔 瑩
(沈陽建筑大學外國語學院,遼寧 沈陽 110168)
自20世紀80年代起,技術就一直應用在口譯實戰(zhàn)中。純人工翻譯費時費力,早已消亡。隨著人工智能發(fā)展的日益成熟,語音識別技術、文本轉換、語義分析、情感識別、語音合成等自然語言處理技術也越來越多的應用在機器翻譯中,谷歌和微軟都推出了神經網絡的機器翻譯,國內的騰訊于2018年推出騰訊君,為博鰲論壇提供口譯服務,但翻譯效果仍不理想。但不得不說,技術在口譯實戰(zhàn)中的參與程度越來越高,并且之后無論是作為主體還是客體也會以顯性或隱形的方式貫穿始終。機器翻譯包括語音識別技術、機器翻譯、語音合成三大步驟,但三大步驟發(fā)展不平衡,發(fā)展得并不理想。本文試圖將這種技術作為輔助翻譯工具,對它在口譯員譯前、譯中和譯后所起的作用進行詳細闡述,從而進一步闡述譯員與技術之間的關系。
Automatic Speech Recognition(ASR),是機器翻譯中語音識別、機器翻譯和語音合成的第一步,也是發(fā)展得最好的一步。這門交叉學科發(fā)展已有半個多世紀,國外的隱馬爾科夫模型理論HMM不斷完善,該模型是一個按照時間點劃分的預測模型,在有時間點t的一些情況下,引入一些參數和數學模型的計算,以此來預測時間點t+1的概率,之所以可以應用在語音識別上,是因為語言具有強烈的前后關聯性,比如英語中的定語從句、賓語從句等,包括they are和Iam這種固定搭配,這都可以被拿來當設定好的參數,從而用馬爾可夫來進行這些關聯和計算,從而提高語音識別的效率。到了20世紀80年代,基于HMM模型的人工神經網絡(ANN)算法意義重大,機器開始用數學模型模擬神經,還能通過反復訓練,從而自主學習和延伸。為之后APPLE、IBM重視語音識別技術、投入巨資進行研發(fā)奠定了基礎。國內對語音識別技術的研究起步雖晚,但取得了非常多的成果。
語音識別技術目前在機器口譯中發(fā)展的雖好,但后續(xù)步驟發(fā)展還在初級階段。對譯員來說,語音識別技術完全可以作為計算機輔助技術在譯前準備、實時翻譯、譯后起非常大的作用。本文也將根據人機交互的作用,進一步探討人與技術的關系。
譯前準備階段,語音識別技術其中一個發(fā)展方向是便攜性的加強,最突出的兩家一個是蘋果的Siri系統和國內專攻中文的科大訊飛。Siri更像是一個人工智能,不僅能聽懂各種語言,還能基于問題作出反應。Siri首先通過手機的揚聲器和聽筒提取聲學特征,然后借助在線強大的搜索引擎來滿足用戶的需求,完成了人機交互;科大訊飛則是專攻語音技術主要包括語音合成和語音識別兩項關鍵技術。此外,語音技術還包括語音編碼、音色轉換、口語評測、語音消噪和增強等技術,有著廣闊應用空間。口譯員譯前準備得好壞甚至可以決定整場翻譯的質量。前期大量的調查研究工作對譯員來說是非常煩瑣的一件事,但在語音識別和人工智能的幫助下,譯員可以快速鎖定自己需要了解的相關知識,將平行材料中會議素材中的語音素材轉換成文字,甚至也可以將文字材料轉換成語音材料,譯者可以邊聽邊做別的,其本質是減少人的重復性勞動投入,是對人的一定程度的解放。
譯中,語音識別通過語音特征提取、聲學模型計算、語言模型計算等途徑生成文字表達,有助于解決噪音干擾、語速過快、語音變體等因素造成的聽辨失效或低效問題,而且語音識別技術可以將說話者的話轉換成文字表達后,口譯的難度大大下降,從交傳聽譯、同傳變成了視譯。Jason S.Littlefield等人描述了一種使用說話者相關語音識別的自動轉錄系統的概念演示器。該系統旨在更有效地生成討論、訪談、會議等的文本和音頻記錄。它還允許人工更正已識別的文本并以更完整和可信賴的方式審閱筆錄。盡管該原型基于未經驗證的概念,但它打開了廣泛的可能應用和進一步開發(fā)的領域。作者提出了一種使用詞匯化信息進行翻譯的方法。基于短語的翻譯系統能夠在句子中確定翻譯開始時的點,延遲更短。經過充分的實驗,發(fā)現該方法對于減少機器翻譯的開始時間和處理時間很有用,可以在將來以各種方式加以利用。但也要注意尤其是在同傳的時候,語音識別出來的文字可能會對譯者精力分配造成影響。在進行口譯時,譯者原本是要兼顧聽力分析和輸出,語音識別技術對于習慣依賴筆記的譯員來說可以極大地減少短期記憶的壓力,但對于一個本身專注于聽的譯員來說,可能會打亂自己的精力分配,反而會影響自己的譯文質量。與此同時,語音識別技術在漢譯英和英譯漢中表現也完全不同,在中文譯員做漢譯英所起的作用要遠遠大于英譯漢時的作用,所以語音識別技術在母語翻譯成另一種語言的時候表現得更好,作者認為,根本還是譯者理解母語的速度要遠遠快于譯者理解另一種語言。但僅僅作為筆記,也減少了譯員的工作。所以,譯員還是要多和機器磨合,從而提供更高質量的翻譯服務。
譯后,語音識別技術可以將會上的錄音直接轉換成文字輸入到語料庫中,既可以為之后同樣的主題的譯前準備做后備資源,本質是將譯員從重復性勞動中解放出來,從而提供更高效翻譯服務。
口譯技術自20世紀起就一直以隱形或顯性的形式或多或少地參與到口譯中,人工智能發(fā)展潮的爆發(fā),賦予了口譯新的活力,而2020年疫情的暴發(fā),對翻譯的需求主要變成了遠程視頻口譯,遠程視頻口譯平臺也層出不窮,讓譯員可以安全地在家提供口譯服務,熟知各個遠程口譯平臺的優(yōu)缺點,給客戶提供最適合的平臺也成了譯員的工作。可見技術與人依舊是以人為核心的同時,人也依賴于技術的發(fā)展。智能化的機器口譯是對人工口譯的集成性應用。然而,這并非預示口譯活動中人的價值的喪失。相反,人將發(fā)揮包括高階思維、情感認知、文化識別,以及機器監(jiān)控等更為重要和必要的作用。因此,即使在以機器為主導的智能化口譯模態(tài)下,人的智能仍無以比擬,人的價值仍無可替代。本文探討了口譯技術中語音識別技術在譯前、譯中、譯后過程中具體是如何發(fā)揮作用的,希望能給譯員提供一定的借鑒。