楊小璽
(晉中學院 山西 晉中 030600)
對話行為具體指的是對話語句的言外力,又可以看成是淺層話語結構的內容。對話行為充分反映出對話語句還有對話人的目的,比如可以通過陳述、解釋、許諾或者是疑問等形式。不同的對話行為必然為對話理解創設了語言中不同的信息內容,在處理自然語言的過程中也有著十分廣泛地應用,比如常見的口語翻譯系統、口語對話系統以及自動摘要等。
如今,隨著國內外諸多學者對于對話行為理論地不斷深入研究和探討,先后有眾多學者嘗試著將對話意圖的相關描述應用到傳統的機器翻譯當中。比如,JANUS 系統、Verbmobil 系統以及 Sridhar 等。
現對JANUS 翻譯系統進行研究,此研究系統主要用于完成德語到英語還有德語到日語的翻譯。從這個系統的運作程序來看,源語言的語義最初被解析成了一個個單獨的中間語言,接著從中間語言進行轉換成了目標語言,實現不同語言之間的互譯。此外,JANUS 系統采取的是C-STAR 所定義的中間轉換格式,但是對話行為只是作為IF 格式中十分重要的一種。所以,對此類建立在中間語言轉換基礎之上的翻譯系統而言,對話行為只是作為一種語義呈現參與到整個翻譯階段中。
Verbmobil 是上個世紀九十年代德國聯邦教育部研發的語言技術項目之一,迄今也是十分重大的一項創新。在這個Verdmobil 語音翻譯系統中,對于對話行為的應用具體體現在如下模塊當中:其一,語音識別模塊。這個模塊的主要作用是對對話行為進行預測,也就是對語言模型實施動態過濾,目的是為了提升詞語的語音識別準確率;其二,語義評價模塊。在這個模塊中主要是通過已知的獲取的對話行為中囊括的信息內容聚焦算法,用于確定下一語句采取何種對話行為;其三,上下文信息抽取模塊,主要是用作Verbmobil 中各個模塊中的上下文信息提供,目的是為了取得較佳的翻譯結果。事實上,采用Verbmobil 系統進行翻譯,對話行為并沒有直接應用到翻譯模塊。
Sridhar 翻譯系統主要提供了一種對話行為和建立在短語統計翻譯模型二者相結合的應用方法。此系統的主要應用思路是首先建立在源語言對話行為基礎之上把訓練語言進行劃分成不同的類別,接著對不同的語言類別進行訓練使之形成翻譯模型。考慮到數據稀疏方面的問題,Sridhacr 等人選擇把基線系統當中所訓練出的短語翻譯概率表,同時加入到不同的對話行為分類語言當中,接著加入參數使之形成對短語概率實施數據平滑操作的目的。
從這可以看出,在翻譯系統當中,對話行為信息不僅僅可以應用到語音識別功能模塊,目的是為了提升翻譯系統的運作性能,同時還可以應用在建立在中間語言基礎之上的統計翻譯模型。
當前國際上比較常用的口語翻譯實現系統使用的翻譯機制是不同的,主要可以劃分成以下三種:其一是傳統翻譯方法;其二是非傳統翻譯方法;其三是人機互助混合式翻譯方法。下面將對這三種翻譯方法進行詳細論述。
傳統翻譯方法具體指的是下面四種比較常見的翻譯方法:其一是基于原則的語音翻譯方法;其二是基于事例以及模板的語音翻譯方法;其三是基于中間語言的語音方法;其四是基于傳統模型的翻譯方法。以上所列舉的四種翻譯方法都可以在文本機器當中翻譯出來,而且還可以應用到眾多商業化翻譯軟件以及實驗系統當中。所以,我們也可以把它們稱作是最為主流的幾種翻譯方法。
非傳統翻譯方法具體指的是除了以上列舉的四種傳統翻譯方法之外,最近數年來常被提起以及經常被嘗試的幾種全新的翻譯方法。雖然此類翻譯方法相比較傳統的翻譯方法而言沒有被得到廣泛地采用,然而卻是研究人員朝著如何更加高效、實用的方向不斷努力的研究成果。早在1997年,Wakita 等眾多研究人員曾經提出了可以實現局部抽取且正確翻譯的一種語音翻譯方法,主要思想是建立在事例基礎之上的口語翻譯,翻譯模塊需要對所輸入的語句實施句法以及語義分析,接著在解析結果當中找到符合既定長度以及結構的句法,和事例庫當中的某一個片段或者是例句的語義距離遠遠小于實現給定的語塊或者是片段,最終還需要通過建立在事例基礎之上的翻譯方法對符合條件的語塊以及片斷進行翻譯。此種方法方法也是比較常用的“回避困難”的一種做法。從這可以看出,翻譯方法不是單單只從輸入整句話來達到切分片斷或者是語塊的目的,往往是局部地對片斷進行切割和計算,此種做法有可能獲得的翻譯片斷和事先輸入的語句之間存在含義不相吻合的現象。此外,很多情況下,輸入整個語句之后抽取不出可用于翻譯的片斷,以至于在整個翻譯系統中無法輸入任何內容。不僅如此,采取此種口語翻譯方法和語義計算之間有著十分密切的關系。所以,必須借助高質量的語義詞典方可充分反映出不同片斷之間存在的語義距離測度模型。例如,日本德島大學任福繼教授曾經提出過一種有效的超函數翻譯方法,主要是解決當前大部分機器翻譯無法實現“信、達、雅”標準的情況下使用的,當用戶已經無法再對翻譯機器提出更多關于正確率以及可讀性的前提之下方可使用這種翻譯方法。超函數翻譯方法是建立在原語言輸入以及目標語言輸出二者之間充分地映射關系基礎之上的實現思路。總體來說,此類方法和傳統的建立在分析基礎之上的機器翻譯系統需要對原句子進行十分徹底的句法以及語義分析是完全不同的,這是一種需要借助構造 SF 達到創建原語句模板以及目標語句模板二者的對應關系的。所以在翻譯的過程中必然需要做到獲取原句SF。
此種翻譯方法具體指的是同時使用多種翻譯方法的多引擎式交互口語翻譯方法。當前大部分從事口語翻譯研究的工作人員偏向于采取推進式對話方法,也就是兩個說著不同語言的人之間通過對話實現彼此之間的信息傳遞,也指的是當其中某一方說完之后,則翻譯系統會將這個說話人所說的語句進行翻譯并且將其發送到對方,此時另一方需要通過完全聽完來自另外一方說話人所翻譯之后的語音并發音。面對這種情況,對于翻譯人員而言完全可以和說話人進行溝通,也就是說在進行翻譯之前是可以和說話人進行對話的,可以事先弄清說話人具體使用了哪些詞匯,明確對方的說話意圖。此種對話翻譯系統,對于中間翻譯角色而言必須具備的是能夠和對話人事先對話的能力,也就是說翻譯者需要和說話人之間形成交互式對話關系,而不是簡單的單向式對話傳遞。然而,當前除了比較常用的JANUS系統之外,難以看到人機交互式口語翻譯系統,大部分人通常會選擇在原語言識別以及分析技術基礎之上,通過改進傳統的識別技術以及翻譯策略達到提升系統翻譯的可讀性以及經準確,然而這種做法顯然是徒勞無獲的。主要原因在于無法預料說話人具體誰說什么以及他的表達方式是什么等等,而且說話人在說話過程中無法將標點符號說出來,人們說話往往是想到什么說什么,不會像書面語必須經過長期的深思熟慮,因此在整個過程中必然會出現說話人需要對前面說過的話做出修正的情況,面對這種情況應該讓系統不管是“聽懂”或者是“聽不懂”都必須做出翻譯,不會給機器任何提問的機會,因此這種做法顯然是不合情理的。
總體而言,在過去的相當長一段歷史中,人們國內外學者對于語音翻譯的研究顯然取得了較大的進步,然而,不管是在理論上,或者是在技術上,依然存在諸多問題需要做出進一步研究。此外,在進行口語翻譯的過程中,傳統的口語翻譯方法顯然占據較大的比重,而且具有較強的科學研究意義以及實用價值。即使現如今我國及國外學者對于口語翻譯的研究還存在諸多沒有得到解決的問題,然而必要的定位口語翻譯系統也可以應用到實際應用場合當中,尤其是可以在使用方式以及應用領域方面進行創新。切實做到從現實需求出發,做到合理利用目前已有的較為成熟的技術,突出人機交互的障礙,在未來必將大有作為。