摘要:應(yīng)用語音中間件、嵌入式語音引擎、多語言信息服務(wù)系統(tǒng)架構(gòu)和多語言模板翻譯引擎等多項(xiàng)已處于實(shí)用化階段的高新技術(shù)成果,研發(fā)面向首都公安應(yīng)用的多語言智能移動(dòng)翻譯軟件,為首都公安干警在社會(huì)治安、出入境管理、交通管理和邊防檢查等幾個(gè)方面提供信息查詢和語言翻譯的手段,以推進(jìn)首都公安的信息化建設(shè),提高奧運(yùn)安保工作水平,適應(yīng)新時(shí)代公安工作需要。
關(guān)鍵詞:語音識(shí)別; 語音合成; 多語言信息服務(wù)系統(tǒng)架構(gòu); 多語言模板翻譯引擎
中圖分類號(hào):TP391.2文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-3695(2007)11-0175-03
隨著我國經(jīng)濟(jì)建設(shè)和社會(huì)發(fā)展的步伐進(jìn)一步加快,各種對(duì)外國際交流合作日漸增加,我國警務(wù)人員正愈來愈多地參與國際間的警務(wù)交流與合作。因此,公安執(zhí)法和治安服務(wù)領(lǐng)域中涉外交往和治安接觸將成為全國警察的日常工作之一。特別是北京成功申辦2008年奧運(yùn)會(huì)和上海成功申辦2010年世博會(huì),對(duì)全國警察涉外治安事件處置能力和涉外治安服務(wù)水平提出了更高的要求和更緊迫的任務(wù)。在這種背景下,提出供信息查詢和語言翻譯的產(chǎn)品,用以輔助警務(wù)人員在治安、戶政、交通管理、刑事偵查、經(jīng)濟(jì)偵查、邊檢、國內(nèi)安全保衛(wèi)、消防領(lǐng)域處理涉外事務(wù)時(shí)與外國人進(jìn)行及時(shí)的交流和溝通,以推進(jìn)首都公安的信息化建設(shè),提高奧運(yùn)安保工作水平,適應(yīng)新時(shí)代公安工作需要。
1多語言智能移動(dòng)翻譯軟件的系統(tǒng)框架
多語言智能移動(dòng)翻譯軟件集成語音中間件、語音引擎和多語言信息服務(wù)系統(tǒng)架構(gòu)等多項(xiàng)已處于實(shí)用化階段的國內(nèi)外高新技術(shù)成果,研發(fā)面向公安應(yīng)用的嵌入式多語言模板翻譯引擎和多語言智能移動(dòng)終端的語音和圖形多模態(tài)用戶接口,形成面向公安應(yīng)用的智能移動(dòng)終端成果。系統(tǒng)總體框架如圖1所示。
2關(guān)鍵技術(shù)
2.1語音中間件VQL
VQL(voice query language)是Voice Insight的專利技術(shù),它能夠與各種語音引擎(ASR、TTS)集成在一起(只要VQL和語音引擎滿足接口要求),并提供了開發(fā)不同語音應(yīng)用系統(tǒng)的接口。通常一個(gè)基于VQL的語音應(yīng)用系統(tǒng)具有如圖2所示的結(jié)構(gòu)。
VQL技術(shù)具有如下的優(yōu)點(diǎn):
a)獨(dú)立于特定的語音識(shí)別引擎和語音合成引擎,并支持多種語言:美國英語、英國英語以及主要的幾個(gè)歐洲語言,如法語、荷蘭語。
b)獨(dú)立于特定的設(shè)備,適用于手持設(shè)備、無線設(shè)備(如電話、PDA)、PC、交互式電視等。
c)獨(dú)立于應(yīng)用,能夠較少重復(fù)開發(fā),并能夠適應(yīng)不同的應(yīng)用需求。
d)支持當(dāng)前主要的語音工業(yè)標(biāo)準(zhǔn),如SAPI、XML、VoiceXML、JSAPI、SAPI。
VQL的技術(shù)特征在于它的三層體系結(jié)構(gòu),即一般領(lǐng)域、特定領(lǐng)域和數(shù)據(jù)庫應(yīng)用模塊。這使得Voice-Insight既可以提供完整的VQL解決方案,也可以提供基于VQL的開發(fā)工具包,由客戶部署并開發(fā)出不同的語音應(yīng)用系統(tǒng)。VQL的顯著特點(diǎn)就是能夠?qū)F(xiàn)有的應(yīng)用系統(tǒng)轉(zhuǎn)換為語音驅(qū)動(dòng)的應(yīng)用系統(tǒng)。
2.2嵌入式語音引擎
嵌入式語音引擎的研發(fā)涉及聲學(xué)、語言學(xué)、數(shù)字信號(hào)處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科技術(shù),是信息處理領(lǐng)域的一項(xiàng)前沿技術(shù)。它通常包含語音合成和語音識(shí)別兩個(gè)獨(dú)立的子模塊。語音合成和語音識(shí)別技術(shù)是實(shí)現(xiàn)人機(jī)語音通信,并建立一個(gè)有聽、講能力的口語系統(tǒng)所必需的兩項(xiàng)關(guān)鍵技術(shù)。
嵌入式語音引擎是一套面向多種軟硬件平臺(tái)、多個(gè)語音通道的SDK應(yīng)用工具,具有易用性強(qiáng)、性能穩(wěn)定、正確率高的特點(diǎn)。它的特色還在于用戶無須進(jìn)行訓(xùn)練,引擎的設(shè)計(jì)已經(jīng)保證了非特定人這一重要特點(diǎn);API提供的管理工具使得用戶可以自如地定義自己所需的詞表和語法,以便應(yīng)付不同的應(yīng)用需求。該引擎可運(yùn)行于多種嵌入式軟件平臺(tái)和多款移動(dòng)設(shè)備上,是一個(gè)跨平臺(tái)的語音解決方案。
2.3多語言信息服務(wù)系統(tǒng)架構(gòu)
首信公司在國家“863”計(jì)劃、北京市科技計(jì)劃支持下,在掌上電腦PDA上嵌入語音識(shí)別和合成技術(shù),與電子地圖集成實(shí)現(xiàn)了漢、英雙語語音電子導(dǎo)游功能。該終端能夠通過語音命令查找所在位置和最優(yōu)路線,同時(shí)在電子地圖上實(shí)時(shí)顯示用戶當(dāng)前位置、目標(biāo)位置和路線。此外,該終端還可以實(shí)時(shí)接收用戶所定制的信息。基于該終端成果,本軟件研發(fā)了多語言信息服務(wù)系統(tǒng)構(gòu)架,該架構(gòu)可運(yùn)行于多種嵌入式軟件平臺(tái)和多款移動(dòng)設(shè)備上,可方便地集成語音中間件、語音引擎,并提供信息發(fā)布、信息定制、信息查詢、用戶界面可視化設(shè)計(jì)等功能。
2.4嵌入式多語言模板翻譯
現(xiàn)有機(jī)器翻譯方法包括基于規(guī)則、基于統(tǒng)計(jì)和基于實(shí)例的機(jī)器翻譯等。由于自然語言的復(fù)雜性,這些機(jī)器翻譯方法還沒有一種能夠徹底解決機(jī)器翻譯系統(tǒng)所涉及的各種難題。為了綜合利用這三種方法的優(yōu)點(diǎn),同時(shí)克服各自所存在的問題,一種常用辦法是將多種翻譯策略有機(jī)地集成在一起,以實(shí)現(xiàn)各種策略之間的優(yōu)勢(shì)互補(bǔ),改善系統(tǒng)的性能。
基于模板的翻譯方法就是介于基于規(guī)則和基于實(shí)例兩種方法的結(jié)合。模板可以看做是一個(gè)帶有變量的語句,而語句可以看做一種不帶變量的模板。用模板代替語句可以使很多具有相似句子結(jié)構(gòu)的語句合并成一個(gè)模板,因此模板在語料庫中出現(xiàn)的頻率要比作為其特例的語句大。為了刻畫一個(gè)語料庫中的語言現(xiàn)象,所需要的模板數(shù)量將遠(yuǎn)遠(yuǎn)少于所需要的語句數(shù)量,雖然使用模板具有的歧義可能要比一個(gè)語句的歧義多,但是在實(shí)際應(yīng)用于面向領(lǐng)域的應(yīng)用時(shí),常常可以消解模板中單個(gè)詞的多種歧義,滿足系統(tǒng)設(shè)計(jì)的需要。
同樣,模板可以看做是一個(gè)詞匯化的規(guī)則,而規(guī)則可以看做一種不帶詞匯的模板。用模板代替規(guī)則可以使在實(shí)際應(yīng)用中容易引起歧義的規(guī)則具有不同的錨點(diǎn),從而得以區(qū)分,使得對(duì)語料庫中的語言現(xiàn)象的刻畫更為準(zhǔn)確;同時(shí),雖然模板的數(shù)量較規(guī)則要大,但是要比語料庫中的實(shí)例少很多,而且由于模板中帶有變量,還增加了系統(tǒng)的歸納能力,能夠概括較語料庫中更多的語言現(xiàn)象。
本軟件研發(fā)嵌入式多語言模板翻譯引擎,以解決在嵌入式設(shè)備,資源受限條件下,大數(shù)據(jù)量、多語種翻譯引擎和設(shè)備儲(chǔ)存、計(jì)算資源有限的矛盾。圖3為嵌入式多語言模板翻譯引擎架構(gòu)。
3系統(tǒng)的實(shí)現(xiàn)
3.1類依賴關(guān)系圖
筆者完全按照軟件復(fù)用原則,盡量使產(chǎn)品具有通用性和獨(dú)立性,并采用面向?qū)ο蠹夹g(shù)來建立實(shí)現(xiàn)整個(gè)系統(tǒng),將各種問題細(xì)化為類,把系統(tǒng)設(shè)計(jì)原型分解為一系列的類對(duì)象。系統(tǒng)對(duì)象關(guān)系如圖4所示。
其中:CPoliceToneDlg類為首頁界面,它顯示了公安人員在執(zhí)勤和服務(wù)中的不同領(lǐng)域(本軟件設(shè)計(jì)了九個(gè)領(lǐng)域),用按鈕顯示;CDomainDlg類為主框架界面(圖5),它主要包括一個(gè)領(lǐng)域和場(chǎng)景選項(xiàng),自定義的列表框(CTemplateBox)和一個(gè)靜態(tài)文本框;CTemplateBox類顯示了公安干警日常工作中常用的句子;CIniFile、CTemFile文件類用于裝載語料和模板變量;CVQL類為語音引擎,包括語音識(shí)別和語音合成,人們可以通過語音識(shí)別輸入語音信息選定語句或進(jìn)行領(lǐng)域和場(chǎng)景的切換,通過語音合成技術(shù)將選定的語句朗讀出來;CPopButton類設(shè)計(jì)了一個(gè)帶有彈出式菜單的按鈕類。
3.2場(chǎng)景實(shí)例
1)軟件設(shè)計(jì)了公安人員在執(zhí)勤和服務(wù)中的九個(gè)常用領(lǐng)域,每個(gè)領(lǐng)域又包含若干個(gè)場(chǎng)景,每個(gè)
場(chǎng)景中采用的句子都是公安干警日常工作中使用頻率較高的口語,體現(xiàn)了實(shí)用性。
2)圖5為治安領(lǐng)域中的火災(zāi)事故現(xiàn)場(chǎng)處理的場(chǎng)景。列表框中列有該場(chǎng)景中警務(wù)人員常用的語
句。句中帶下畫線的詞是模板語句的變量。點(diǎn)擊鼠標(biāo)左鍵出現(xiàn)浮動(dòng)菜單可以選擇相應(yīng)的詞進(jìn)行替代。
3)加入了語音識(shí)別和語音合成技術(shù),即除了可以手動(dòng)選擇語句、切換領(lǐng)域和場(chǎng)景外,
還可以通過語音輸入選擇語句、切換領(lǐng)域和場(chǎng)景。當(dāng)點(diǎn)擊小喇叭按鈕時(shí)系統(tǒng)會(huì)朗讀翻譯語句。
4結(jié)束語
本文主要介紹了一款面向公安領(lǐng)域的在Pocket PC終端上應(yīng)用的翻譯軟件。隨著全球化經(jīng)濟(jì)的發(fā)展,國際間的交往與合作日益增多,并且伴著Internet的日益普及和發(fā)展,語言不通的問題已經(jīng)受到人們的廣泛關(guān)注,市場(chǎng)上也出現(xiàn)了許多比較成熟的翻譯產(chǎn)品。由于機(jī)器翻譯技術(shù)和嵌入式語音技術(shù)本身的限制和復(fù)雜性,在移動(dòng)終端上將翻譯技術(shù)與語音技術(shù)相結(jié)合的例子很少。本軟件成功地集成了語音中間件、嵌入式語音引擎、多語言信息服務(wù)系統(tǒng)架構(gòu)和多語言模板翻譯引擎等多項(xiàng)技術(shù),有利于促進(jìn)我國機(jī)器翻譯研究的發(fā)展,推動(dòng)語音技術(shù)和嵌入式技術(shù)的發(fā)展。由于在嵌入式方面的翻譯系統(tǒng)的可借鑒經(jīng)驗(yàn)很少,還存在一些問題,如本軟件僅限于某個(gè)領(lǐng)域,且句子數(shù)量不宜太多、句子不宜太長等。
參考文獻(xiàn):
[1]TAKEDA K.Pattern-based context-free grammars for machine translation[C]//Proc of the 34th Annual Meeting of the Association for Computational Linguistics.San Fransisco:Morgan Kaufmann Publishers,1996:144-151.
[2]McTAIT K. Translation pattern extraction and recombination for example-based machine translation[D]. Manchester:University of Manchester Institute of Science Technology,2001.
[3]WU De-kai.Stochastic inversion transduction grammars with application to segmentation bracketing and alignment of parallel corpora[C]//Proc of the 14th International Joint Conference on Artificial Intelligence.San Fransisco:Morgan Kaufmann Publishers,1995:1328-1337.
[4]SHIRAI S, BOND F, TAKAHASHI Y.A hybrid rule and example-based method for machine translation[C]//Proc of the Natural Language Processing.1997:49-54.
[5]朱躍龍,王勇,濮淼清,等. 面向?qū)ο蠹夹g(shù)的機(jī)器翻譯系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程, 2001,27(11):47-49.
[6]鄭保山,劉群,張祥.機(jī)器翻譯模板的建立原則和方法[C]//全國第五屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集. 北京:清華大學(xué)出版社,1999.
[7]胡日勒,宗成慶,徐波.基于短語結(jié)構(gòu)抽取和對(duì)齊的機(jī)器翻譯模板自動(dòng)獲取方法[C]//第二屆全國學(xué)生計(jì)算語言學(xué)研討會(huì)論文集.2004:363-368.
[8]劉群,詹衛(wèi)東,常寶寶,等.一個(gè)漢英機(jī)器翻譯系統(tǒng)的計(jì)算模型與語言模型[C]//吳泉源,錢躍良.智能計(jì)算機(jī)接口與應(yīng)用進(jìn)展——第三屆全國智能接口與智能應(yīng)用學(xué)術(shù)會(huì)議論文集.北京:電子工業(yè)出版社,1997.
“本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文”