999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向公安應(yīng)用的智能移動(dòng)翻譯軟件的研究與實(shí)現(xiàn)

2007-12-31 00:00:00莊梓新
計(jì)算機(jī)應(yīng)用研究 2007年11期

摘要:應(yīng)用語音中間件、嵌入式語音引擎、多語言信息服務(wù)系統(tǒng)架構(gòu)和多語言模板翻譯引擎等多項(xiàng)已處于實(shí)用化階段的高新技術(shù)成果,研發(fā)面向首都公安應(yīng)用的多語言智能移動(dòng)翻譯軟件,為首都公安干警在社會(huì)治安、出入境管理、交通管理和邊防檢查等幾個(gè)方面提供信息查詢和語言翻譯的手段,以推進(jìn)首都公安的信息化建設(shè),提高奧運(yùn)安保工作水平,適應(yīng)新時(shí)代公安工作需要。

關(guān)鍵詞:語音識(shí)別; 語音合成; 多語言信息服務(wù)系統(tǒng)架構(gòu); 多語言模板翻譯引擎

中圖分類號(hào):TP391.2文獻(xiàn)標(biāo)志碼:A

文章編號(hào):1001-3695(2007)11-0175-03

隨著我國經(jīng)濟(jì)建設(shè)和社會(huì)發(fā)展的步伐進(jìn)一步加快,各種對(duì)外國際交流合作日漸增加,我國警務(wù)人員正愈來愈多地參與國際間的警務(wù)交流與合作。因此,公安執(zhí)法和治安服務(wù)領(lǐng)域中涉外交往和治安接觸將成為全國警察的日常工作之一。特別是北京成功申辦2008年奧運(yùn)會(huì)和上海成功申辦2010年世博會(huì),對(duì)全國警察涉外治安事件處置能力和涉外治安服務(wù)水平提出了更高的要求和更緊迫的任務(wù)。在這種背景下,提出供信息查詢和語言翻譯的產(chǎn)品,用以輔助警務(wù)人員在治安、戶政、交通管理、刑事偵查、經(jīng)濟(jì)偵查、邊檢、國內(nèi)安全保衛(wèi)、消防領(lǐng)域處理涉外事務(wù)時(shí)與外國人進(jìn)行及時(shí)的交流和溝通,以推進(jìn)首都公安的信息化建設(shè),提高奧運(yùn)安保工作水平,適應(yīng)新時(shí)代公安工作需要。

1多語言智能移動(dòng)翻譯軟件的系統(tǒng)框架

多語言智能移動(dòng)翻譯軟件集成語音中間件、語音引擎和多語言信息服務(wù)系統(tǒng)架構(gòu)等多項(xiàng)已處于實(shí)用化階段的國內(nèi)外高新技術(shù)成果,研發(fā)面向公安應(yīng)用的嵌入式多語言模板翻譯引擎和多語言智能移動(dòng)終端的語音和圖形多模態(tài)用戶接口,形成面向公安應(yīng)用的智能移動(dòng)終端成果。系統(tǒng)總體框架如圖1所示。

2關(guān)鍵技術(shù)

2.1語音中間件VQL

VQL(voice query language)是Voice Insight的專利技術(shù),它能夠與各種語音引擎(ASR、TTS)集成在一起(只要VQL和語音引擎滿足接口要求),并提供了開發(fā)不同語音應(yīng)用系統(tǒng)的接口。通常一個(gè)基于VQL的語音應(yīng)用系統(tǒng)具有如圖2所示的結(jié)構(gòu)。

VQL技術(shù)具有如下的優(yōu)點(diǎn):

a)獨(dú)立于特定的語音識(shí)別引擎和語音合成引擎,并支持多種語言:美國英語、英國英語以及主要的幾個(gè)歐洲語言,如法語、荷蘭語。

b)獨(dú)立于特定的設(shè)備,適用于手持設(shè)備、無線設(shè)備(如電話、PDA)、PC、交互式電視等。

c)獨(dú)立于應(yīng)用,能夠較少重復(fù)開發(fā),并能夠適應(yīng)不同的應(yīng)用需求。

d)支持當(dāng)前主要的語音工業(yè)標(biāo)準(zhǔn),如SAPI、XML、VoiceXML、JSAPI、SAPI。

VQL的技術(shù)特征在于它的三層體系結(jié)構(gòu),即一般領(lǐng)域、特定領(lǐng)域和數(shù)據(jù)庫應(yīng)用模塊。這使得Voice-Insight既可以提供完整的VQL解決方案,也可以提供基于VQL的開發(fā)工具包,由客戶部署并開發(fā)出不同的語音應(yīng)用系統(tǒng)。VQL的顯著特點(diǎn)就是能夠?qū)F(xiàn)有的應(yīng)用系統(tǒng)轉(zhuǎn)換為語音驅(qū)動(dòng)的應(yīng)用系統(tǒng)。

2.2嵌入式語音引擎

嵌入式語音引擎的研發(fā)涉及聲學(xué)、語言學(xué)、數(shù)字信號(hào)處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科技術(shù),是信息處理領(lǐng)域的一項(xiàng)前沿技術(shù)。它通常包含語音合成和語音識(shí)別兩個(gè)獨(dú)立的子模塊。語音合成和語音識(shí)別技術(shù)是實(shí)現(xiàn)人機(jī)語音通信,并建立一個(gè)有聽、講能力的口語系統(tǒng)所必需的兩項(xiàng)關(guān)鍵技術(shù)。

嵌入式語音引擎是一套面向多種軟硬件平臺(tái)、多個(gè)語音通道的SDK應(yīng)用工具,具有易用性強(qiáng)、性能穩(wěn)定、正確率高的特點(diǎn)。它的特色還在于用戶無須進(jìn)行訓(xùn)練,引擎的設(shè)計(jì)已經(jīng)保證了非特定人這一重要特點(diǎn);API提供的管理工具使得用戶可以自如地定義自己所需的詞表和語法,以便應(yīng)付不同的應(yīng)用需求。該引擎可運(yùn)行于多種嵌入式軟件平臺(tái)和多款移動(dòng)設(shè)備上,是一個(gè)跨平臺(tái)的語音解決方案。

2.3多語言信息服務(wù)系統(tǒng)架構(gòu)

首信公司在國家“863”計(jì)劃、北京市科技計(jì)劃支持下,在掌上電腦PDA上嵌入語音識(shí)別和合成技術(shù),與電子地圖集成實(shí)現(xiàn)了漢、英雙語語音電子導(dǎo)游功能。該終端能夠通過語音命令查找所在位置和最優(yōu)路線,同時(shí)在電子地圖上實(shí)時(shí)顯示用戶當(dāng)前位置、目標(biāo)位置和路線。此外,該終端還可以實(shí)時(shí)接收用戶所定制的信息。基于該終端成果,本軟件研發(fā)了多語言信息服務(wù)系統(tǒng)構(gòu)架,該架構(gòu)可運(yùn)行于多種嵌入式軟件平臺(tái)和多款移動(dòng)設(shè)備上,可方便地集成語音中間件、語音引擎,并提供信息發(fā)布、信息定制、信息查詢、用戶界面可視化設(shè)計(jì)等功能。

2.4嵌入式多語言模板翻譯

現(xiàn)有機(jī)器翻譯方法包括基于規(guī)則、基于統(tǒng)計(jì)和基于實(shí)例的機(jī)器翻譯等。由于自然語言的復(fù)雜性,這些機(jī)器翻譯方法還沒有一種能夠徹底解決機(jī)器翻譯系統(tǒng)所涉及的各種難題。為了綜合利用這三種方法的優(yōu)點(diǎn),同時(shí)克服各自所存在的問題,一種常用辦法是將多種翻譯策略有機(jī)地集成在一起,以實(shí)現(xiàn)各種策略之間的優(yōu)勢(shì)互補(bǔ),改善系統(tǒng)的性能。

基于模板的翻譯方法就是介于基于規(guī)則和基于實(shí)例兩種方法的結(jié)合。模板可以看做是一個(gè)帶有變量的語句,而語句可以看做一種不帶變量的模板。用模板代替語句可以使很多具有相似句子結(jié)構(gòu)的語句合并成一個(gè)模板,因此模板在語料庫中出現(xiàn)的頻率要比作為其特例的語句大。為了刻畫一個(gè)語料庫中的語言現(xiàn)象,所需要的模板數(shù)量將遠(yuǎn)遠(yuǎn)少于所需要的語句數(shù)量,雖然使用模板具有的歧義可能要比一個(gè)語句的歧義多,但是在實(shí)際應(yīng)用于面向領(lǐng)域的應(yīng)用時(shí),常常可以消解模板中單個(gè)詞的多種歧義,滿足系統(tǒng)設(shè)計(jì)的需要。

同樣,模板可以看做是一個(gè)詞匯化的規(guī)則,而規(guī)則可以看做一種不帶詞匯的模板。用模板代替規(guī)則可以使在實(shí)際應(yīng)用中容易引起歧義的規(guī)則具有不同的錨點(diǎn),從而得以區(qū)分,使得對(duì)語料庫中的語言現(xiàn)象的刻畫更為準(zhǔn)確;同時(shí),雖然模板的數(shù)量較規(guī)則要大,但是要比語料庫中的實(shí)例少很多,而且由于模板中帶有變量,還增加了系統(tǒng)的歸納能力,能夠概括較語料庫中更多的語言現(xiàn)象。

本軟件研發(fā)嵌入式多語言模板翻譯引擎,以解決在嵌入式設(shè)備,資源受限條件下,大數(shù)據(jù)量、多語種翻譯引擎和設(shè)備儲(chǔ)存、計(jì)算資源有限的矛盾。圖3為嵌入式多語言模板翻譯引擎架構(gòu)。

3系統(tǒng)的實(shí)現(xiàn)

3.1類依賴關(guān)系圖

筆者完全按照軟件復(fù)用原則,盡量使產(chǎn)品具有通用性和獨(dú)立性,并采用面向?qū)ο蠹夹g(shù)來建立實(shí)現(xiàn)整個(gè)系統(tǒng),將各種問題細(xì)化為類,把系統(tǒng)設(shè)計(jì)原型分解為一系列的類對(duì)象。系統(tǒng)對(duì)象關(guān)系如圖4所示。

其中:CPoliceToneDlg類為首頁界面,它顯示了公安人員在執(zhí)勤和服務(wù)中的不同領(lǐng)域(本軟件設(shè)計(jì)了九個(gè)領(lǐng)域),用按鈕顯示;CDomainDlg類為主框架界面(圖5),它主要包括一個(gè)領(lǐng)域和場(chǎng)景選項(xiàng),自定義的列表框(CTemplateBox)和一個(gè)靜態(tài)文本框;CTemplateBox類顯示了公安干警日常工作中常用的句子;CIniFile、CTemFile文件類用于裝載語料和模板變量;CVQL類為語音引擎,包括語音識(shí)別和語音合成,人們可以通過語音識(shí)別輸入語音信息選定語句或進(jìn)行領(lǐng)域和場(chǎng)景的切換,通過語音合成技術(shù)將選定的語句朗讀出來;CPopButton類設(shè)計(jì)了一個(gè)帶有彈出式菜單的按鈕類。

3.2場(chǎng)景實(shí)例

1)軟件設(shè)計(jì)了公安人員在執(zhí)勤和服務(wù)中的九個(gè)常用領(lǐng)域,每個(gè)領(lǐng)域又包含若干個(gè)場(chǎng)景,每個(gè)

場(chǎng)景中采用的句子都是公安干警日常工作中使用頻率較高的口語,體現(xiàn)了實(shí)用性。

2)圖5為治安領(lǐng)域中的火災(zāi)事故現(xiàn)場(chǎng)處理的場(chǎng)景。列表框中列有該場(chǎng)景中警務(wù)人員常用的語

句。句中帶下畫線的詞是模板語句的變量。點(diǎn)擊鼠標(biāo)左鍵出現(xiàn)浮動(dòng)菜單可以選擇相應(yīng)的詞進(jìn)行替代。

3)加入了語音識(shí)別和語音合成技術(shù),即除了可以手動(dòng)選擇語句、切換領(lǐng)域和場(chǎng)景外,

還可以通過語音輸入選擇語句、切換領(lǐng)域和場(chǎng)景。當(dāng)點(diǎn)擊小喇叭按鈕時(shí)系統(tǒng)會(huì)朗讀翻譯語句。

4結(jié)束語

本文主要介紹了一款面向公安領(lǐng)域的在Pocket PC終端上應(yīng)用的翻譯軟件。隨著全球化經(jīng)濟(jì)的發(fā)展,國際間的交往與合作日益增多,并且伴著Internet的日益普及和發(fā)展,語言不通的問題已經(jīng)受到人們的廣泛關(guān)注,市場(chǎng)上也出現(xiàn)了許多比較成熟的翻譯產(chǎn)品。由于機(jī)器翻譯技術(shù)和嵌入式語音技術(shù)本身的限制和復(fù)雜性,在移動(dòng)終端上將翻譯技術(shù)與語音技術(shù)相結(jié)合的例子很少。本軟件成功地集成了語音中間件、嵌入式語音引擎、多語言信息服務(wù)系統(tǒng)架構(gòu)和多語言模板翻譯引擎等多項(xiàng)技術(shù),有利于促進(jìn)我國機(jī)器翻譯研究的發(fā)展,推動(dòng)語音技術(shù)和嵌入式技術(shù)的發(fā)展。由于在嵌入式方面的翻譯系統(tǒng)的可借鑒經(jīng)驗(yàn)很少,還存在一些問題,如本軟件僅限于某個(gè)領(lǐng)域,且句子數(shù)量不宜太多、句子不宜太長等。

參考文獻(xiàn):

[1]TAKEDA K.Pattern-based context-free grammars for machine translation[C]//Proc of the 34th Annual Meeting of the Association for Computational Linguistics.San Fransisco:Morgan Kaufmann Publishers,1996:144-151.

[2]McTAIT K. Translation pattern extraction and recombination for example-based machine translation[D]. Manchester:University of Manchester Institute of Science Technology,2001.

[3]WU De-kai.Stochastic inversion transduction grammars with application to segmentation bracketing and alignment of parallel corpora[C]//Proc of the 14th International Joint Conference on Artificial Intelligence.San Fransisco:Morgan Kaufmann Publishers,1995:1328-1337.

[4]SHIRAI S, BOND F, TAKAHASHI Y.A hybrid rule and example-based method for machine translation[C]//Proc of the Natural Language Processing.1997:49-54.

[5]朱躍龍,王勇,濮淼清,等. 面向?qū)ο蠹夹g(shù)的機(jī)器翻譯系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程, 2001,27(11):47-49.

[6]鄭保山,劉群,張祥.機(jī)器翻譯模板的建立原則和方法[C]//全國第五屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集. 北京:清華大學(xué)出版社,1999.

[7]胡日勒,宗成慶,徐波.基于短語結(jié)構(gòu)抽取和對(duì)齊的機(jī)器翻譯模板自動(dòng)獲取方法[C]//第二屆全國學(xué)生計(jì)算語言學(xué)研討會(huì)論文集.2004:363-368.

[8]劉群,詹衛(wèi)東,常寶寶,等.一個(gè)漢英機(jī)器翻譯系統(tǒng)的計(jì)算模型與語言模型[C]//吳泉源,錢躍良.智能計(jì)算機(jī)接口與應(yīng)用進(jìn)展——第三屆全國智能接口與智能應(yīng)用學(xué)術(shù)會(huì)議論文集.北京:電子工業(yè)出版社,1997.

“本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文”

主站蜘蛛池模板: 成年午夜精品久久精品| 日本亚洲成高清一区二区三区| 超碰色了色| 欧洲在线免费视频| 狠狠色丁香婷婷综合| 亚洲另类色| 亚洲精品视频在线观看视频| 久久久久人妻一区精品| 国产无码制服丝袜| 美女裸体18禁网站| 久久久噜噜噜久久中文字幕色伊伊| 天天爽免费视频| 欧美高清三区| 综合网久久| 欧美亚洲日韩不卡在线在线观看| 精品国产91爱| 视频一本大道香蕉久在线播放| 亚洲美女一区二区三区| 国产精品丝袜视频| 五月天在线网站| 日韩精品一区二区三区免费在线观看| 精品视频91| 免费一级无码在线网站| 国产精品午夜福利麻豆| 亚洲一区二区三区香蕉| 国产肉感大码AV无码| 精品国产成人av免费| 毛片网站在线看| 欧美另类一区| 色婷婷色丁香| 99久久精品免费看国产电影| 91精品久久久无码中文字幕vr| 国产特级毛片| 九色在线视频导航91| 亚洲人成日本在线观看| 国产一级精品毛片基地| 国产成本人片免费a∨短片| 亚洲免费毛片| 中文纯内无码H| 在线观看免费人成视频色快速| 日韩精品欧美国产在线| 成人福利视频网| 国产噜噜噜| 成人午夜视频网站| 国产三级成人| 国产在线精品人成导航| 精品三级网站| 99er这里只有精品| 国产亚洲欧美在线中文bt天堂| 日韩东京热无码人妻| 欧美高清三区| 波多野结衣无码视频在线观看| 香蕉久久永久视频| 国产男女免费完整版视频| 国产91熟女高潮一区二区| 国产成人福利在线视老湿机| 国产青青草视频| 亚洲成a人片在线观看88| 中文字幕乱码中文乱码51精品| 精品久久久久成人码免费动漫| 丁香婷婷综合激情| 国产肉感大码AV无码| 欧美在线一二区| 亚洲欧美一级一级a| 欧美a在线视频| 99视频在线精品免费观看6| 欧美另类第一页| 国产成人一区免费观看| 日韩不卡高清视频| 99精品免费在线| 亚洲人妖在线| 精品视频免费在线| 黄色国产在线| 亚洲视频无码| 真实国产乱子伦视频| 国产欧美专区在线观看| 亚洲高清资源| 91九色视频网| 久久动漫精品| 97色婷婷成人综合在线观看| 国产精品一区二区国产主播| 国产一区在线观看无码|