999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機器翻譯與基于大數據語言服務技術的創新

2013-04-29 13:03:34鄒啟立
西江月·中旬 2013年8期
關鍵詞:文本語言服務

鄒啟立

【摘 要】技術可以讓語言服務變得更加輕松,簡單。同時技術也改變了人類傳統的溝通形式,促進了人類的交流,特別跨語言文化的溝通。基于大數據的機器翻譯將是未來語言服務的主要形式和語言服務。

【關鍵詞】機器翻譯;語言服務創新

一、機器翻譯的歷史與現狀

機器翻譯(Machine Translation)就是利用計算機程序把一種語言的文本(可稱為源語言文本)翻譯成另外一種語言的文本(可稱為目標語言文本)(常寶寶,張偉1998.)。按照馮志偉(1994 , 1996)的說法,到 1980 年代,機器翻譯研究經歷了草創期 、蕭條期 、復蘇期 、繁榮期等幾個階段。草創期以 1954 年在美國喬治敦大學用 IBM 計算機進行的首次機器翻譯實驗為標志,這時的機器翻譯方法還比較簡單 , 基本上采用的是單純的查詞典和詞頻統計等方法,筆者這里稱之為樸素的統計方法。而 1964 年的 AL PAC報告將全世界的機器翻譯熱潮打入了冷宮。在 1970 年代,隨著喬姆斯基語言學的興起和人工智能研究的發展,人們普遍認為要實現機器翻譯必須對語言進行理解,在這種背景下,基于規則的機器翻譯方法開始發展起來 。進入 1980 年代以后,機器翻譯進入繁榮期,基于規則的機器翻譯方法逐步成熟,市場上出現了很多機器翻譯系統。但這種繁榮并沒有持續下去。1980年代末期到 1990 年代,人們發現基于規則的機器翻譯系統性能很難進一步提高 , 面向社會生活中使用的真實語言的時候,機器翻譯系統幾乎無法給 出有用的譯文 。筆者把這個階段稱為平臺期。也正是這個階段 ,基于語料庫的機器翻譯方法 開始被提出來并取得了一些進展,這包括基于實例的方法和基于統計的方法 。

自1954年起,世界各國許多大學已經展開了對機器翻譯的研究,但機器翻譯仍然沒有在商業領域大規模應用。然而,上世紀八十年代開始,一些翻譯服務公司開始使用一種非常原始的翻譯輔助工具,通常稱為翻譯記憶庫(TM)。TM工具將句子譯文存入數據庫,這樣一旦需要翻譯的文件重復出現同樣的句子,譯者就可以直接使用它們。基于此技術而形成的計算機輔助翻譯(CAT)便應用而生。相較TM而言,機器翻譯則指完全自動化。理論上機器翻譯能夠讓譯者失業。然而,機器翻譯技術輸出的譯文質量無法達到出版及終端用戶使用的要求。因此,專業的翻譯服務行業還將會繼續存在多年,一邊為機器翻譯改進技術,一邊對機器翻譯的譯文進行后編輯。

二、語言服務的創新

信息技術的發展促進了人類社會和文明的發展,使得世界變得越來越小,溝通越來越頻繁,翻譯量也越來越大,速度要求越來越快,甚至要即時翻譯的需求,這就為創新者提供了大量機會。這給傳統的翻譯行業帶來了巨大的挑戰。

基于大數據的移動互聯網以更大的規模,更廣泛的覆蓋,正在取代其他網絡。而和服務密切相關的技術有三種,通訊和媒體技術,互聯網和云計算技術,自然語言處理技術。云計算是互聯網技術發展的必然成果,在語言服務領域,整合呼叫中心,視頻會議等記錄,就形成了云語言服務中心。自然語言處理技術,解決人聽說讀譯的問題。

大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊(引自百度百科)。大數據對翻譯行業的重要性不可低估。大數據將推動自動翻譯向前發展。大數據將能夠應對包括機器翻譯在內的自然語言處理的不同領域的挑戰。計算機將能夠自動運行語義聚類和類型識別處理,這就意味著計算機可以識別行業領域(如醫學和放射學)和內容類型(如說明書或專利申請)。

大數據對機器翻譯技術的持續改進和定制化至關重要。由于現代機器翻譯系統需要越來越多的平行數據,而這樣大量的數據最終要達到使用傳統數據管理技術無法處理的極限,因此大數據技術已經成為決定因素。如果計算機獲得更多數據,也能夠更好地進行術語挖掘。大數據可以識別同義詞、相關術語、新詞、行業用語,并運用平行處理工具自動生成句法分類。簡單的統計翻譯模型發展成為包含(基于句法或對齊的)層次樹結構的混合模型,使得機器翻譯引擎能夠進行遠距離調序,產生更流暢、準確的譯文,這對于結構差異大的語言對更是如此。

在這個融合時代,需要翻譯的內容正進一步從文檔和軟件版本轉變成零散的文本、在多個屏幕上發布的音頻和視頻。終端用戶、大眾或病人會比現在擁有更大的控制權,他們將推動持續的翻譯流應用。這個翻譯流包含有公務類(公司、公眾、立法)、社會類、共享類、增值類以及私人類信息。

翻譯記憶軟件非常適合出版商提供的靜態文件的更新,但在翻譯用戶提交的動態內容時會顯得力不從心。機器翻譯技術將更快地走向成熟,并成為翻譯服務業采用的首選工具。機器翻譯平臺將增加新功能,使專業用戶能夠添加數據(針對特定客戶或特定產品的翻譯記憶庫、詞匯表和目標語文本),這些數據幾乎可以實時訓練和定制化翻譯引擎。

三、結語

信息技術對大型國際活動中語言服務的作用及創新,隨著改革開放,國際化的不斷深入,中國經濟各個領域都向世界敞開了大門,中國將成為全球下一個經濟中心。各種國際交流活動,在我國各大中心城市舉辦,如何讓全球各個國家,各種語言的世界組織和人民進行充分的交流和溝通,語言成為關鍵。機器翻譯可用于每一項工作,與我們過去進行的成本高、耗時長的針對通用語言對的機器翻譯開發對比而言,今后機器翻譯的個性化開發可謂是巨大的進步。它將推動翻譯記憶庫數據的不斷擴大。對于每一個新的作業,譯者將尋找匹配的數據。因此,對于數據的需求將是永遠無法滿足的。

【參考文獻】

[1]常寶寶,張偉.機器翻譯研究的現狀與發展趨勢[J].術語標準化與信息技術,1998(2). [2]馮志偉.機器翻譯研究[M].中國對外翻譯出版公司,2004.

[3]百度百科,http://baike.baidu.com/view/6954399.htm

[4]張政.計算語言學與機器翻譯導論[M].北京:外語教學與研究出版社,2010.

猜你喜歡
文本語言服務
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
在808DA上文本顯示的改善
服務在身邊 健康每一天
今日農業(2019年12期)2019-08-15 00:56:32
服務在身邊 健康每一天
今日農業(2019年10期)2019-01-04 04:28:15
服務在身邊 健康每一天
今日農業(2019年16期)2019-01-03 11:39:20
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
讓語言描寫搖曳多姿
招行30年:從“滿意服務”到“感動服務”
商周刊(2017年9期)2017-08-22 02:57:56
累積動態分析下的同聲傳譯語言壓縮
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 亚洲IV视频免费在线光看| 亚洲美女AV免费一区| 国产福利影院在线观看| 波多野结衣视频一区二区| 欧美日韩在线亚洲国产人| 伊人久久青草青青综合| 亚洲无码在线午夜电影| AV不卡在线永久免费观看| 国产视频自拍一区| 精品日韩亚洲欧美高清a| 国产丰满大乳无码免费播放| 天天做天天爱天天爽综合区| 国产a v无码专区亚洲av| av午夜福利一片免费看| 国产成人亚洲精品色欲AV| 亚洲av无码久久无遮挡| 中文字幕亚洲无线码一区女同| 亚洲成人在线网| 成人一区在线| 国产精品所毛片视频| 2021天堂在线亚洲精品专区 | 美女一级免费毛片| 91精品啪在线观看国产| 日韩av无码DVD| 综合色天天| 国产白浆视频| 啪啪国产视频| 国产草草影院18成年视频| 久久这里只有精品免费| 亚洲动漫h| 免费毛片视频| 天堂在线视频精品| 久久成人国产精品免费软件| 青青草国产在线视频| 韩国v欧美v亚洲v日本v| 日韩中文欧美| 久久精品国产国语对白| 69综合网| 99re66精品视频在线观看| 亚洲天堂区| 亚洲视频四区| 亚洲综合专区| 国产精品久久久久久久久| 久久6免费视频| 美女一级毛片无遮挡内谢| 天堂在线亚洲| 国产尤物在线播放| 欧美一级黄片一区2区| 亚洲国产黄色| 欧洲亚洲一区| 国产精品手机在线播放| 亚洲欧美一级一级a| 黄色片中文字幕| 一本大道视频精品人妻| 天堂成人av| 欧美日韩精品在线播放| 精品精品国产高清A毛片| 制服丝袜一区| 成年人国产视频| 中美日韩在线网免费毛片视频| 五月天久久婷婷| 国产一区二区三区日韩精品| 久久综合五月| 国产成人高清在线精品| 91亚瑟视频| 国产午夜精品一区二区三区软件| 国产精品成| 九九九国产| 精品丝袜美腿国产一区| 亚洲av片在线免费观看| 日韩欧美中文| 久久久精品无码一二三区| 热re99久久精品国99热| 亚洲精品福利网站| 无码高潮喷水专区久久| 亚洲综合香蕉| 亚洲人成成无码网WWW| 性喷潮久久久久久久久 | 欧美va亚洲va香蕉在线| 超碰91免费人妻| 亚洲国产综合精品一区| 亚洲视频免费在线|