999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

英語翻譯軟件翻譯準確性矯正算法設計

2018-07-27 06:50:48黃登嫻
現代電子技術 2018年14期

黃登嫻

摘 要: 傳統機器翻譯方法采用管道式逐次操作對原始語料實施詞性標識以及句法分析,獲取英語語言的句法結構,使得翻譯任務間存在的錯誤迭代傳遞、結構化實例準確性降低,導致英語語言文學翻譯準確性降低。因此,對英語語言文學中的機器翻譯準確性方法進行校對研究。設計基于知網的詞匯語義相似度以及對數線性模型,采用漢英依存樹到串的方式保存對應的雙語語料,對源語言端實施依存結構化處理,確保漢英雙語的對應關系,通過知網運算輸入需要翻譯句子(依存樹結構)同實例庫內源語言(依存樹結構)中詞匯的語義相似度。描述了機器翻譯中相似實例檢索模塊以及譯文生成模塊的實現過程,通過面向數據的翻譯模型進一步校對英語語言的準確翻譯。實驗結果表明,所提方法可得到準確率高的譯文,具有較高的準確性和穩定性。

關鍵詞: 英語翻譯軟件; 機器翻譯; 翻譯準確性; 語義相似度; 矯正算法; 迭代傳遞; 依存樹結構

中圖分類號: TN912.3?34; TP391.2 文獻標識碼: A 文章編號: 1004?373X(2018)14?0170?03

Design of translation accuracy correction algorithm for English translation software

HUANG Dengxian

(Civil Aviation Flight University of China, Guanghan 618300, China)

Abstract: In the traditional machine translation method, the syntactic structure of English language is obtained by using the pipeline?type successive operation to perform part of speech identification and syntactic analysis of the original corpus, as a result, wrong iterative transfers exist, and the accuracy of structured examples is reduced in translation tasks, which reduces the accuracy of English language and literature translation. Therefore, a proofreading study is conducted for the machine translation accuracy method in English language and literature. The HowNet?based lexical semantic similarity and logarithm linear model are designed. The Chinese?English dependency?tree?to?string mode is adopted to store the corresponding bilingual corpus, so as to perform dependent structured processing of the source language terminal, and ensure the corresponding relationship between Chinese and English. The lexical semantic similarity degree between sentences (dependency tree structure) to be translated and the source language (dependency tree structure) in the instance base is operated and input by using the HowNet. The implementation processes of the similar instance retrieval module and translation text generation module in machine translation are described. The accurate translation of English language is further proofread by means of the data?oriented translation model. The experimental results show that the proposed method can obtain translation texts with high accuracy rate, and has high accuracy and stability.

Keywords: English translation software; machine translation; translation accuracy; semantic similarity degree; correction algorithm; iterative transfer; dependency tree structure

機器翻譯是自然語言操作范圍中的關鍵,具有較高的應用價值。依據實例的機器翻譯是一種經驗主義的英語語言文學翻譯策略,其無需復雜的深層次語法以及語義的分析,提高了英語語言翻譯的效率。但是基于實例的機器翻譯方法對實例庫質量的要求較高[1]。傳統機器翻譯方法采用管道式逐次操作對原始語料實施詞性標識以及句法分析,獲取英語語言的句法結構,使得翻譯任務間存在的錯誤迭代傳遞、結構化實例準確性降低,導致英語語言文學翻譯準確性降低。針對該問題,本文研究了英語語言文學中的機器翻譯準確性方法,塑造并實現基于漢英依存樹串實例的機器翻譯系統,提高了英語機器翻譯的準確性。

1 基礎算法與模型

1.1 依存樹到串模型

依存樹到串的模型為,是一個翻譯對,D表示源語言的依存樹,S表示源語言的目標詞語串,A用于描述D與S間的詞對齊關系[2?3],依據依存樹到串雙語對齊模型的實例如圖1所示。

圖1實例上端時源語言的依存樹D,D內各街道包括詞語以及詞性兩個特征,各詞語下的英文表示單詞對應的詞性,如NN表示名詞,VV表示動詞,JJ表示形容詞等。單詞中的線段用于描述詞語間的依存關系。實例下端時中文句子對應的英文字符串序列S。上端和下端的虛線用于描述中文單詞節點同英文單詞間的對齊關系[4]。

1.2 基于知網的詞匯語義相似度

相似度的取值范圍是[0,1],不同詞語[W1],[W2]間的語義相似度為:

[Simsemantic(W1,W2)=maxi=1,2,…,n,j=1,2,…,mSim(S1i,S2i)] (1)

式中,[S1i(i=1,2,…,n)]以及[S2i(i=1,2,…,m)]用于描述詞語[W1],[W2]中存在的n個以及m個概念。兩個詞語的語義相似度是兩詞各概念相似的最高值。

詞語的概念相似度能夠采用概念的義原相似度進行描述,采用式(2)運算義原[p1]以及[p2]的相似度:

[Sim(p1,p2)=αd+α] (2)

式中:[α]是可調控參數;[d]是兩個義原在義原樹中的路徑距離,其值非負。

1.3 對數線性模型

對數線性模型采用多特征思維的判斷模型[5]。針對一個設定的句子[fJI=fI…,fj…,fJ],形成譯文[eJI=eI…,ej…,eJ],其最大熵的翻譯模型是:

[eJI=m=1MλmhmeJI,fJI] (3)

對數線性模型可拓展性強,能夠針對不同的目標要求設置對應特征,可將多種多樣的語言學方法運用到機器翻譯中。正反向翻譯概率以及譯文語言模型等特征函數,是機器翻譯系統的主要形式[6]?;诜g系統的實際要求自動設置特征函數以及相應的特權權重,依據式(3)獲取對產生的譯文評分分數最高的最優譯文。

1.4 機器翻譯系統的實現

采用Sato & Nagao方法對依存機構描述,將依存樹到串對齊實例的源語言依存樹實施形式化描述,通過匹配描述式方法對實例庫內的實例片段實施檢測,獲取輸入句子,實現相似實例檢測。匹配表達式采用替換、過濾以及增加三種方式[7?8]。在沒有依存樹架構關系層的目標語詞串中,相應的譯文表達式也隨之改變[9]。以下是源語言依存樹到串實例D3以及實例D5在實例庫中的結構展示:

D3:[c2],[購入],

[c22,[她,PN]],

[c23,[XX]]

%%我購入XX

S3:[e21,she]

[e22,buy]

[e23,XX]

%%i buy XX

A3([c21,e22],[c22,e21],[c23,e23])

%%c21[?]e22,c22[?]e21,c23[?]e23

D5:[c51,[書NN]],

[c52,[一,CD]],

[c53,[英語NN]],

[c54,本DT]

%%一本政治書

S5:[e51,a]

[e52,english]

[e53,book]

%%a english book

A5([c51,e53],[c52,e51],[c53,e52],[c54,e51])

%% c51[?]e53,c52[?]e51,c53[?]e52,c54[?]e51

實例庫中,像e21,e51這樣的標識是以單詞順序進行標號的,目標詞語串S的標號是前標中有“e”。針對例句“她購入一本英語書”,融入源語言實例D3與D5檢測獲取[c21,[r,c23[c51]]]是其中一個相應的表達式[10]。通過該目標匹配表達式獲取輸入語句的目標語譯文是:

I buy a politics book。

依據本文對數線性模型,運用的特征函數為:

1) 正反向翻譯概率,當單詞量相同,被譯句子和譯句實例間存在相同的單詞量較多,運用的特征函數會產生更正確的譯文。

2) 語言模型。產生譯文的品質用該函數來衡量,提高譯文的流暢度。本文通過目標語言的語言模型可求出目標語言中存在翻譯片段的概率。

2 實驗分析

2.1 實驗設置

實驗語料為CWMT 2015官方測評采用的漢英新聞語料,從中采集大約42萬句對英漢平行語料,當成雙語實例庫的初始語料。將CWMT 2015官方評測用的測試集當成測試集,實驗語料情況如表1所示。

2.2 實驗結果及分析

為了檢測本文系統的有效性,實驗基于表1的語料庫,對比分析本文系統、基于語義語言的機器翻譯系統以及開源的統計機器翻譯系統的翻譯結果見表2。

表2中的BLEU是對待評估譯文和參考譯文的n?單位片段實施對比分析,運算出匹配片段的數量越高,待評估的譯文質量越好。NIST是譯文質量評估的計量標準,用于評估譯文單位量譯文的質量,其值越高,說明譯文質量越佳。分析表2可得,本文系統BLEU值以及NIST值都高于其他兩種系統,說明本文機器翻譯系統的性能更優,是一種有效的英語語言文學翻譯方法。

實驗從三種翻譯系統的譯文結果中采集局部譯文實施分析,表3是測試集中語句“信息產業呈現快速發展趨勢”,采用三種翻譯系統翻譯獲取的譯文情況。

分析表3中三種翻譯系統的翻譯差異在于對“快速發展”一詞,開源的統計機器翻譯系統翻譯的譯文是“fast change”,基于語義語言的機器翻譯系統的翻譯的譯文是“keeping the momentum going”同原詞存在較高的偏差,不符合英語的語法和語義。而本文系統對該詞的翻譯結果雖然同參考翻譯語序不一致,但是語義卻滿足要求,具有較高的準確性。

表4和表5是本文系統和基于語義語言的機器翻譯系統對實驗語料庫中的語句進行英譯漢以及漢譯英的翻譯結果。兩個表中的首列是兩種系統對各句子翻譯結果的平均數,本文系統的平均數小于基于語義語言的機器翻譯系統,表明本文系統形成不準確的結果較少。分析兩個表中的第2列翻譯結果中準確翻譯的召回率,也就是準確的翻譯數比重,可以看出,本文系統的召回率更高。分析兩個表內的第3和第4列可得,本文系統的翻譯結果中首位以及前2位的正確翻譯率,比基于語義語言的機器翻譯系統高8~9個百分點以及11~13個百分點。綜合分析這些結果可得,本文系統提高了翻譯結果的準確性,具有較高的英語語言文學翻譯性能和穩定性。

3 結 論

本文對英語語言文學中的機器翻譯準確性方法進行研究,塑造并實現基于漢英依存樹串實例的機器翻譯系統,完成英語語言文學的準確翻譯。

參考文獻

[1] 汪昆,宗成慶,蘇克毅.統計機器翻譯和翻譯記憶的動態融合方法研究[J].中文信息學報,2015,29(2):87?94.

WANG Kun, ZONG Chengqing, SU Keyi. Dynamic combination of statistical machine translation and translation memory [J]. Journal of Chinese information processing, 2015, 29(2): 87?94.

[2] BAKHVALOV P A, KOZUBSKAYA T K. Modification of flux correction method for accuracy improvement on unsteady problems [J]. Journal of computational physics, 2017, 338: 199?216.

[3] 季鐸,馬斌,葉娜.交互式機器翻譯中譯文查詢行為的預測技術[J].計算機應用,2015,35(4):1009?1012.

JI Duo, MA Bin, YE Na. Prediction technology of translation query behavior in interactive machine translation [J]. Journal of computer applications, 2015, 35(4): 1009?1012.

[4] ZHANG C, CHENG Y, ZHU L, et al. Accuracy improvement of the immersed boundary: lattice Boltzmann coupling scheme by iterative force correction [J]. Computers & fluids, 2016, 124: 246?260.

[5] 李英軍.機器翻譯與翻譯技術研究的現狀與展望:伯納德·馬克·沙特爾沃思訪談錄[J].中國科技翻譯,2014,27(1):24?27.

LI Yingjun. The present situation and prospect of the research on machine translation and translation technology: an interview with Bernard Mark Shuttleworth [J]. Chinese science & technology translators journal, 2014, 27(1): 24?27.

[6] 劉智穎,郭艷波,晉耀紅.漢英機器翻譯中格式轉換研究[J].計算機工程與應用,2014,50(6):192?196.

LIU Zhiying, GUO Yanbo, JIN Yaohong. Format conversion in Chinese?English machine translation [J]. Computer engineering and applications, 2014, 50(6): 192?196.

[7] 余洪英.基于決策樹的商務英語實踐教學成效評價[J].科技通報,2016,32(2):229?232.

YU Hongying. Business English practice teaching performance evaluation based on decision?making tree [J]. Bulletin of science and technology, 2016, 32(2): 229?232.

[8] 張冬梅,晉耀紅.面向專利機器翻譯的要素句蛻識別和轉換研究[J].計算機科學,2014,41(z1):67?71.

ZHANG Dongmei, JIN Yaohong. Recognition and transformation for element sub?sentences in patent machine translation [J]. Computer science 2014, 41(S1): 67?71.

[9] 李強,李沐,張冬冬,等.統計機器翻譯中實例短語對研究[J].北京大學學報(自然科學版),2016,52(1):113?119.

LI Qiang, LI Mu, ZHANG Dongdong, et al. Research on example?based phrase pairs in statistical machine translation [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(1): 113?119.

[10] PAN L, LI S, JIA H, et al. Error correction and evaluation for axis translation test technique [J]. Journal of Shenzhen University, 2017, 34(3): 259?260.

主站蜘蛛池模板: 丝袜无码一区二区三区| 亚亚洲乱码一二三四区| 91久久青青草原精品国产| 国产精品手机在线播放| 免费无码在线观看| 国产美女91视频| 日本午夜网站| 亚洲精品无码抽插日韩| 18禁影院亚洲专区| 无码一区中文字幕| 国产精品3p视频| 女同久久精品国产99国| 国产精品久久自在自线观看| 欧美性爱精品一区二区三区 | 日韩不卡免费视频| 天天做天天爱天天爽综合区| 小说 亚洲 无码 精品| 国产成人三级| 91精品福利自产拍在线观看| 欧美a在线看| 亚洲精品欧美日本中文字幕| 青青操视频在线| 毛片网站观看| 亚洲精品高清视频| 久久一日本道色综合久久| 欧美黄网站免费观看| 成人中文在线| 亚洲欧美日韩另类在线一| 四虎影视8848永久精品| 最新加勒比隔壁人妻| 伊人无码视屏| 欧美自慰一级看片免费| 中文字幕无码av专区久久| 亚洲欧洲日产无码AV| 午夜少妇精品视频小电影| 亚洲综合婷婷激情| 国产丝袜无码一区二区视频| 在线看AV天堂| 国产精品网曝门免费视频| 欧美日韩成人| 国产综合网站| 久久男人资源站| 欧美不卡视频一区发布| a色毛片免费视频| 四虎永久免费网站| 欧美一区福利| 国产成人精品日本亚洲77美色| 欧美成人二区| 国产精品永久不卡免费视频| 无码中文字幕精品推荐| 国产一级无码不卡视频| 又粗又大又爽又紧免费视频| 色综合久久无码网| 九九久久99精品| www.狠狠| 国产欧美视频在线| …亚洲 欧洲 另类 春色| 亚洲国产91人成在线| 美女被操黄色视频网站| 国产成人精品优优av| 精品91视频| 在线欧美日韩| 国产网友愉拍精品| 狠狠亚洲婷婷综合色香| 国产成人三级在线观看视频| 无码视频国产精品一区二区| 日韩精品一区二区深田咏美| 国产午夜不卡| 欧美午夜性视频| vvvv98国产成人综合青青| 国产SUV精品一区二区6| 国产丝袜精品| 亚洲人成色在线观看| 国产精品成人AⅤ在线一二三四| 成人国产小视频| 免费无码AV片在线观看国产| 久久99蜜桃精品久久久久小说| 波多野结衣亚洲一区| 婷婷六月综合网| 操操操综合网| 91探花在线观看国产最新| 日韩在线网址|