999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺析機(jī)器翻譯瓶頸及研發(fā)趨勢(shì)

2019-09-10 17:43:56安寧
新教育論壇 2019年35期
關(guān)鍵詞:規(guī)則計(jì)算機(jī)語(yǔ)言

機(jī)器翻譯(Machine Translation)是翻譯人員利用多種計(jì)算機(jī)翻譯軟件,將源語(yǔ)言(Source Language)文件,轉(zhuǎn)換成另外一種目標(biāo)語(yǔ)(Target Language)或者多種目標(biāo)語(yǔ)言,翻譯人員借助計(jì)算機(jī)器翻譯一直是人工智慧領(lǐng)域中的重要研發(fā)方向。機(jī)器翻譯進(jìn)行翻譯時(shí)涉及到自然語(yǔ)言(Natural Language,如中文、英文等)的加工合成,幾乎已經(jīng)覆蓋自然語(yǔ)言處理的所有技術(shù),并且有較為明確具體檢測(cè)手段,可以當(dāng)做自然語(yǔ)言處理技術(shù)的研發(fā)項(xiàng)目。不可避免的一個(gè)重要問(wèn)題就是機(jī)器翻譯若要占領(lǐng)翻譯市場(chǎng),就必須要面對(duì)來(lái)自人工翻譯者的挑戰(zhàn)。按照機(jī)器翻譯的流程,翻譯成品要譯者人工潤(rùn)色和審核,這部分的人力成本將會(huì)占實(shí)際運(yùn)作成本的大部分。也就意味著能夠節(jié)省的時(shí)間必須多到一定程度,機(jī)器翻譯才能達(dá)到實(shí)用化的階段。在理想情況下,人工潤(rùn)色盡量無(wú)須參照原文,直接進(jìn)行修飾即可。

機(jī)器翻譯總體上可以分為直接式(Direct)、轉(zhuǎn)換式(Transfer)及中介語(yǔ)(Interlingua)三大類,實(shí)操一般都是采用轉(zhuǎn)換式。轉(zhuǎn)換式機(jī)器翻譯流程大致可分為三個(gè)階段:分析、轉(zhuǎn)換和生成。自然語(yǔ)言處理最大的難處,在于自然語(yǔ)言本身復(fù)雜更新較快,而且例外繁多。因此機(jī)器翻譯所面對(duì)的主要問(wèn)題,可以歸納為兩大項(xiàng):(1)文句中歧義(Ambiguity);(2)語(yǔ)法不合設(shè)定(Ill-formedness)現(xiàn)象。自然語(yǔ)言的語(yǔ)法和語(yǔ)意中需通過(guò)上下文線索加以判斷。以下是兩類問(wèn)題:

問(wèn)題一,歧義。就是一個(gè)句子有多種解釋。我們?nèi)粘I钪胁恢挥X(jué)地充滿了歧義句。雖然人們可以根據(jù)常識(shí)正確判斷句意,但是對(duì)于依照文字規(guī)則來(lái)理解句子的計(jì)算機(jī)翻譯軟件來(lái)說(shuō),這就是一個(gè)歧義句。在做句子分析時(shí),幾乎在每一個(gè)環(huán)節(jié)(如斷詞、句法分析、語(yǔ)意分析等)都可能出現(xiàn)歧義。單個(gè)字或者詞的解釋往往會(huì)因前后的內(nèi)容產(chǎn)生不同的意思。除此之外,判斷句義依靠的線索在不同范圍。因此在機(jī)器翻譯過(guò)程中,若采用線性流水式的處理程序(Pipelined Architecture),則前面的模塊則無(wú)法做出確定性的(Deterministic)判斷,而須盡量多地保留候選者,而讓后面的模塊進(jìn)行處理。所以,最終判斷的時(shí)機(jī)應(yīng)盡量延后,在累積足夠信息后,再選擇要使用的方法。這樣才不會(huì)在開(kāi)始就把正確的譯法排除到考慮范圍之外。

問(wèn)題二,所謂的語(yǔ)法,是語(yǔ)言學(xué)家,依靠目前擁有的大量語(yǔ)料,歸納總結(jié)出的一些規(guī)則。這些規(guī)則是不完整的,往往有許多的例外。而且語(yǔ)言是一直在變遷的,無(wú)法要求語(yǔ)言的使用者,每字每句都合乎這些人為加工訂定的文法,自然地也難以避免這樣的情況出現(xiàn)在翻譯稿件中。這些與設(shè)定語(yǔ)法的例子不符的地方包括不明的字匯,如新生的專有名詞,和舊字新法的。這些現(xiàn)在部分來(lái)自單純的疏失,例如錯(cuò)字、漏字、贅字、轉(zhuǎn)檔或傳輸時(shí)產(chǎn)生的亂碼,或是不慎混入的標(biāo)簽(tag),也有些是已被大眾所接受的字匯和語(yǔ)法。理想化的機(jī)器翻譯,必須能夠處理這些與設(shè)定語(yǔ)法不符的問(wèn)題。

如何解決上述的歧義或語(yǔ)法問(wèn)題,則需要大量知識(shí)。這些大量知識(shí)的管理,分類,儲(chǔ)存和應(yīng)用,是建立機(jī)器翻譯時(shí)最大重點(diǎn)和難點(diǎn)。我們首先要將這些包含在語(yǔ)言學(xué)之內(nèi)(intra-linguistic)、跨語(yǔ)言學(xué)的(inter-linguistic),以及超乎語(yǔ)言學(xué)之外(extra-linguistic)的知識(shí)抽取、表達(dá)出來(lái),解釋上述的語(yǔ)法和歧義問(wèn)題,而且還要維護(hù)這個(gè)龐大的知識(shí)庫(kù)。所以,我們要建立的知識(shí)庫(kù)必須包羅萬(wàn)象,吸收涵蓋各領(lǐng)域、各層面的知識(shí)。它本身就是一項(xiàng)艱難復(fù)雜的工作。也就是說(shuō)知識(shí)庫(kù)的建設(shè)維護(hù)是機(jī)器翻譯系統(tǒng)開(kāi)發(fā)最大的瓶頸。

一般來(lái)說(shuō)知識(shí)的取得,和我們表現(xiàn)知識(shí)的方式有著緊密的聯(lián)系。知識(shí)表現(xiàn)方式可以有很多不同的存在形式。其一就是加入知識(shí)庫(kù)的規(guī)則,規(guī)則系統(tǒng)是由事先以人力建立好的大量規(guī)則所構(gòu)成。在進(jìn)行機(jī)器翻譯時(shí),翻譯軟件根據(jù)這些規(guī)則,進(jìn)行二擇判斷,進(jìn)行分析、轉(zhuǎn)換和生成步驟,最后給出明確答案。這種方法被機(jī)器翻譯廣泛采用。它的優(yōu)點(diǎn)在于貼近人的直覺(jué),容易理解,遵循已有的語(yǔ)言學(xué)知識(shí)和規(guī)則,充分利用已有的經(jīng)驗(yàn)和研究結(jié)果。逐漸使其參數(shù)化,不同的語(yǔ)言現(xiàn)象用幾率掃描進(jìn)行描述,積累量足夠大時(shí),語(yǔ)言模型就自然建立起來(lái)。其最大的優(yōu)點(diǎn)在于通過(guò)參數(shù),讓計(jì)算機(jī)翻譯軟件在不同的條件下根據(jù)不同的偏好進(jìn)行解釋和加工,依靠參數(shù)估算任務(wù)給計(jì)算機(jī)翻譯軟件進(jìn)行。

機(jī)器翻譯的未來(lái),研發(fā)高品質(zhì)的翻譯系統(tǒng),需要的知識(shí)庫(kù)是巨大并且瑣碎的。對(duì)于知識(shí)的獲取和管理,是機(jī)器翻譯系統(tǒng)研發(fā)的瓶頸。近些年來(lái),機(jī)器翻譯系統(tǒng)的研發(fā),已經(jīng)漸漸地由規(guī)則庫(kù)的方式轉(zhuǎn)變成為參數(shù)化方式,并且其優(yōu)越性已經(jīng)得到了證明,也逐漸成為了主流。隨著計(jì)算機(jī)行業(yè)的發(fā)展,計(jì)算機(jī)硬件性能的大幅提升,機(jī)器翻譯軟件已經(jīng)突破了計(jì)算能力和記憶容量的限制。與此同時(shí),人們生活和語(yǔ)言的發(fā)展使得語(yǔ)料庫(kù)的規(guī)模也在爆炸似的增長(zhǎng),由譯者來(lái)制定和模擬模型,利用計(jì)算機(jī)的處理優(yōu)勢(shì)進(jìn)行語(yǔ)料庫(kù)的加工,可以大大提高計(jì)算機(jī)學(xué)習(xí)效率,降低知識(shí)獲取和管理的難度。這也是對(duì)機(jī)器翻譯研發(fā)瓶頸的突破。放眼未來(lái),如果能構(gòu)建精準(zhǔn)的模型,提高語(yǔ)言融合的鍥合度,利用合適的規(guī)則抽取語(yǔ)料庫(kù)中相關(guān)的知識(shí),可以在專業(yè)特種行業(yè)領(lǐng)域發(fā)揮巨大的作用,提供高品質(zhì)的翻譯。如此一來(lái),機(jī)器翻譯最終可以擁有廣泛的實(shí)用化領(lǐng)域和空間,也必將占有相當(dāng)大的翻譯市場(chǎng)份額。

作者簡(jiǎn)介:安寧(1980.01-),男,漢族,吉林長(zhǎng)春人,吉林建筑大學(xué)國(guó)際合作與交流碩士,講師,從事外國(guó)語(yǔ)言文學(xué),機(jī)器翻譯研究。

猜你喜歡
規(guī)則計(jì)算機(jī)語(yǔ)言
撐竿跳規(guī)則的制定
計(jì)算機(jī)操作系統(tǒng)
數(shù)獨(dú)的規(guī)則和演變
語(yǔ)言是刀
文苑(2020年4期)2020-05-30 12:35:30
基于計(jì)算機(jī)自然語(yǔ)言處理的機(jī)器翻譯技術(shù)應(yīng)用與簡(jiǎn)介
科技傳播(2019年22期)2020-01-14 03:06:34
讓語(yǔ)言描寫(xiě)搖曳多姿
讓規(guī)則不規(guī)則
Coco薇(2017年11期)2018-01-03 20:59:57
信息系統(tǒng)審計(jì)中計(jì)算機(jī)審計(jì)的應(yīng)用
TPP反腐敗規(guī)則對(duì)我國(guó)的啟示
累積動(dòng)態(tài)分析下的同聲傳譯語(yǔ)言壓縮
主站蜘蛛池模板: 久久这里只精品国产99热8| 99久久精品国产自免费| 秋霞午夜国产精品成人片| 91精品综合| 亚洲最新地址| 亚洲无码高清免费视频亚洲| 动漫精品啪啪一区二区三区| 激情综合婷婷丁香五月尤物| 啦啦啦网站在线观看a毛片| 中文字幕在线不卡视频| 欧美国产视频| 久久久久中文字幕精品视频| 91免费国产在线观看尤物| 久久频这里精品99香蕉久网址| 91国内外精品自在线播放| 不卡午夜视频| 亚洲性日韩精品一区二区| 中文字幕欧美日韩| 国产a网站| 国产欧美精品一区二区| 九色免费视频| 99在线观看精品视频| 91偷拍一区| 亚洲综合专区| 97久久人人超碰国产精品| 中文一区二区视频| 国产噜噜噜视频在线观看 | 在线毛片网站| 玖玖精品在线| 国产精品专区第一页在线观看| 尤物成AV人片在线观看| a毛片在线免费观看| 欧美性天天| 国产综合欧美| 视频二区亚洲精品| 成人国产一区二区三区| 四虎成人精品| 在线日韩日本国产亚洲| 亚洲欧美一区二区三区图片| 国产一区二区福利| 亚洲综合精品第一页| 精品少妇人妻一区二区| 中文字幕亚洲乱码熟女1区2区| 日韩av电影一区二区三区四区| 99久久国产综合精品2023| 91亚洲免费视频| 麻豆精品在线视频| 婷婷午夜影院| 在线日本国产成人免费的| 国产福利在线免费| 狠狠ⅴ日韩v欧美v天堂| 午夜视频免费试看| 国产乱子伦手机在线| 日本精品影院| 强乱中文字幕在线播放不卡| 日韩 欧美 小说 综合网 另类| 伊人色综合久久天天| 色综合久久无码网| 精品国产99久久| 亚洲午夜福利在线| 国产人成午夜免费看| 亚洲第一成人在线| 亚洲天天更新| 国产91视频免费| 久久久91人妻无码精品蜜桃HD| 97se亚洲综合在线韩国专区福利| 狠狠色综合网| 欧美激情,国产精品| 思思热精品在线8| 国产第八页| 91在线丝袜| 五月天福利视频| 免费观看三级毛片| 色综合成人| 欧美爱爱网| 一区二区三区在线不卡免费| 国产精品白浆在线播放| 久久性妇女精品免费| 欧美亚洲第一页| 91在线播放免费不卡无毒| 四虎精品黑人视频| 欧美亚洲第一页|