999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

漢越機(jī)器翻譯方法與難點(diǎn)

2019-08-10 06:36:17王聞慧
電腦知識(shí)與技術(shù) 2019年17期

王聞慧

摘要;機(jī)器翻譯作為信息時(shí)代的產(chǎn)物已經(jīng)愈來愈成為人們生活所必需的工具。計(jì)算機(jī)要實(shí)現(xiàn)“理解”語(yǔ)言以及語(yǔ)言“轉(zhuǎn)換”的功能,歧義的消解是其所面臨的最大難題。通過對(duì)越南語(yǔ)語(yǔ)言特點(diǎn)分析,本文介紹了目前的機(jī)器翻譯方法,并提出了漢越機(jī)器翻譯中存在的難點(diǎn)和可行的解決思路。本文對(duì)于認(rèn)識(shí)漢越機(jī)器翻譯的現(xiàn)狀和難點(diǎn)做了有益介紹,并提出了相應(yīng)的解決思路,可以為相關(guān)研究者提供參考。

關(guān)鍵詞:機(jī)器翻譯;越南語(yǔ);語(yǔ)言特點(diǎn)

中圖分類號(hào):TP391? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1009-3044(2019)17-0204-03

開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):

Abstract: Machine translation, as a product of the information age, has become an increasingly necessary tool for people's lives. In order to realize the function of “understanding” the language and “transforming” the language, the resolution of ambiguity is the biggest problem. This paper aims introduces current mainstream methods of machine translation and analyzes the difficulties and corresponding solutions of machine translation between Chinese and Vietnamese. This paper can provide references for related researchers.

Key words: Machine translation; Vietnamese; Language features

1 引言

作為信息時(shí)代的產(chǎn)物,機(jī)器翻譯已經(jīng)成為人們生活所必需的工具,它也在無形之中改變著人們的生活方式。隨著全球化的突飛猛進(jìn),機(jī)器翻譯已經(jīng)深入到人類日常交際、科學(xué)研究、商業(yè)交流等方方面面。近些年來,隨著深度學(xué)習(xí)的興起,機(jī)器翻譯效果也得到了巨大提升。然而,機(jī)器翻譯遠(yuǎn)未得到完全解決,尤其對(duì)于小語(yǔ)種而言,其機(jī)器翻譯效果往往不盡如人意。對(duì)于漢越機(jī)器翻譯而言,由于兩種語(yǔ)言之間的差異性和深度學(xué)習(xí)方法的局限性,其翻譯效果還存在著諸多問題。對(duì)漢語(yǔ)與越語(yǔ)兩種語(yǔ)言的差異性進(jìn)行分析,對(duì)于提升漢越機(jī)器翻譯的效果有著很強(qiáng)的現(xiàn)實(shí)意義。

2 機(jī)器翻譯方法

機(jī)器翻譯是應(yīng)用計(jì)算機(jī)來進(jìn)行不同語(yǔ)言之間的翻譯。總體來看,機(jī)器翻譯方法可分為經(jīng)驗(yàn)主義和理性主義兩種方法。20世紀(jì)30年代初,法國(guó)人阿爾楚尼首先提出了用機(jī)器進(jìn)行翻譯的想法。隨著計(jì)算機(jī)的出現(xiàn),機(jī)器翻譯逐漸成了研究熱點(diǎn)。首先興起的是以基于轉(zhuǎn)換的機(jī)器翻譯方法為代表的理性主義方法。但由于有限的規(guī)則并不能描述語(yǔ)言的復(fù)雜性,再加上隨著規(guī)則的增多,規(guī)則之間的沖突也開始增多,使得基于轉(zhuǎn)換的機(jī)器翻譯方法在達(dá)到瓶頸之后逐漸淡出研究者視野。從20世紀(jì)90年代開始,基于語(yǔ)料庫(kù)的機(jī)器翻譯方法逐漸成為機(jī)器翻譯方法的主流,主要代表有基于統(tǒng)計(jì)的機(jī)器翻譯方法、基于實(shí)例的機(jī)器翻譯方法和近些年興起的基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯方法。對(duì)于理性主義方法與經(jīng)驗(yàn)主義方法而言,兩者各有優(yōu)缺點(diǎn):?jiǎn)渭兊恼Z(yǔ)言規(guī)則難以涵蓋大量的語(yǔ)言現(xiàn)象,且基于不同語(yǔ)言的差異性而制定的詞匯庫(kù)、語(yǔ)法規(guī)則庫(kù)、語(yǔ)義規(guī)則庫(kù)往往規(guī)模大、開發(fā)成本高;而基于語(yǔ)料庫(kù)的方法雖然能夠依靠大規(guī)模真實(shí)文本涵蓋大量的語(yǔ)言現(xiàn)象,但大規(guī)模、高質(zhì)量對(duì)齊語(yǔ)料庫(kù)卻難以獲取,且模型的遷移性較差。因此在實(shí)踐中,常采用基于規(guī)則與基于語(yǔ)料庫(kù)相結(jié)合的方法以提升翻譯效果。

2.1 基于轉(zhuǎn)換的機(jī)器翻譯方法

基于轉(zhuǎn)換的機(jī)器翻譯方法包含三個(gè)步驟:源語(yǔ)言分析,源語(yǔ)言與目標(biāo)語(yǔ)轉(zhuǎn)換,目標(biāo)語(yǔ)生成。不同的基于轉(zhuǎn)換的機(jī)器翻譯方法在上述三個(gè)步驟中涉及的語(yǔ)言學(xué)深度不同,因此也產(chǎn)生了不同種類的機(jī)器翻譯方法。其中,直接翻譯法忽略了句法、語(yǔ)義與語(yǔ)境信息,通過一部詞典將源語(yǔ)言直接轉(zhuǎn)化為目標(biāo)語(yǔ)言。這種不考慮句子句法語(yǔ)義而只依賴于詞典的翻譯方法準(zhǔn)確性、拓展性較差,因此使用范圍較為狹窄。更為深層次的基于轉(zhuǎn)換的機(jī)器翻譯方法則會(huì)對(duì)源語(yǔ)言進(jìn)行句法層面乃至語(yǔ)義層面的分析,從而使機(jī)器翻譯效果更好。該方法先將源語(yǔ)言句子轉(zhuǎn)換為源語(yǔ)言的一種表達(dá)方式,再將源語(yǔ)言的內(nèi)部表達(dá)轉(zhuǎn)換為目標(biāo)語(yǔ)言的內(nèi)部表達(dá),最后按照目標(biāo)語(yǔ)言的內(nèi)部表達(dá)生成目標(biāo)語(yǔ)言。整個(gè)轉(zhuǎn)換的過程需要對(duì)句子進(jìn)行詞匯分析、句法分析、語(yǔ)義分析、語(yǔ)篇分析等,其所生成的中間表達(dá)方式也是一種句法-語(yǔ)義表達(dá)式。其具體翻譯步驟如圖1所示。

2.2 基于中間語(yǔ)言的機(jī)器翻譯方法

基于中間語(yǔ)言的方法與基于轉(zhuǎn)換方法不一樣的地方在于中間語(yǔ)言方法是將源語(yǔ)言轉(zhuǎn)換為一種新的語(yǔ)言的中間表達(dá)式,并以此為基礎(chǔ)再轉(zhuǎn)換成目標(biāo)語(yǔ)言。這種中間語(yǔ)言對(duì)于不同系統(tǒng)可以是靈活的,并沒有被固化。在多語(yǔ)種翻譯時(shí)可以起到提高效率的作用,將原有n(n-1)個(gè)翻譯過程減少到2n,并且在譯文質(zhì)量、理解性等方面均有所改善。如圖2所示。

2.3 傳統(tǒng)的基于語(yǔ)料庫(kù)的機(jī)器翻譯方法

經(jīng)驗(yàn)主義的方法主要包括基于統(tǒng)計(jì)與基于實(shí)例的機(jī)器翻譯方法。基于統(tǒng)計(jì)的翻譯方法最早由Weaver在1949年提出,其主要采用了信息論思想,將翻譯過程看作是編碼與解碼的過程。通過將大規(guī)模雙語(yǔ)平行語(yǔ)料庫(kù)中出現(xiàn)的語(yǔ)言現(xiàn)象以概率的方式統(tǒng)計(jì)計(jì)算出來,從而得到從目標(biāo)語(yǔ)言到源語(yǔ)言的翻譯概率,即翻譯模型。再針對(duì)目標(biāo)語(yǔ)言選擇特定的語(yǔ)言模型進(jìn)行訓(xùn)練,從而得到語(yǔ)言模型。最后,結(jié)合翻譯模型與語(yǔ)言模型進(jìn)行計(jì)算,從而篩選出最貼合實(shí)際的譯文。目前,經(jīng)典的翻譯模型主要有IBM的研究者建立的五種翻譯模型,可以在GitHub上下載使用。經(jīng)典的語(yǔ)言模型則主要有n元語(yǔ)言模型與近些年來興起的神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型。

基于實(shí)例的翻譯方法則是將雙語(yǔ)對(duì)照的實(shí)例導(dǎo)入到實(shí)例庫(kù)中去,當(dāng)輸入源語(yǔ)言句子時(shí),系統(tǒng)自動(dòng)搜索實(shí)例庫(kù),從而獲得與當(dāng)輸入句子最相近的源語(yǔ)言句子并找到其對(duì)應(yīng)的譯文句子,再根據(jù)輸入句對(duì)譯文句子進(jìn)行調(diào)整以輸出最終的翻譯結(jié)果。基于實(shí)例的機(jī)器翻譯方法的關(guān)鍵點(diǎn)在于將輸入句子與實(shí)例庫(kù)中源語(yǔ)言句子進(jìn)行相似度計(jì)算,從而找到與輸入句子最相似的源語(yǔ)言句子。目前,基于實(shí)例的機(jī)器翻譯方法已經(jīng)廣泛應(yīng)用在“機(jī)輔人譯”系統(tǒng)中。

總體來說,這兩種方法各有利弊,對(duì)前者來說其語(yǔ)言模型與翻譯模型的訓(xùn)練需要大量的高質(zhì)量雙語(yǔ)對(duì)齊語(yǔ)料作為支撐,而后者利用實(shí)例庫(kù)的方法盡管質(zhì)量效率高,但在多領(lǐng)域、多語(yǔ)種翻譯的應(yīng)用上,則需要大規(guī)模的實(shí)例庫(kù)支持。

2.4 基于神經(jīng)網(wǎng)絡(luò)的翻譯方法

近年來隨著深度學(xué)習(xí)的興起,神經(jīng)網(wǎng)絡(luò)方法在圖像識(shí)別、語(yǔ)音識(shí)別以及自然語(yǔ)言處理的各項(xiàng)任務(wù)中已取得較大突破與進(jìn)展。與傳統(tǒng)的基于統(tǒng)計(jì)的機(jī)器翻譯方法相比,神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)(NMT)在對(duì)語(yǔ)言規(guī)模的要求方面要更加嚴(yán)格,但其學(xué)習(xí)到的深度則是統(tǒng)計(jì)機(jī)器翻譯所不能及的。現(xiàn)階段神經(jīng)機(jī)器翻譯中比較常見的網(wǎng)絡(luò)架構(gòu)主要有RNN(recurrent neural network,循環(huán)神經(jīng)網(wǎng)絡(luò))、CNN(convolutional neural network,卷積神經(jīng)網(wǎng)絡(luò))、LSTM(long-short-time memory,長(zhǎng)短時(shí)記憶網(wǎng)絡(luò))等。其主要通過編碼解碼的方式將源語(yǔ)言句子的向量表示映射到目標(biāo)語(yǔ)言的輸出序列。

3 機(jī)器理解語(yǔ)言的難點(diǎn)

計(jì)算機(jī)要想實(shí)現(xiàn)兩種語(yǔ)言間的轉(zhuǎn)換,首先需要“讀懂”源語(yǔ)言,然而在這個(gè)過程中歧義的存在是計(jì)算機(jī)所面對(duì)的最大障礙。歧義分為兩種,一種是句子本身就存在歧義,另一種是句子本身沒有歧義,但對(duì)于機(jī)器而言存在著歧義。如“北京大學(xué)生”本身是不存在歧義的,其分詞結(jié)果就是“北京/大學(xué)生”。但對(duì)于機(jī)器而言,“北京大學(xué)/生”也是一種分詞結(jié)果,因?yàn)椤氨本┐髮W(xué)”與“生”都是漢語(yǔ)詞匯。但對(duì)于機(jī)器翻譯而言,其面臨的歧義問題主要指后者,即句子本身是沒有歧義的。歧義主要分為交集型歧義和組合型歧義,交集型歧義是指ABC可以分為AB/C、A/BC兩種,如“北京/大學(xué)生”與“北京大學(xué)/生”。組合型歧義則是指AB可以理解為AB或者A/B。如在“他馬上下來”中,“馬上”就存在組合型歧義。對(duì)于越語(yǔ)這門語(yǔ)言,歧義分布在詞匯、句法結(jié)構(gòu)、語(yǔ)義的各個(gè)層面。

3.1 詞匯層面歧義

越南語(yǔ)同漢語(yǔ)一樣都是孤立性語(yǔ)言,盡管越南語(yǔ)每個(gè)音節(jié)之間都有空格隔開,但其實(shí)質(zhì)就相當(dāng)于漢語(yǔ)中在所有字之間添加空格。漢語(yǔ)的分詞對(duì)應(yīng)到越南語(yǔ)則表現(xiàn)為“聚詞”。與漢語(yǔ)一樣,越南語(yǔ)中存在著眾多一詞多義以及同形異性(詞形相同詞性不同)的情況。例如漢語(yǔ)中的“把”一詞,既有持、拿又有端著、端起之義,越南語(yǔ)中的“cha?y”一詞,既可以表示跑這個(gè)動(dòng)作,也可以用來形容商品的暢銷程度;漢語(yǔ)中的“研究”一詞,對(duì)應(yīng)于越南語(yǔ)中的“nghiên c??u”(研究)同時(shí)都可以作名詞以及動(dòng)詞。由詞匯層面的歧義所造成的機(jī)器在做分詞和詞性標(biāo)注上的困難是很難克服的,僅依靠建立規(guī)則庫(kù)來解決歧義問題必然會(huì)造成規(guī)則庫(kù)規(guī)模過大、執(zhí)行效率低等問題。

3.2 句法結(jié)構(gòu)層面歧義

漢語(yǔ)、越南語(yǔ)在對(duì)所屬關(guān)系的表示方面與英語(yǔ)不同,英語(yǔ)有明顯的標(biāo)志性詞語(yǔ)用以界定,而漢語(yǔ)、越南語(yǔ)則沒有特定分隔或標(biāo)志性詞語(yǔ),因此存在著結(jié)構(gòu)方面的歧義。例如漢語(yǔ)中“三個(gè)北京大學(xué)和清華大學(xué)的教授”對(duì)應(yīng)于越南語(yǔ)“ba(三) gia?o s?(教授) cu?a(的) ?a?i ho?c B??c Kinh(北京大學(xué)) va?(和) ?a?i ho?c Thanh Ho?a(清華大學(xué))”這樣的短語(yǔ)表達(dá)中,“三個(gè)”是界定在北京大學(xué)還是北京大學(xué)和清華大學(xué)則需要參考上下文語(yǔ)義進(jìn)行理解。在機(jī)器分析這類結(jié)構(gòu)時(shí)可用多種句法樹來表示,通過經(jīng)驗(yàn)主義的方法,利用大規(guī)模語(yǔ)料庫(kù)構(gòu)建語(yǔ)言模型對(duì)每個(gè)詞之間的轉(zhuǎn)換概率進(jìn)行計(jì)算,從而選擇一條概率最大的路徑,進(jìn)而尋找出最符合人們思維認(rèn)知以及上下文語(yǔ)境的結(jié)構(gòu)。

3.3 語(yǔ)義層面歧義

語(yǔ)義的不確定性、模糊性無疑使得計(jì)算機(jī)無法像人腦一樣從認(rèn)知層面理解語(yǔ)句的真正意思。再者,兩個(gè)民族之間風(fēng)俗習(xí)慣的差異性必然會(huì)導(dǎo)致兩種語(yǔ)言在表達(dá)上的不同。例如將“炸薯?xiàng)l”翻譯成越南語(yǔ)時(shí)需要考慮其是一種菜名還是一種行為動(dòng)作。這需要結(jié)合語(yǔ)境來考察,而語(yǔ)境信息如何融入系統(tǒng)中則需要知識(shí)庫(kù)或者統(tǒng)計(jì)概率的支持。但目前的系統(tǒng)都無法做到對(duì)語(yǔ)境的充分理解與應(yīng)用。

4 漢-越雙語(yǔ)轉(zhuǎn)換難點(diǎn)及解決方法

越南語(yǔ)是一種孤立語(yǔ),屬南亞語(yǔ)系越芒語(yǔ)族。由于受漢文化影響較大,越南語(yǔ)同中文具有一定的相似性。一是同為孤立語(yǔ),缺少形態(tài)變化以及語(yǔ)法標(biāo)記,語(yǔ)法的表示通常采用虛詞、詞序等方式。二是越南語(yǔ)中存在大量的漢越詞,不論是發(fā)音還是結(jié)構(gòu)都與中文保持高度的同一性。三是語(yǔ)序都采用“主語(yǔ)+謂語(yǔ)+賓語(yǔ)”形式,在語(yǔ)言形式上具有相通性。與英文相比,漢、越語(yǔ)對(duì)句法結(jié)構(gòu)以及語(yǔ)法規(guī)則的限定性遠(yuǎn)不如英文,這就給漢、越語(yǔ)自然語(yǔ)言處理帶來了一定的困難,同樣直接影響到漢越機(jī)器翻譯任務(wù)之中。

4.1 人稱代詞的多樣性

越南是一個(gè)十分講究尊卑的國(guó)家,這在越南語(yǔ)人際稱謂語(yǔ)中得以體現(xiàn)。例如同輩間比自己年長(zhǎng)的男性統(tǒng)稱為anh+名,女性統(tǒng)稱為chi?+名,自稱通常用em;對(duì)父輩父親稱b??,母親稱me?,自稱con。在百度翻譯漢-越翻譯中輸入“小明應(yīng)該去上小學(xué)”這句話,軟件翻譯給出的結(jié)果為“pha?i ?i tr???ng tiê?u ho?c”,與人工翻譯出的“Con Minh pha?i ?i tr???ng tiê?u ho?c”相比,“小明”未翻譯出來。解決該問題首先要處理好未登錄詞中人名的識(shí)別問題,只有將漢語(yǔ)中的人名識(shí)別出來才能利用人稱關(guān)系將規(guī)則嵌入到翻譯系統(tǒng)中去。因此覆蓋度達(dá)到一定規(guī)模的詞表是一項(xiàng)十分重要的語(yǔ)言資源,而小語(yǔ)種低資源的建設(shè)同樣需要耗費(fèi)大量人力物力,因此上層任務(wù)都需要扎實(shí)的基礎(chǔ)性資源的支撐。

4.2 長(zhǎng)距離依賴

漢語(yǔ)中多存在復(fù)句等較為復(fù)雜的語(yǔ)言成分,句子的冗長(zhǎng)使得在翻譯過程中處理分句主語(yǔ)對(duì)主句主語(yǔ)的依賴、指稱代詞對(duì)上文的依賴等長(zhǎng)距離依賴問題是自然語(yǔ)言處理難以解決的問題之一,在這一點(diǎn)上越南語(yǔ)與漢語(yǔ)較為相似。目前解決該問題的相關(guān)研究中做得最多的是基于循環(huán)神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯,其主要的處理方法為通過將上文的信息與下文共同輸入到網(wǎng)絡(luò)當(dāng)中,從而將上文的信息融入下文的處理過程中來。但基于循環(huán)神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯存在著梯度爆炸與梯度彌散的問題,即上文的信息通過多次循環(huán)后,其對(duì)下文的影響往往很小。為解決這個(gè)問題,現(xiàn)階段主流的機(jī)器翻譯系統(tǒng)大都基于長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)。

長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)的一個(gè)變體,其不再單純地將上文信息傳遞給下文,而是采用了門限技術(shù)。通過將上文的信息設(shè)置三個(gè)“門”:輸入門,輸出門和遺忘門,從而決定哪些信息被傳遞給下文。通過使用門限技術(shù),長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)很好地解決了梯度彌散和梯度爆炸問題。但長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)對(duì)于長(zhǎng)距離依賴問題的解決是有限的,其對(duì)過長(zhǎng)的依賴問題也不能很好的解決。而越南語(yǔ)中存在著大量的長(zhǎng)距離依賴現(xiàn)象,這就要求翻譯系統(tǒng)對(duì)句子結(jié)構(gòu)能夠很好地進(jìn)行分析,而這目前仍然是一個(gè)難點(diǎn)。

4.3 復(fù)雜定語(yǔ)后置

越南語(yǔ)與漢語(yǔ)間一個(gè)重要的不同點(diǎn)是越南語(yǔ)的定語(yǔ)后置:除了一些表示數(shù)量、部分與全部、單位詞需要前置,越南語(yǔ)中的其他定語(yǔ)都需要后置。例如漢語(yǔ)中“中華人民共和國(guó)”翻譯成越文則是“n???c(國(guó)) C??ng Ho?a(共和) Nh?n d?n(人民) Trung Hoa(中華)”,越文翻譯正好與漢語(yǔ)語(yǔ)序相反。漢語(yǔ)中存在的定語(yǔ)過長(zhǎng)而導(dǎo)致的中心詞靠后的問題對(duì)應(yīng)于越南語(yǔ)中就表現(xiàn)為需要讀者“從后往前讀”。除此之外,越南語(yǔ)定語(yǔ)成分的順序有所固定,通常先次要后主要,先小范圍后大范圍。由此,機(jī)器在判斷哪些是次要、小范圍,哪些是主要、大范圍時(shí)必然不可能具備像人一樣對(duì)大小范圍的認(rèn)知能力,若僅僅依靠漢語(yǔ)定語(yǔ)語(yǔ)序倒序輸出越語(yǔ)譯文往往會(huì)出現(xiàn)一些問題。例如,在越南語(yǔ)中存在這樣的特殊情況:翻譯“經(jīng)濟(jì)社會(huì)”一詞中,越語(yǔ)譯文應(yīng)為“kinh tê?(經(jīng)濟(jì)) xa? h??i(社會(huì))”而并非“xa? h??i(社會(huì)) kinh tê?(經(jīng)濟(jì))”(此時(shí)定語(yǔ)前置)。對(duì)于此類特殊情況可以將其收入到詞典中去,盡管詞典規(guī)模過大會(huì)影響系統(tǒng)效率等問題,但卻可以對(duì)其進(jìn)行有效的規(guī)避。此外,越南語(yǔ)定語(yǔ)的復(fù)雜性特征使得機(jī)器很難將其邊界識(shí)別準(zhǔn)確,對(duì)下一步進(jìn)行句法分析等高層次任務(wù)造成阻礙。解決此類問題最重要的則是翻譯系統(tǒng)對(duì)句子結(jié)構(gòu)的正確分析,判斷動(dòng)詞短語(yǔ)是做名詞的定語(yǔ)還是整句話的謂語(yǔ)、介詞短語(yǔ)是修飾名詞短語(yǔ)或動(dòng)詞短語(yǔ)還是做句子狀語(yǔ),這些對(duì)于翻譯的準(zhǔn)確性至關(guān)重要。

4.4 虛詞的處理

越南語(yǔ)與漢語(yǔ)一樣,都是缺乏形態(tài)變化、曲折變化的孤立性語(yǔ)言,時(shí)態(tài)、人稱、數(shù)等的變化只能通過虛詞來完成,因此虛詞承擔(dān)著重要的句法功能。例如漢語(yǔ)中“我吃過飯了”表示的是一種完成時(shí)狀態(tài),對(duì)應(yīng)于越語(yǔ)則表示為“T?i(我) ?a?(已經(jīng)) ?n(吃) xong(過) r??i(了)”,“?a?”與“過”“了”的功能相同都表示完成的狀態(tài),除了這些表示時(shí)態(tài)的虛詞之外還包括表示處所、方向、方式等。在處理漢、越語(yǔ)虛詞方面,一般情況下計(jì)算機(jī)要對(duì)將要處理的語(yǔ)料進(jìn)行預(yù)處理,將句子中可能缺少或省略的虛詞補(bǔ)充完整。機(jī)器在識(shí)別出實(shí)詞之后往往將剩下來的詞視作虛詞,通過建立虛詞用法詞典,將虛詞及其用法錄入到詞典之中,并制定一系列虛詞用法規(guī)則便于機(jī)器進(jìn)行模式匹配。另外,利用越南語(yǔ)與漢語(yǔ)在虛詞特點(diǎn)的相似之處也可直接建立漢-越虛詞映射表,例如過-?a?,未-ch?a,將-se?,從-t??等雙語(yǔ)映射對(duì),省去不必要的分析和模式匹配環(huán)節(jié)。

5 結(jié)束語(yǔ)

盡管就目前來看機(jī)器翻譯已經(jīng)做到了比較純熟的程度,但涉及越南語(yǔ)方面的研究還是少之又少,漢越對(duì)譯仍存在著許多較為突出的問題需要我們解決。機(jī)器翻譯的難點(diǎn)必然與不同語(yǔ)種的特殊性所對(duì)應(yīng),要解決好所有可能的問題是一項(xiàng)繁重的工程。漢越機(jī)器翻譯不僅僅要在基礎(chǔ)資源建設(shè)上下功夫,還應(yīng)當(dāng)針對(duì)兩種語(yǔ)言的相似性與差異性找出既能省去煩瑣工作的有效方法以及具體問題具體分析的實(shí)用性經(jīng)驗(yàn),在兩者之間尋找平衡點(diǎn)。盡管深度學(xué)習(xí)的方法已成為主流,但自然語(yǔ)言不同于聲音與圖像,其內(nèi)部隱含的特征豐富使得神經(jīng)網(wǎng)絡(luò)的方法難以做到物盡其用。在深度學(xué)習(xí)方法達(dá)到一定瓶頸之后如何將

語(yǔ)言知識(shí)融合進(jìn)去將會(huì)是有所突破更進(jìn)一步的關(guān)鍵所在,因此語(yǔ)言特征的分析及應(yīng)用是漢越翻譯系統(tǒng)改進(jìn)發(fā)展的必然趨勢(shì)。

參考文獻(xiàn):

[1] 劉穎. 計(jì)算語(yǔ)言學(xué)[M]. 清華大學(xué)出版社, 2014.

[2] 劉云.英漢機(jī)器翻譯中漢語(yǔ)自動(dòng)分析的難點(diǎn)[J].長(zhǎng)江藝術(shù), 2009(1):111-115.

[3] 曹英華,郝進(jìn)仕.漢語(yǔ)機(jī)器理解與漢英機(jī)器翻譯[J].內(nèi)江師范學(xué)院報(bào), 2006, 21(1):55-57.

[4] 張政.機(jī)器翻譯難點(diǎn)所在[J].外語(yǔ)研究, 2005(5):59-62.

[5] 詹衛(wèi)東,常寶寶,俞士汶.漢語(yǔ)短語(yǔ)結(jié)構(gòu)定界歧義類型分析及分布統(tǒng)計(jì)[J].中文信息學(xué)報(bào),1999, 1999, 13(3):10-18.

[6] 譚志詞, 徐方宇, 林麗. 基礎(chǔ)越南語(yǔ)(3)[M]. 世界圖書出版公司, 2013:95.

[7] 戴新宇, 尹存燕, 陳家駿,等. 機(jī)器翻譯研究現(xiàn)狀與展望[J]. 計(jì)算機(jī)科學(xué),2004, 31(11):176-179.

[8] 戴新宇, 尹存燕, 陳家駿,等. 機(jī)器翻譯研究現(xiàn)狀與展望[J]. 計(jì)算機(jī)科學(xué),2004, 31(11):176-179.

[9] 劉群, 俞士汶. 漢英機(jī)器翻譯的難點(diǎn)分析1[C]// 中文信息處理國(guó)際會(huì)議,1998.

[10] 程節(jié)華, 戴新宇, 陳家駿,等. 漢英機(jī)器翻譯中時(shí)體態(tài)處理[J].計(jì)算機(jī)應(yīng)用研究,2004, 21(3):79-80.

[通聯(lián)編輯:梁書]

主站蜘蛛池模板: 朝桐光一区二区| 色欲国产一区二区日韩欧美| 1769国产精品视频免费观看| Jizz国产色系免费| 好紧好深好大乳无码中文字幕| 免费三A级毛片视频| 国产97视频在线| 97超碰精品成人国产| 国产精品999在线| 一区二区三区四区日韩| 欧美激情伊人| 国产精品白浆在线播放| 国产精品密蕾丝视频| www.精品国产| 中文字幕乱码二三区免费| 亚洲美女视频一区| 国产精品亚洲片在线va| 国产午夜精品一区二区三区软件| 午夜a级毛片| 伊人久久婷婷| 亚洲精品国产首次亮相| 欧洲极品无码一区二区三区| 精品少妇三级亚洲| 高潮爽到爆的喷水女主播视频| 国产精品三级av及在线观看| 欧美性猛交一区二区三区| 欧美激情综合| 国产精品永久不卡免费视频| 午夜精品福利影院| 视频二区中文无码| 五月婷婷综合色| 女人18毛片水真多国产| 国产日韩av在线播放| 国产成人一二三| 9999在线视频| 国产96在线 | 亚洲黄色激情网站| 日韩成人免费网站| 亚洲香蕉在线| 精品撒尿视频一区二区三区| 毛片基地视频| 久久综合干| 呦女亚洲一区精品| 伊伊人成亚洲综合人网7777| 色老二精品视频在线观看| 日韩精品欧美国产在线| 2022国产91精品久久久久久| 亚洲水蜜桃久久综合网站| 中文成人在线| 国产国语一级毛片在线视频| 天天综合网在线| 欧美专区在线观看| 中文字幕2区| 最新国产成人剧情在线播放| 国内精品久久人妻无码大片高| 亚洲人成人无码www| 国产欧美日韩视频怡春院| 免费观看成人久久网免费观看| 亚洲国产成人自拍| 国产a在视频线精品视频下载| 亚洲系列无码专区偷窥无码| 成年片色大黄全免费网站久久| 91精品国产无线乱码在线 | 欧美日韩精品在线播放| 国产真实二区一区在线亚洲| 亚洲日本www| 伊人91视频| 欧美a在线视频| 亚洲人人视频| 国产乱视频网站| 国产成人一区免费观看| 91娇喘视频| 亚洲系列中文字幕一区二区| 久久国产精品嫖妓| 国产乱子伦精品视频| 香蕉视频在线观看www| 2021国产精品自产拍在线观看| 国产精品人莉莉成在线播放| 亚洲成人动漫在线| 国内毛片视频| 免费无码又爽又刺激高| 欧美精品1区|