999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機器翻譯視角下規范彝文文本分詞歧義類型探究*

2020-05-18 04:21:18
民族翻譯 2020年1期
關鍵詞:規則語言

⊙ 蔡 夏

(西南民族大學,四川 成都 610041)

一、研究背景及現狀

彝語是屬于漢藏語系藏緬語族彝語支的一種語言,同屬彝語支的語言還有納西、拉祜、傈僳、哈尼、基諾、怒蘇、白、土家等。學術界一般將彝語分為六大方言區,即北部方言、東部方言、南部方言、東南部方言、西部方言、中部方言,其中又包括了五個次方言和二十五個土語。[1]本文所關注的是最大的彝語方言區——北部方言區在日常交際中出現的歧義現象,文中以書面語的使用為例。彝語是表意的音節文字,規范后的彝文雖然只有819個字(加上次高調上的彝文,共計1165個),但是幾乎每個字都有其本義與引申義,而且大多核心詞匯的詞性也會隨著使用性的增強而發生變化,從而逐漸擴展其本身的詞性和詞義。因此,彝語中的同音異義、同形異義現象在長期的使用中是相當普遍的,這使得彝漢機器翻譯在文法上分詞時遭遇諸多歧義現象和易混淆詞句,增加了在算法上的實現難度系數。[2]

目前,學術界對彝語言的研究多集中在語法、語音等層面,聚焦語料庫或計算機語言的角度來研究彝語及其翻譯的成果則很少。[3]本文嘗試運用機器翻譯的分析和加工方法,對文中選取的彝語例句進行切分和結構剖析,簡單探討機器翻譯模式下“彝譯漢”所面臨的切分歧義現象,同時為彝漢翻譯語料庫的建立提供具體案例。

二、研究視角——機器翻譯

機器翻譯(machine translation,MT)是計算機把一種語言(源語言,source languaage)翻譯成另一種語言(目標語言,target language)的一門學科。它既是一門學科也是一門技術,作為語言學的一個分支,涉及計算機、認知科學、語言學、信息論等學科,是人工智能的終極目標之一。機器翻譯是自然語言處理在計算機科學、語言學、心理學、認知科學和數學等多學科交叉中衍生出的,一般通過建立形式化的模型來分析、理解和處理自然語言。[4]

機器翻譯中與語言智能有關的有三個方面,即語音識別/合成、自然語言處理和計算機編程。這三個領域涉及的問題各不相同。以自然語言處理領域為例,機器翻譯側重于解決該領域中的詞性標注、句法標注、語義標注、詞義消歧、指代消解、信息抽取等問題,以達到提升信息處理效率和效度的目標。[5]

一般而言,機器翻譯主要運用以下三種運算方法,即基于規則的方法、基于統計的方法和基于實例的方法,這三種方法各有優缺點。基于規則的方法在翻譯中完全依賴規則,而當規則出現摩擦時,則需要更多的人力物力資源配合;基于統計和實例的翻譯則依賴于語料庫和實例的規模,也存在一定的局限。[6]

機器翻譯通過對句子成分進行切分與標注的方式以達到分析和輸出語句的目的。[7]切分歧義是影響分詞系統切分正確率的重要因素,包括交集型歧義、組合型歧義以及混合型歧義3種類型:1.交集型歧義:如字符串abc既可以切分為ab/c,又可以切分為a/bc。其中,a、ab、c和bc都是具有獨立意思的詞或詞語;2.組合型歧義:若ab為詞,而a和b在句子中又可以分別單獨成詞;3.混合型歧義:由交集型歧義和組合型歧義自身嵌套或者兩者交叉組合而產生的歧義。采集歧義字符串的兩種具體方法:正向最大匹配和逆向最大匹配兩種方法掃描發現交集型歧義;正向最大匹配和逆向最小匹配,并且最小匹配從單字詞開始的方法發現組合型歧義。[8]

三、理論基礎及相關概念簡述

(一)轉換生成語法

按照轉換生成語法“管約論”的觀點,人類大腦的語言器官中有一個詞庫和一個推導程序或稱演算系統。推導程序從詞庫中選擇詞項,推導出句子的結構描寫式,然后交由大腦中的其他應用系統進行語音和語義解釋[9],如圖所示:

轉換生成語法“管約論”[10]

“X-階標理論規則”是“管約論”模型句法最基本的句法結構規則。它可以描述任何語言中的任何句子類型。

“X-階標理論”[11]

轉換生成語法理論也制定了一套符號[12],其常用符號列舉如下表:

實義詞/短語功能詞漢語名稱代號漢語名稱代號名詞N限定詞(冠詞、指示代詞、物主代詞、不定代詞等)D/DET動詞V代詞Pron形容詞A/ADJ助動詞Aux副詞Adv/ADV標句詞C介詞P連詞Conj名詞短語NP疑問式Wh--動詞短語VP

最常見的句法結構有以下幾種[13]:

(1)S=NP+VP;(2)VP=V+S;(3)NP=NP+S;(4)VP=NP+S;

(5)VP=V+NP;

(二)文法中的歧義現象

任何一種自然語言中都存在著歧義現象。所謂歧義是指人們在言語交際的過程中,聽話人對一個句子的語言意義有著兩種或兩種以上理解的言語現象。也就是說,當一種語言形式能夠傳遞出兩種或兩種以上的意義,進而傳達出兩種或兩種以上的解釋時就會產生歧義。[14]一般來講,詞匯歧義包括了同形異義詞和同音異義詞。結構歧義是指由于句子結構切分不同或結構關系不同或潛在關系不同而形成的語句歧義。[15]彝語歧義現象是指詞與詞、詞與短語、短語與短語組合后,呈現出不同的語義結構關系、不同的語法結構關系、不同的層次結構關系,可作幾種形式的切分,從而形成句法上的歧義。[16]本文主要探討和關注的是彝語言實際運用中的詞匯歧義和結構歧義現象。

四、彝語切分歧義的舉例與分析

(一)組合型歧義舉例

(二)交集型歧義

(三)混合型歧義句

五、結論

機器翻譯通過將彝語自然語言結構在使用中產生的各種歧義即語用歧義進行系統歸納和比較研究,找出彝語文本中容易產生歧義的共性特征。其涉及話語、言語行為和指示意義等,進而積極地利用歧義產生的多重語用效果,去驗證與豐富語言規則,最終推動有關彝語言文本的深入研究。從以上探討機器翻譯對彝語句法結構的切分、標注和解釋、分析中,我們可以看到,目前機器翻譯尚且面臨諸多挑戰,但同時我們也有理由相信,通過大量實例的分析與累積,對彝語句法和詞匯等進行切分、標注與轉換、輸出等處理,使得基于規則和基于統計的機器翻譯語料庫不斷充實,機器翻譯的效果也一定會逐步優化,使我們在語言交流中的障礙和壓力得到有效緩解。

*本文系“四川省高校重點實驗室——民族語言文字信息處理實驗室建設項目”研究成果之一。

猜你喜歡
規則語言
撐竿跳規則的制定
數獨的規則和演變
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
規則的正確打開方式
幸福(2018年33期)2018-12-05 05:22:42
讓語言描寫搖曳多姿
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
多向度交往對語言磨蝕的補正之道
TPP反腐敗規則對我國的啟示
累積動態分析下的同聲傳譯語言壓縮
搜索新規則
主站蜘蛛池模板: 无码AV日韩一二三区| 天堂va亚洲va欧美va国产| 美女无遮挡免费网站| 成人免费网站久久久| 国产哺乳奶水91在线播放| 青青久在线视频免费观看| 日本精品影院| 国产99视频免费精品是看6| 亚洲福利一区二区三区| 欧美日韩在线国产| 亚洲无码高清一区二区| 美女黄网十八禁免费看| 精品国产www| 福利一区三区| 天堂网国产| 国产女人18毛片水真多1| www.亚洲一区二区三区| 特级毛片8级毛片免费观看| 91区国产福利在线观看午夜| 欧美午夜网站| 精品欧美一区二区三区久久久| 亚洲精品麻豆| 亚洲第一成网站| 露脸真实国语乱在线观看| 亚洲αv毛片| 亚洲一区无码在线| 欧美日韩精品在线播放| 欧美a在线视频| 久久久久国产精品熟女影院| 亚洲成人黄色在线| 男女精品视频| 在线观看国产网址你懂的| 3D动漫精品啪啪一区二区下载| 欧美日韩北条麻妃一区二区| 二级毛片免费观看全程| 全午夜免费一级毛片| 久久精品66| 国产成人精品第一区二区| 宅男噜噜噜66国产在线观看| 亚洲欧美成aⅴ人在线观看| 亚洲国产系列| 91视频日本| 国产成人精品高清不卡在线| 最新国产你懂的在线网址| 亚洲精品波多野结衣| 国产精品乱偷免费视频| 国产精品19p| 一级片一区| 成人免费午间影院在线观看| 最新日韩AV网址在线观看| 日韩国产欧美精品在线| 日韩大乳视频中文字幕| 极品国产在线| 国产精品免费p区| 亚洲精品中文字幕无乱码| 波多野结衣一级毛片| 国产一区二区在线视频观看| 亚洲欧美不卡中文字幕| 色首页AV在线| 亚洲综合色区在线播放2019| 亚洲免费福利视频| 国产亚洲一区二区三区在线| 综合色区亚洲熟妇在线| 2020极品精品国产 | 国产97视频在线| 亚洲精品第一页不卡| P尤物久久99国产综合精品| 欧美成人手机在线视频| 人妖无码第一页| 夜夜操狠狠操| 91麻豆精品国产91久久久久| 曰韩人妻一区二区三区| 欧美日韩精品在线播放| 91久久国产成人免费观看| 亚洲精品无码不卡在线播放| 在线a网站| 亚洲欧美自拍一区| 幺女国产一级毛片| 2021国产在线视频| 国产91视频观看| 成人小视频在线观看免费| 91精品免费高清在线|