999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

自然語言處理中機器翻譯發展態勢的哲學思考

2023-12-26 05:47:09王汝發
綏化學院學報 2023年11期
關鍵詞:規則科學語言

王 鼎 王汝發

(1.西北民族大學;2.甘肅政法大學教學質量管理運行監控中心 甘肅蘭州 730000)

20世紀50年代以來,研究者根據計算機運算速度加快,內存容量增加等性能的提高及其處理能力,研制成功了基于規則的機器翻譯,這種翻譯方法“機器可以根據源語語言分析規則理解源語語言,并依據源語語言和目的語之間的轉換和目的語語言生成規則,將源語語言自動轉換成目的語言。”[1]基于規則的機器翻譯其核心主要在語言“規則”上,這里的“規則”有幾方面的涵義,一方面必須具備大量的知識積累,知識由手工按一定的規則譯成代碼,這本身就是一件困難的事情;另一方面,大量知識的積累也是一種不易的事情,因為知識獲取和知識的調整對機器翻譯系統的開發有阻礙作用。

一、由基于規則的機器翻譯到基于實例的機器翻譯

我們知道,技術存在于人類目的性活動的各個領域,張成智等[2]認為:“翻譯學的技術轉向是指隨著信息技術、計算語言學、術語學等學科發展,翻譯學實踐發生了從純人工翻譯到人工翻譯與信息技術相結合的變化,從而引發翻譯理論研究的變革。”這實際上正是我們所說的翻譯技術創新,通過技術創新解決原有技術系統功能有限的矛盾。從認識論的角度看,基于規則的機器翻譯其規則包括源語言的分析規則和源語言的內部表示到目標語言內部表示轉換規則等,這些規則是高度抽象的,它受制于人工編寫規則的質量和數量,與人的主觀因素相關,編寫工作費時費力,且在知識的獲取和調整上不利于機器翻譯系統的快速發展。歸納總結出這些規則同樣是一件不僅比較困難而且成本很高的事情。為了解決這一難題,20世紀80年代,日本學者Nagao根據平行語料庫中的信息和計算機計算能力的提升,又提出了一種新的方法,他在其論文《采用類比原則進行日-英機器翻譯的一個框架》中指出:“人類在翻譯一個簡單句子的時候,并不會作深層次的語法分析,而是實現將源句適當分為若干短語片段,然后再把這些短語翻譯成目標語言,最后把翻譯好的短語片段(fragmental phrases)恰當的組合成為一個句子。而對每一個短語片段則是相應的例子作為參考,通過類比原則進行翻譯的。”[3](P10)這里的“實例”指的是在平行語料庫中許多的信息可以直接被用作機器自動翻譯的例子,以取代基于規則的機器翻譯方法。學術界通常把這種翻譯方法稱為基于實例的機器翻譯(Example-Based Machine Translation),顯然,這與基于規則的機器翻譯相比,又是更高一階的技術轉向。它克服了基于規則的機器翻譯由“規則”引起的不足和局限性,在學術界也有人把這種機器翻譯稱為基于類比的機器翻譯(Analogy-Based Machine Translation)。類比指的是根據兩類不同對象之間在某些方面的相似或相同,推出它們在其他方面也可能有相似或相同的一種推理方法。其結果是猜測的,它是具有創造性的一種方法,是獲得新思路、新方法的一種觀點和一種手段。基于實例的機器翻譯技術自提出后,多位學者進行了深入研究,取得了許多重要的成果,例如中科院專家團隊聯合開發研究的“基于詞對齊的EBMT 系統。”[4]這一系統的工作一般主要分三個步驟進行:首先,根據相似度計算實例選擇;其次,根據確定下來的實例,輸入句子與翻譯實例進行匹配;再次,利用詞典對句子中未匹配上的詞語進行翻譯。不過這種技術仍有一定的不足和局限性,首先要求必須有對齊的平行語料庫,否則無法進行機器翻譯,而對于對齊的雙語平行語料庫的構建又是一個工程量浩大的工程,有時不一定能做到。同時,因語料庫是先前建設好的,在語料庫的某一段時間內是可行的。而語言作為一種社會現象,它與社會的發展十分緊密,隨著社會的變革和新的社會現象的產生,可能涌現出新的詞語,這對于機器翻譯來說是難以完全實現的。

二、由基于實例的機器翻譯到基于統計的機器翻譯

基于實例的機器翻譯研究在20 世紀80、90 年代出現了很多的方案,這些方案主要以平行語料庫為基礎,通過類比的方法獲取翻譯結果,大多數研究主要借助于雙語詞典。很顯然,翻譯效果的優劣在一定程度上取決于平行語料庫的質量和覆蓋面,如果沒有可用的高質量覆蓋面廣泛的雙語平行語料庫,則這種翻譯方法的匹配率極低,僅限于特定專業領域應用。一旦處理的語言種類繁多,五花八門,利用基于實例的機器翻譯方法要解決自然語言里無窮無盡的翻譯任務著實是一件不易的事情。當人們發現基于實例的機器翻譯方法的不足和缺點后,不得不尋求更高一級的翻譯技術,也就是我們所言的翻譯技術更高一級的轉向。開始主張以數據為中心而不是以人為中心,這也就是人們通常所說的經驗主義方式,經驗主義方式主張利用數學的理論與方法,通過建立數學模型,借助計算機技術這一高科技手段來解決復雜的語言轉換問題。這是機器翻譯領域發生的又一次重大變革,稱之為基于統計的機器翻譯。這種方法就是我們所說的基于統計的機器翻譯方法。

如前文所言,基于規則的機器翻譯是理性主義占主導的,而基于統計的機器翻譯則是經驗主義占主導的[5](P3)。隨著信息技術特別是Internet 技術的廣泛應用,這種模型的方法成了解決兩種語言之間翻譯“屏障”的重要工具。建立這種模型是一種積極的思維活動,一般包含兩部分,即模型的理論基礎和模型的假設。2007年中科院院士高慶獅在為宋成慶先生《統計自然語言處理》的序言中曾言:“由于統計法能使自然語言處理的正確率從比較低的水平有較快增長,引起人們廣泛注意,所以近十年來有比較快的發展。”[5](P3)可以說,基于統計的機器翻譯的理論基礎正是哲學中的經驗主義。

讓我們來看基于規則的機器翻譯技術與基于統計的機器翻譯技術的差異。首先來看兩種技術的哲學基礎:前者其哲學基礎是理性主義的,后者是經驗主義的,這種理性主義方法主張由人類專家觀察不同自然語言之間的轉換規律,通過編撰規則的方式,以語言規則的形式表示翻譯知識。經驗主義的一個顯著特征是主張以數據為中心并非人,以數學模型描述自然語言的轉換過程。雖然在觀念層面上,兩種技術在意識形態上具有較大差異,但是,兩者各有所長,在追求技術效用和目的上又是一致的。

在2014 年以后,基于神經網絡技術的翻譯取得了重大進展,比基于統計的機器翻譯在翻譯質量上有進一步的提升。由于目前主流的神經網絡機器翻譯實際上還是以經驗主義方法為主導的,故限于篇幅本文在此不再多贅。

三、從機器翻譯技術再看科學與技術的幾個問題

多年來,學術界特別是科學技術哲學界的學人們進行了深入的研究和探討,有技術哲學專家們提出了一些非常值得研究的問題,如“機器是不是技術?如果是,該怎樣區分作為生產成品、生產手段的機器同作為技術要素的機器?”“科學與技術之間究竟有怎樣的對稱性、非對稱性和互補性?……能否把技術看作是科學的應用,或接受應用科學'(applied science)?”筆者想以機器翻譯技術為例,談談我們對這兩個問題之見。首先,我們把機器翻譯分解成“機器”和“翻譯”兩部分來看,這里的“機器”就是指計算機,計算機是現代化智能電子設備,是集成網絡、計算、媒體等技術為一體的電子設備。[6]因此,這里的機器是硬件,并且是大規模的機器硬件。從這一點上說,似乎機器不是技術,但創造這個機器卻需要現代化的集成網絡、計算、電工等技術才可以完成,并且既有生產手段的機器成分也有技術要素的機器成分,由此又可以認為這里的機器又是技術,結合二者我們是否可以說,機器翻譯中的機器是技術與硬件融合而成的一個電子設備。如果視語言翻譯中得到的譯文為產品,則機器翻譯中的計算機又是生產產品的機器。其次,翻譯部分則是由語言學、計算機科學技術、數學、認知科學等為基礎(支撐)的技術,它是以這些科學為基礎,經實驗成功后得到的應用技術(有人也稱“應用科學”“實驗科學”“技術科學”,實際上這是從學科角度而言的)。在機器翻譯技術領域近年來國內外獲得了不少發明專利,從機器翻譯技術看,呈現出一體化發展態勢。當然,由于我們水平所限,加之“技術”概念本身定義的特殊性,這里不可能全面探討專家學者們提出的這些問題,僅以“機器翻譯技術”為例,從一個側面對這些問題進行一些思考,希望成為一塊引玉之磚,引起更多人關注機器翻譯的研究。

由機器翻譯技術的創立之路及其轉向的討論可以看出,理所當然機器翻譯技術是一種技術,并且是一種新興技術,為什么這么說呢?這是因為它符合新興技術的定義:“新興技術指建立在科學基礎上的創新,它們有可能創造一個新行業或改變某個已經存在的行業,具有高度不確定性。”[7]反過來看,它又是科學,更準確地說是實驗科學或應用科學。在此方面高慶獅院士有著自己獨到的見解:“自然語言理解和處理不僅是一門社會需求巨大的應用技術,而且也是一門具有非常重要科學意義的自然科學。”[5](P3)這是因為從機器翻譯的理論基礎及其發展歷程分析具備實驗科學的定義。因此,我們認為機器翻譯技術兼有技術與科學雙重性,或者說兼有技術與科學兩種品質,應屬于技術科學的范疇。筆者認為,雖然機器翻譯冠名為“技術”,但實際上它主要是以多種學科于一體的復合型交叉學科,其理論根據主要是建立在多種學科的理論基礎之上的,這些學科的理論基礎缺一不可,它是一項將這些學科的理論基礎與技術融為一體的一個綜合體,它們之間具有相互包含的融合關系。換言之,機器翻譯技術是以理論科學為基礎的技術,對其而言在科學與技術之間的劃界不能簡單歸之于“是”與“非”的二值邏輯,也無法簡單把技術的重要組成部分:人類知識的三大部類——自然科學、社會科學和人文學科[8]進行隔離開,這種多重性的多個部分是緊密聯系無法分開的一個整體。也就是說,機器翻譯技術它又是一項技術科學,是一個由以上多重因素復合而成的復雜系統,在這里基礎科學是機器翻譯技術的基礎,如果把這項技術看作大樓,則基礎科學就是構建這座大樓的建筑材料,它是技術的基礎和源泉。機器翻譯技術是由科學理論推導出來的技術,沒有基礎科學做基礎,不可能產生出機器翻譯技術。

結語

筆者從多個方面考察了自然語言處理中機器翻譯技術在升級發展過程中的轉向態勢,它經歷了一個從無到有,由簡單到復雜、從低級到高級再到更高級的不尋常的轉向發展歷程。與很多技術轉向不同的是,機器翻譯技術的轉向是信息技術發展和市場需求共同作用的結果,這一結果正是為人類將語言學的研究從單純的語言學范疇拓展到計算機技術、數學、認知科學等多種看似毫無相關的多重領域的過程,通過分析使我們對機器翻譯技術在自然語言處理中的本質有了更深刻的認識和理解;同時,也使我們認識到了機器翻譯技術的轉向升級的規律和特點。實際上,每次翻譯技術的轉向升級也是由機器翻譯外的科學技術的進步推動而形成的,其過程由理性主義逐步過渡到經驗主義。當然,對于機器翻譯技術還面臨著許多一時難以解決的困境和問題,諸如自然語言中普遍存在的詞義問題,更細一點而言,如一詞多義、一義多詞、同形異義、詞義模糊、詞義歧義等問題;同樣小說、散文、詩歌等表現性文本的翻譯,還有思維、情感、語氣等都是在今后的機器翻譯中需要解決的問題。同時,翻譯技術還需要受翻譯規律和語言規律等客觀因素的制約,必須處理好“語言與技術”“翻譯與技術”“語言與文化”等之間的關系。這是因為世界上不論哪個國家或民族的語言,都蘊含著極其豐富的文化內涵,彰顯著不同國家或不同民族的文化精髓。“各國如何消除文化隔閡和文化發展過程中的歷史差異,以及文化呈現狀態上的形式差異和文化系統之間的不同層次差異,這是一帶一路'建設中最迫切的核心問題。”[9]機器翻譯是一種跨語言跨文化的交際活動,面對的是跨越語言與文化的雙重“屏障”。必須防止工具之上、工具無所不能的片面認識。在未來的自然語言處理領域,機器翻譯只能部分代替人工翻譯,將是人工翻譯與機器翻譯共存、人機協同、相輔相成的時代。我們應該看到,機器翻譯技術同一般技術具有共同的地方,也具有兩面性,不能只看到這一技術的優勢,這是孤立的、靜止的樂觀主義觀點;反過來也要警惕只看到這一技術的劣勢和不足,這是片面的悲觀主義觀點。應該全面、客觀、公正的評價機器翻譯這一科學技術,辯證地看待這一技術的轉向與發展態勢。

猜你喜歡
規則科學語言
撐竿跳規則的制定
數獨的規則和演變
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
科學大爆炸
小小藝術家(2019年6期)2019-06-24 17:39:44
讓語言描寫搖曳多姿
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
TPP反腐敗規則對我國的啟示
累積動態分析下的同聲傳譯語言壓縮
科學
我有我語言
主站蜘蛛池模板: 亚洲日韩第九十九页| 日韩一区精品视频一区二区| 久久熟女AV| 久草热视频在线| 欧美一区二区三区香蕉视 | 中国一级特黄视频| 99免费视频观看| 亚洲Av综合日韩精品久久久| 无码中文字幕乱码免费2| 一级爱做片免费观看久久| 国产微拍精品| 这里只有精品在线播放| 自拍偷拍欧美| 亚洲免费成人网| 欧美日韩亚洲综合在线观看| 精品视频一区二区观看| 国产精品大白天新婚身材| 亚洲久悠悠色悠在线播放| 亚洲资源在线视频| 国产v欧美v日韩v综合精品| 日本黄色不卡视频| 国产成人禁片在线观看| 中文字幕一区二区人妻电影| 日本高清成本人视频一区| 在线欧美a| 国产日韩精品欧美一区灰| 亚洲AV无码一二区三区在线播放| 老司机久久99久久精品播放| 97在线视频免费观看| 日韩欧美国产三级| 亚洲国产欧美目韩成人综合| 亚洲美女一区| 国产女人在线视频| 国产精品人人做人人爽人人添| 精品国产Ⅴ无码大片在线观看81| 在线国产毛片| 欧美五月婷婷| 国产成人免费高清AⅤ| 亚洲日韩精品无码专区97| 91久久天天躁狠狠躁夜夜| 网久久综合| 久久夜色精品| 国产亚洲欧美日本一二三本道| 亚洲国产欧美国产综合久久 | 色悠久久久| 美女免费黄网站| 凹凸国产熟女精品视频| 伊人成人在线| 国产美女自慰在线观看| 91美女视频在线| 国产99精品视频| a在线观看免费| 国产成人精品在线1区| 九九热视频在线免费观看| 人妻出轨无码中文一区二区| 一级成人a毛片免费播放| 免费xxxxx在线观看网站| 成人国产精品一级毛片天堂| 国产JIZzJIzz视频全部免费| 亚洲欧美日韩视频一区| 妇女自拍偷自拍亚洲精品| 亚洲福利一区二区三区| 国产青榴视频| 色哟哟国产成人精品| 亚洲视频免费在线看| 2021最新国产精品网站| 人人看人人鲁狠狠高清| 午夜毛片免费观看视频 | www.youjizz.com久久| 手机在线看片不卡中文字幕| 欧美.成人.综合在线| 亚洲第一成网站| 成年人福利视频| 亚洲欧美自拍中文| jizz在线观看| 国内黄色精品| 国产亚洲高清视频| 国产成人无码综合亚洲日韩不卡| 2021国产在线视频| 性视频久久| 亚洲 成人国产| 在线观看欧美国产|