999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語料庫語碼轉換在漢英翻譯認知加工中的應用研究

2021-12-02 05:21:52
銅陵學院學報 2021年5期
關鍵詞:句法語言英語

王 卉

(銅陵學院,安徽 銅陵 244061)

一、問題提出

語碼轉換是指在同一對話條件下,使用不同的語言變體形式的一種語言現象。由于它具有多維度的特點,因此可以在英語翻譯中滿足不同類型的需求,這種方式已經成為最受關注的語言接接觸現象。近些年,語碼轉換被應用在不同的學科領域中,對于語碼轉換的研究多集中在心理學、翻譯學和腦科學中,使用這種方式可以將單一的語言功能進行擴充,對于翻譯過程中的認知加工可能存在一定的影響。目前的語碼轉換已經有較多學者進行了研究,其中,程曉麗(2019)從社會文化理論的角度,分析了課堂語碼轉換應用中存在的問題,發現在課堂中需要從宏觀微觀、動態和靜態兩個角度來將不同的語言進行合理的應用[1];陳忠怡(2019)通過實際的調研發現中小學英語教學中存在語碼混亂的現象,這嚴重阻礙了小中小學英語教學的有序開展[2];王平(2020)認為在語碼轉換中需要強調說話者語言本體的含義,正確理解語碼轉換與超語的差異性,合理地利用對應的語言表達方式,這樣才能有效避免歧義內容的出現[3]。雖然現有的語碼轉換無論從語言形式上還是從句內研究模式上都較以往更為復雜,但是目前的句法仍缺乏經濟性、統一性和普適性。在研究方法上,目前的語碼轉換大多采用定性描述和舉例的方法,多從翻譯的句法和詞匯專業角度來進行分析,缺乏對單個詞匯的整體認知研究。基于以上問題,本文的核心在于解決語碼轉換在漢英翻譯認知加工中存在的問題。研究者以語法依存為理論依據,將依存距離和依存方向作為衡量指標,分析語碼轉換對于漢英翻譯句法變異的影響,以句法為研究對象,通過句子閱讀心理實驗驗證和自控步速實驗,給予語料庫,分析了單個詞匯語碼轉換認知加工影響因素,以期為漢英碼轉換的應用提供一定的研究思路。

二、文獻綜述

語碼轉換已經成為各個領域學者研究的熱門課題。其中,陳菲和王斌(2017)認為在網絡語言中,大量的語碼轉換現象已經被大眾所接受,通過對互聯網語碼轉換的特點分析,發現語言實現和心理動機會的提高會導致語碼轉換的主動性較低[4];Shan等者(2019)引入了多任務學習方式,將語言身份信息融入基本的漢英交流中,通過采用遷移學習的方式,將大量的單語普通話和英語數據用來補償語碼轉換數據存在的稀疏性問題,最終在漢英翻譯中的錯誤率僅為6.49%[5];Suurmeijer等(2020)研究了不同場域下,語碼轉換前后切換位置和切換方向與混合句子處理之間的關系,發現混合語句處理前后語碼轉換對于句子位置沒有顯著的影響,但是語碼轉換會影響翻譯的句子匹配程度[6];郭嬋嬋(2020)通過分析10年國內的語碼轉換發展過程,發現雖然近幾年國內語碼轉換研究較多,但是這些研究多集中在采用社會語言學的角度來分析語碼轉換存在的問題[7];Lee等(2021)提出了一種新的漢語代碼轉換自動語音識別方法,該方法充分考慮了漢語使用者在英語發音上的語言差異性,通過語義與目標域相似的句子,利用語言模型的自適應來處理因訓練數據不足引起的模型偏向問題,發現這種方法的錯誤率減少到了11.6%,糾正率提高了24.2%[8]。

漢英翻譯作為現在我們文化和思想的輸出的主陣地,受到了越來越多學者的重視。其中,蔡強和董冬冬(2020)通過使用神經網絡的方式來構建了漢英翻譯系統,發現科技論翻譯的錯誤目前主要集中在詞匯、句法、邏輯等方面上,且出現的錯誤頻率逐次遞減,針對上述問題,作者提出了對應的處理策略[9];李奉棲(2021)通過對翻譯學生漢英翻譯作品在銜接手段與專家組的文章進行差異性分析,發現目前翻譯專業學生在翻譯中存在人稱應用不足,詞匯過度重復,不善于應用詞語銜接等問題[10];通過將漢字分解成類似于印歐語系的語言單位,來啟用中文字符級方式,使用Wubi編碼方案和卷積神經網絡來處理對應的語義數據,發現該方案不但保留了字符的原始語義信息,還具有較好的模型預測結果;Li和Yu(2021)采用系統功能語言學方法,研究了中英文翻譯過程中存在的問題,研究發現翻譯人員可以使用多種選擇方式,去除和保留形合關系的選擇比簡單地將形合改變為形合意的選擇更為頻繁[11]。

對于語碼轉換已經有多個學科進行了研究,其中,語言學更加關注語碼轉換引起的語言和社會動因變化,在教育學中,則更多的是研究雙語或者多語方式在課堂教學中應用的實際效果,人類學主要用于研究種族文化、語言認同的關系研究,而心理學和腦科學中需要研究語碼轉換的心理機制、動因或不同語言轉換可能存在的大腦分布情況,在句法學中,更多的是研究語碼轉換的分布和限制規則。對于語言翻譯過程,通過語碼轉換可以有效提高翻譯效率和深度,因此本文聚焦該問題,通過實際的語料庫來分析語碼轉換在漢英翻譯認知加工中存在的問題,針對相關的問題分析其內在的機制機理,并最終提出合適的解決方案。

三、語料庫搭建測試

(一)語料庫構建

基于語料庫的方式是自然語言處理領域研究的熱點問題。部分學者通過將句式、詞義和語篇等內容標注分類構建成對應的庫文件。本文采用語料庫是根據依存語法標注的,主要由于該種方式不但能夠進行詞類的定量分析,還有助于找到不同句子的依存關系,與未經標注的句子相比,經過建庫的句子具有更多語言句法結構。研究者收集了主流媒體上的內容作為語言庫的構建,對于庫的內容以兩者報道同樣的內容為參考依據,其中漢語庫包含23,706個詞語,而英語庫包含792,819個單詞,采用統計學軟件按照支配詞、從屬詞的對應依存關系進行合理分類。

本文構建的漢英語碼轉換依存樹庫包含19,766個詞匯,其中,漢語為17,268個,英語為3698個,其中有186,952個依存關系,漢語單語依存關系(C-C)為13,698個,英語單語依存關系(E-E)為1,586個,漢語支配英語從屬混雜依存關系(C-E)為1,596個,英語支配漢語從屬混雜關系(E-C)為1,769個。我們采用依存關系、依存距離、依存方向作為衡量指標,根據統計的結果來分析語碼轉換對于漢英翻譯的影響。

(二)依存關系分析

對于語碼轉換在漢英翻譯中的應用,我們主要選取依存距離、依存方向兩個維度來分析,其中依存距離是漢英翻譯分析中的重要指標,主要是指支配詞與從屬詞之間的線性距離,依存距離可以幫助理解句子的難度,依存距離越大,句法分析的難度就越難。另外依存距離還與助理理解支配詞前后的語言順序,有助于自然語言句法的分析。對于漢語語言來說,只有60%的從屬詞與支配詞相鄰,這明顯低于現有的英語平均水平78%,也低于德語平均水平的65%。漢語語序中支配詞的依存距離遠遠大于支配詞。另外依存距離還可以測量人類語言生成和理解的認知加工難度。平均依存距離是將不同的句子的所有依存距離進行求和平均,確定文章的平均從屬詞與支配詞之間的關系。依存方向語言詞序類型分類的有效指標,有的文章從屬詞位于支配詞之前,有的文章從屬詞位于支配詞之后。通過平均依存距離可以發現句子中存在的變異機器語碼轉換加工消耗程度,在漢英語碼轉換中包含單語依存和混雜依存兩種關系,而語碼轉換多出現在依存較長的句法中,且混雜依存相比單語依存具有更長的平均依存距離。

四、依存效應分析

(一)依存變異效應分析

通過數據分析可見,相比于單一的漢語和英語平均句長來講,基于語料庫的平均句長更長,且具有顯著性差異(p〈0.001),而對于依存距離,基于語料庫的語言與單一漢語語言具有相同的平均依存距離。通過對相鄰詞間的依存關系和支配詞局前后的占比情況,分析發現三種語言形式的相鄰詞間依存關系占比基本一致,單一的英語語言占比稍高為51.3%,而基于語料庫的相鄰詞匯之間的依存關系占比為48.3%,高于漢語依存關系中的47.9%。支配詞局占比前最多的為語料庫和英語語言,而在支配詞之后漢語占比明顯提高。基于以上數據說明了在依存方向上,漢英語碼轉換庫中存在詞序變異現象。

為了進一步明確基于語料庫的語碼轉換在漢英翻譯中混雜依存效應與單語依存效應的關系,將本文地語料庫與前人研究的成熟Eppler語料庫進行對比分析,發現在單語依存的漢語為支配英語為從屬的依存距離顯著大于英語為支配漢語為從屬的依存距離(p〈0.05),而混雜依存的漢語為支配英語為從屬依存距離也極顯著的大于英語為支配漢語為從屬依存距離(p〈0.01)。單語依存中漢語為支配英語為從屬依存距離顯著大于單語英語依存距離(p〈0.01),但是在混雜依存關系中卻相反。這主要是由于對于語言紅的支配詞與從屬詞會隨著依存距離的變化而產生變化,其中依存距離越長,語碼轉換的可能性就會越高。我們取平均值進行了對比發現本文提出的基于語料庫的語碼轉換與Eppler單語依存關系均小于混雜依存關系。以上結果證明了:語碼轉換較為容易地出現在具有較長依存關系的句子中。

(二)單語依存效應分析

為了進一步明確語碼轉換在長距離漢英翻譯句法關系的作用。研究選取了常用的四種依存關系CC、C-E、E-E、E-C,采用四種主要的Subj-主語、Obj-賓語、Atr-定語和Avda-狀語來分析不同句法中的詞匯關系,圖1(a)為漢語單語和英語單語中四種句法依存關系結果,從圖中可以看出:不同的句法關系和依存類型均具有不同的平均依存距離,而相比于英語來講,漢語的平均依存距離更長,其中差異性最大的為主語,達到了極顯著的水平,這主要是由于漢語中特有的短句或者結構性語句作為了主語,如:被、把、將等詞語會被放置于主語的后面或者動詞的前面,如圖1(b)所示,我-當之間的依存距離在漢語中由于介詞的存在使其依存距離為3,而在英語中Itreat之間僅僅為1的依存距離。

圖1 漢語與英語單語在不同句法中存在的差異性

對于漢語的賓語和英語的賓語之間的依存距離也具有顯著的差異性。其中漢語單依存的關系為40%,但是在英語中卻高達60%。漢語中:我買了這本書,動詞與名詞之間的依存距離為4,但是英語中I-bought之間的依存距離僅僅為1。由此可以看出,對于語碼轉換可能在漢英翻譯中通過詞匯關系來判斷并確定這種依存距離。

(三)混雜依存效應分析

為了進一步明確混雜依存關系中漢語句法相比英語句法具有更長的平均依存距離的原因。我們分析了漢語單語和以漢語為支配英語為從屬的混雜依存關系中不同句法之間存在的依存距離差異性,發現:在混雜依存關系中主語和賓語發生語碼轉換的頻率明顯高于定語和狀語,其所有的句法中均相比單語依存關系具有更長的依存距離,大部分的主語和賓語平均依存距離均大于2,而主語發生語碼轉換的頻率相對較低,在狀語中漢語的依存關系明顯高于漢英過程。這也就說明了發生語碼轉換的主語和賓語會處于整個句子的邊緣中。

如圖2所示,分析了英語單語和以英語為支配漢語為從屬的混雜依存關系中不同句法之間存在的依存距離差異性,圖a對應的依存距離關系,發現在混雜依存關系中定語發生語碼轉換的頻率明顯低于主語和狀語,大部分的英語從屬詞都為形容詞和名詞,從英語到漢語的平均依存距離比從英語到英語的更長,主語中平均依存距離大于2的占比為90%,但是在英語中僅僅占比為20%,但是在英語中主謂語序平均依存距離更長,這就說明了語碼轉換的主語會在漢英翻譯中被轉移到邊緣中。圖b為具體的實例,其中在沒有經過翻譯的結構中理解-一切的平均依存距離為5,但是在翻譯后縮短了平均依存距離,這understand-everything的距離僅僅為1。由此也就說明了,混雜依存會提高英語句法的平均依存距離。

圖2 英語單語混雜依存關系中不同句法之間存在的依存距離差異性

(四)詞序變異效應分析

如圖3所示,圖a為語碼轉換漢英翻譯的主要詞序分布情況,其中漢語單語依存中支配詞前后的依存關系為60.9%,支配詞在前部分的分布為39.1%,這也就說明了漢語是支配詞居后的語言,而在英語中由于句法結構的不同,支配詞居后的依存關系占比為48.1%,支配詞局前的依存關系占比為51.9%,這也就說明了英語是支配詞居中的語言。圖b為不同語言形式依存關系分布情況,發現漢語到英語中的支配詞前占比較高,而在支配詞后的占比較低,對于英語到漢語的翻譯過程,支配詞后的占比較高,對于支配詞后的占比較低,這主要是由于混雜依存類型中依存方向中的不同導致了語碼轉換的詞序變異,從而影響了漢英翻譯的質量。

圖3 漢英語碼轉換單語和混雜依存分布與句法依存關系分布情況

如圖4所示,圖(a)為不同句法類型中的依存關系分布情況,發現在英語到漢語的翻譯過程中,支配詞居后的類型高于支配詞居前的依存關系,與英語到英語的翻譯過程,英語到漢語中定語額狀語的分布情況較高,這可能是英語到漢語翻譯過程中賓語的分布較低引起的。圖(b)為單語和混雜依存關系在不同句法關系中依存分布情況,發現英語到漢語翻譯過程中定語和狀語的依存方向大部分為支配詞居后,而賓語中的支配詞相比會稍微靠前,由此可以看出:定語、狀語比例決定了支配詞居后的依存關系。

圖4 英語單語混雜依存關系中不同句法之間存在的依存距離差異性

五、結果討論

本研究構建的依存庫核心是分析真實的語言結構,通過相同手法的有效標注,也為的定量化問題提供了數據支撐。從句法結構上看,相比于單一的漢語和英語語料,本文構建的語料庫在相同的支配詞前提下具有更長的依存距離,這也進一步證明了關于語碼轉換中難度變換的假設。但是在語碼轉換漢英翻譯中,由于基于語料庫的平均依存距離高于單獨的英語依存距離,但是該值仍在一定的范圍內,這與前人的研究保持了一致性。對于語法關系,研究發現語法在句法結構中扮演重要的角色,其中在混雜依存中平均的依存距離會比單獨的方式更為可靠,尤其是在語碼轉換中漢英翻譯,其中英語支配漢語從屬在平均依存距離上高于漢語支配英語從屬,其中主語、定語和賓語會在語碼轉換中由于漢英翻譯的特點進行一定程度的調整。這種方式雖然暫時沒有相關學者論述,但是在這在相關文獻中也有所提及。在句語法關系中,單語依存和混雜依存中詞匯的分布差異性導致了依存方向上具有不同的變異現象發生,雖然漢英之間存在語言的差異性,但可以借助語料庫和翻譯來降低文化差異性,從而提高翻譯效率。

本文在分析語碼轉換在漢英翻譯中存在問題的基礎之上,從句法和認知兩個角度入手,通過真實的語料庫進行構建,從依存距離和依存方向為衡量指標,利用定性和定量兩種方法對比來分析不同依存條件下的語碼轉換句法和詞匯之間存在的差異性,其中,語碼轉換主要存在依存距離和方向的詞序變異,混雜依存相比單語依存具有更長的距離,句法關系在不同依存的分布情況決定了依存方向的差異性,而語碼轉換在一定程度上可以改變漢英含義中的詞類分布情況。雖然本文解析了其語碼轉換中漢英翻譯認知加工中存在的問題,但是文中還存在諸多的不足:首先,雖然通過自建的語料庫來對不同語碼轉換和句子變異問題進行了分析,但是都采用了相同的標注手段,而不同的語料建庫方式會對最終的翻譯結果產生較大的影響;其次,在本文僅僅針對語碼轉換在漢英翻譯中的認知加工方式進行了簡單的解析,并沒有深入地挖掘其內在的其他學科方面的內容。后續研究者會在這兩個方面進行深入的研究分析,進一步完善語料庫有效解析其內在的機制機理。

猜你喜歡
句法語言英語
句法與句意(外一篇)
中華詩詞(2021年3期)2021-12-31 08:07:22
述謂結構與英語句法配置
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
句法二題
中華詩詞(2018年3期)2018-08-01 06:40:40
讓語言描寫搖曳多姿
詩詞聯句句法梳理
中華詩詞(2018年11期)2018-03-26 06:41:32
累積動態分析下的同聲傳譯語言壓縮
讀英語
我有我語言
酷酷英語林
主站蜘蛛池模板: 免费在线成人网| 亚州AV秘 一区二区三区| 成人小视频在线观看免费| 国产系列在线| 国产一二三区在线| 伊人久久久大香线蕉综合直播| 中文字幕av无码不卡免费| 成年A级毛片| 日本国产在线| 日韩亚洲综合在线| 香蕉99国内自产自拍视频| 欧美一级夜夜爽| 美女被操91视频| 午夜毛片免费观看视频 | 国产sm重味一区二区三区| 亚洲日韩国产精品综合在线观看| 日韩欧美中文| 伊人成人在线| 亚洲色图欧美在线| 亚洲视屏在线观看| 欧美中文字幕一区| 91丝袜在线观看| 欧美中文字幕一区| 亚洲开心婷婷中文字幕| 亚洲最大综合网| 色九九视频| 91在线播放国产| 亚洲综合中文字幕国产精品欧美 | 国产理论一区| 99国产在线视频| 99在线免费播放| 不卡午夜视频| 日韩免费无码人妻系列| 欧洲欧美人成免费全部视频| 污网站在线观看视频| 亚洲精品中文字幕无乱码| 国产成年无码AⅤ片在线| 欧美成人h精品网站| 毛片一级在线| 国产精品美女免费视频大全| 久久夜色精品| 欧美日韩免费在线视频| 亚洲性影院| 最新痴汉在线无码AV| 久久精品视频亚洲| 成人一区在线| 波多野结衣一二三| 国产亚洲欧美另类一区二区| 99热精品久久| 日韩在线第三页| 久久婷婷人人澡人人爱91| 国产视频大全| 国产97公开成人免费视频| 欧美综合一区二区三区| 免费亚洲成人| 国产精品无码制服丝袜| 美女高潮全身流白浆福利区| 国产尤物视频在线| 午夜毛片免费看| 欧美三级视频在线播放| 亚洲日本中文综合在线| 日韩中文无码av超清| 在线看AV天堂| 少妇高潮惨叫久久久久久| 色综合久久88| 国产成人无码久久久久毛片| 亚洲中文无码av永久伊人| 国产高清又黄又嫩的免费视频网站| 全免费a级毛片免费看不卡| 在线观看国产小视频| 中文成人在线视频| 91精品小视频| 亚洲高清无码久久久| 精品国产网站| 欧美性精品| 国产一区二区精品高清在线观看| 欧美区一区| AV老司机AV天堂| 国产成人综合日韩精品无码不卡| 真实国产乱子伦高清| 国产成人综合日韩精品无码不卡| 99这里只有精品6|