999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于石油學術期刊摘要語料庫的文本特征分析與詞匯比較

2024-01-27 13:41:44彭曉曉
現代商貿工業 2024年4期
關鍵詞:翻譯

彭曉曉

摘?要:本文利用AntConc語料庫工具,從文本和詞匯角度研究了TA語料庫,TA語料庫由505篇石油科技外文期刊摘要構成,含130?000詞。研究發現,TA中被動語態的使用頻率比AmE06_130語料庫高出19.35%;對于人稱代詞,“it”和“we”的頻率最高;oil的詞頻是petroleum的13倍。

關鍵詞:翻譯;語料庫研究;摘要語料庫;石油文本;AntConc

中圖分類號:F74?????文獻標識碼:A??????doi:10.19311/j.cnki.16723198.2024.04.022

1?數據收集及工具選擇

1.1?數據收集

本研究從《AAPG?Bulletin》《Bulletin?of?Canadian?Petroleum?Geology》《Journal?of?Petroleum?Science?and?Engineering》《Petroleum?Exploration?and?Development》和《Petroleum?Science》5個期刊中,選取了2022–2023年出版的505篇摘要,建立了一個130?000詞的摘要語料庫TA。相比以往研究,本研究的樣本數量擴大了一個數量級。從AmE06語料庫中,按分類等比例提取了約130?000詞內容,建立了參照語料庫AmE06_130,用于提取TA中的關鍵詞單。

1.2?工具選擇

AntConc是一款語料庫分析工具,支持Raw?files導入,或將多個Raw?files打包成(.DB)文件,方便切換語料庫。

2?文本特征分析

2.1?被動語態分析

正則表達式可以檢索被動語態結構,檢索前需對目標語料庫進行詞性標注處理。本研究利用TagAnt軟件完成了對語料庫的詞性標注。顯示信息設置為word+pos_tag,其余按照默認選項運行。標注完成后,經測試下列表達式能夠檢索被動語態結構:

(be|am|is|are|was|were)_VBw*s+w+_VBN

上述表達式會匹配這一結構:be動詞后面緊跟著一個過去分詞形式的動詞。結果如表1所示:

綜上所述,TA語料庫的被動語態使用頻次高出AmE06_130語料庫達19.35%。與以往研究結果相吻合,被動語態的使用頻率雖然高,但并未高過主動語態。

2.2?人稱代詞分析

英語中的人稱代詞共12種詞型,作者利用通配符檢索所有詞型,并核實結果對應的上下文判斷是否正確,再對錯誤結果進行修正。最終確定5種人稱代詞,結果如下:

數據顯示,“it”和“we”的使用頻率最高,其余人稱代詞均為復數形式,且僅有第一人稱和第三人稱形式。目標語料庫中沒有出現第一人稱單數形式(I和me),且沒有出現第二人稱的任何一種形式(you)。

2.3?N元模式分析

N-Gram工具可以生成目標文件中的N元列單。隨著Size逐漸增大,結果數量會逐漸減少。研究發現,數值設定為2-5時,檢測出的結果最具有代表性。我們截取了前100條結果,并將其中內容分為兩個大類:

(1)石油科技文本表達;

(2)摘要文本表達。

在N-Gram?Size設定為3的情況下,“oil?and?gas”的頻次最高。摘要文本表達相關的結果可歸為數個類別:表示“發現”、指代“本文”等。“石油科技”相關結果單獨歸為一類。

2.4?詞云圖分析

詞云圖能夠可視化詞單數據,通過字體大小和顏色深淺來體現詞重要性。生成詞云圖的數據樣本取自關鍵詞單。作者利用停用詞單(Stopword)對結果進行清洗(去除and,?of等虛詞)。處理完原始數據后,本文作者在詞云圖工具中,設置圖片尺寸寬900高450,最大詞數為300,輸出值為Keyness?(Likelihood)。

在生成的詞云圖中,顏色越深代表關鍵性越大,越淺則相反;字體大小同理。從圖中容易看出,“oil”的顏色深、字體大,而?“petroleum”則小許多,顏色也更淺,兩者在圖中的位置用箭頭進行了標示。

綜上所述,本節從被動語態、人稱代詞、N元模式和詞云圖等4個方面分析了目標語料庫的文本特征。主要進行了無檢索詞檢索,從側面觀察目標語料庫的文本特征。

3?Oil和Petroleum的檢索及結果的對比分析

3.1?詞頻分析

這部分研究選取的樣本是TA語料庫,參照語料庫為AmE06語料庫。本文作者在Word和Keyword功能中檢索oil和petroleum,發現前者的詞頻是后者的約13倍,關鍵性是后者的約15倍。

3.2?詞叢分析

詞叢分析運用Cluster工具對語料庫進行分析,Cluster?Size為2。為了抓取盡量多的數據,檢索oil時,最小頻次和文檔范圍都設置為3,檢索petroleum時,最小頻次和文檔范設置為2。分別勾選On?Left(檢索詞位于左端)和On?Right(檢索詞位于右端),進行兩次檢索并匯總,最后人工清洗檢索結果,去除噪音數據。清洗后數據顯示,在目標語料庫中petroleum的結果全部位于左端,而oil的結果左右都有。

Petroleum的檢索結果:

綜上所述,這部分研究從詞頻、詞叢和Plot分析三個方面研究了oil和petroleum的區別。結合詞頻和Plot分析,我們發現目標語料庫中oil的使用頻率和關鍵性遠高于petroleum,且前者的Dispersion最大值以及前十數據平均值也都高于后者,最后統計了檢索詞的位置頻數。

4?結語

本研究選取了505篇石油科技外文期刊摘要,建立了目標語料庫,利用AntConc對目標語料庫進行了檢索分析。一方面,本研究采用無檢索詞檢索,研究分析了目標語料庫的文本特征;另一方面,選取了oil和petroleum兩詞進行詞匯層面對比研究。但是,本研究中目標語料庫構成是一元的,oil和petroleum的詞頻對比數據需要在更大的語料庫且成分更多元的語料庫中進行驗證,希望為后續研究提供借鑒和參考。

參考文獻

[1]Anthony,?L.?(2022).?AntConc?(Version?4.2.0)?[Computer?Software].Tokyo,?Japan:?Waseda?University.Available?from?https://www.laurenceanthony.net/software.

[2]Qayyum?N,?Syed?S?F.?Gender?Representation?in?A?Thousand?Splendid?Suns:?A?Corpus-Based?Stylistic?Analysis[J].Journal?of?Excellence?in?Social?Sciences,2023,2(1):2036.

[3]陳柯,楊醫碩.基于AntConc3.2.4軟件的石油英語詞匯的檢索和分析[J].信息與電腦(理論版),2022,34(15):1014.

[4]崔艷秋.《出版人周刊》視域下的中國當代文學——基于AntConc語料分析[J].當代作家評論,2020,(04):189195.

[5]孫毅,王龍本.英文旅游新聞蓄意隱喻的理解與漢譯研究[J].外語教學理論與實踐,2020,(02):7280.

[6]王春艷.免費綠色軟件AntConc在外語教學和研究中的應用[J].外語電化教學,2009,(01):4548+78.

[7]王霞,姜孟.基于Antconc對近十年殘聯聽力障礙相關政策文件的特征分析[J].北京聯合大學學報,2020,34(02):7683.

[8]于強福.基于語料庫的工科碩士學位論文英文摘要語類使用問題及其對策探析[J].華北理工大學學報(社會科學版),2022,22(03):121128+154.

猜你喜歡
翻譯
從意識形態角度對《麥田里的守望者》兩譯本的研究
計算機輔助翻譯與教學設計探討
淺談英漢翻譯中的望文生義現象
人間(2016年28期)2016-11-10 23:42:36
從句子層面淺析英漢語言差異對翻譯的影響
中國文學作品外譯策略研究
淺談漢語顏色詞的解析及英譯
本科英語專業翻譯教學改革與實用型翻譯人才的培養
淺析跨文化交際
人間(2016年26期)2016-11-03 18:34:20
商務英語翻譯在國際貿易中的重要性及其應用
小議翻譯活動中的等值理論
考試周刊(2016年77期)2016-10-09 10:36:47
主站蜘蛛池模板: 中文字幕日韩欧美| 欧美自慰一级看片免费| 亚洲动漫h| 欧美日在线观看| 欧美高清国产| 爱做久久久久久| 免费又爽又刺激高潮网址| 国产精品一区二区久久精品无码| 国产精品自拍露脸视频| 国产成人无码久久久久毛片| 欧美97色| 欧美日本中文| 久久国产av麻豆| 最新国语自产精品视频在| 孕妇高潮太爽了在线观看免费| 国产乱人乱偷精品视频a人人澡| 国产极品粉嫩小泬免费看| 久久综合亚洲鲁鲁九月天| 无码专区在线观看| 精品亚洲麻豆1区2区3区| 在线亚洲精品福利网址导航| 午夜高清国产拍精品| 国产va在线| 久久精品国产精品青草app| 色天天综合久久久久综合片| 国产激情无码一区二区三区免费| 91人人妻人人做人人爽男同| 成人精品视频一区二区在线 | 久久久久久高潮白浆| 日本午夜视频在线观看| 久精品色妇丰满人妻| 国产三级视频网站| 在线欧美日韩国产| 亚洲视屏在线观看| 精品乱码久久久久久久| 91精品人妻一区二区| 欧美爱爱网| 91精品网站| 激情视频综合网| 爆乳熟妇一区二区三区| 亚洲中文字幕23页在线| 国产精品亚洲一区二区在线观看| 91亚洲精选| 五月丁香在线视频| 亚洲欧美人成电影在线观看| 国产色伊人| 中文国产成人精品久久| 国产91视频观看| 久久免费视频6| 国产小视频免费观看| 青青草原国产av福利网站| 亚洲日韩AV无码精品| 午夜a级毛片| 久久亚洲天堂| 54pao国产成人免费视频| 四虎成人免费毛片| 国内精品伊人久久久久7777人| 国产一二三区视频| 夜夜操国产| 久久a级片| 国产成人精品一区二区秒拍1o| 在线国产欧美| 欧美性色综合网| 久草视频精品| 青青草综合网| 2020久久国产综合精品swag| 自拍中文字幕| 狠狠亚洲五月天| 操美女免费网站| 波多野结衣久久精品| 黄色一及毛片| 亚洲熟妇AV日韩熟妇在线| 国产精品久久久久久久久kt| 性欧美在线| 免费三A级毛片视频| 97狠狠操| 在线一级毛片| 免费一级α片在线观看| 天堂岛国av无码免费无禁网站 | 91精品免费久久久| 1级黄色毛片| 在线观看国产网址你懂的|