999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工智能背景下英語術(shù)語自動識別與翻譯優(yōu)化研究

2025-09-28 00:00:00李依霏
中國科技術(shù)語 2025年5期

中圖分類號:TP391.1 DOI:10.12339/j.issn.1673-8578.2025.05.027

Research on Automatic Recognition and Translation Optimization of English Terminology under the Background of Artificial Intelligence//LI Yifei

Abstract:WitapidevelopntoftifcialintellgncetcholgtaditioalEgliserinolocogitionndaslati methodsfaceanyallges,chslowrocessingicyfreuenttinogbigityndotealaptlity thecontextoftewidespradaplicationofaturallanguageprocessingandpleanng odels,utomaticecogitioandtaslatio optimizationofEnglishtiologyhaveushedineoporunitiesfortechnologicalinnovationByintroducingprerdangage modelssuchasER,,etc.eracydomaindaptationdtraslatioconsistencyofteecogitioncanbesiiitly improved.Tisrticlestematallvisteuentplaonathoftifalintellgnceinermnolcogodtras lation,summaresitsainadvantagsandyicalsearios,alyskeythicalbotlenecks,ndproossultimesioaliprovementstrategiesfromalgorimoptization,datafusiontouman-machinecolaboratioimingtoprovidetoreticalspprtd practical paths for the intelligentization of professional language services.

Keywords:artificial intelligence;English terminology;automatic recognition;translation;optimization measures

0 引言

在全球化與技術(shù)驅(qū)動的雙重背景下,英語術(shù)語作為專業(yè)知識傳播與跨文化交流的核心語言資源,正面臨前所未有的更新速度與應(yīng)用廣度。傳統(tǒng)術(shù)語處理手段多依賴人工查閱、Excel表整理及靜態(tài)詞典支持,難以應(yīng)對術(shù)語體系多源異構(gòu)、變化頻繁及上下文依賴性強(qiáng)等現(xiàn)實需求。這種低效的處理方式不僅增加了譯者負(fù)擔(dān),也制約了語言服務(wù)行業(yè)的整體智能化轉(zhuǎn)型1。近年來,隨著深度學(xué)習(xí)、自然語言處理(NLP)知識圖譜等人工智能技術(shù)的迅速成熟,術(shù)語處理迎來了由“人主機(jī)輔”向“人機(jī)協(xié)同智能主導(dǎo)”的范式變革。尤其是以Transformer為核心架構(gòu)的大語言模型(如DeepSeek、RoBERTa、T5、GPT等)在大規(guī)模語料訓(xùn)練下展現(xiàn)出對專業(yè)術(shù)語語義的高度捕捉能力與語言生成能力,為術(shù)語自動識別與語境化翻譯提供了強(qiáng)有力支撐。

1英語術(shù)語自動識別技術(shù)現(xiàn)狀及發(fā)展瓶頸

1.1 術(shù)語識別技術(shù)演進(jìn)歷程

早期術(shù)語自動識別技術(shù)主要基于統(tǒng)計方法,如TF-IDF(詞頻—逆文檔頻率)、C-value、NC-value等權(quán)重算法,通過識別詞語在語料庫中的出現(xiàn)頻率與上下文關(guān)聯(lián)程度來判斷術(shù)語候選項。這類方法對大規(guī)模語料處理具有一定適應(yīng)性,但受限于語義理解能力,常在術(shù)語邊界識別、同義歧義判別上存在偏差。進(jìn)入21世紀(jì)后,機(jī)器學(xué)習(xí)方法逐步引入術(shù)語識別流程,如條件隨機(jī)場(CRF)、支持向量機(jī)(SVM)等算法,能夠在一定程度上學(xué)習(xí)術(shù)語的結(jié)構(gòu)與上下文模式,從而提升術(shù)語識別的準(zhǔn)確率與召回率。

近年來,以BERT、ERNIE、GPT為代表的預(yù)訓(xùn)練語言模型迅速崛起,術(shù)語識別技術(shù)進(jìn)入深度語義建模階段。這些大語言模型基于自注意力機(jī)制構(gòu)建多層語義表達(dá),可有效捕捉術(shù)語的上下文語義及跨句依存關(guān)系2」。模型在進(jìn)行術(shù)語識別任務(wù)時,通過微調(diào)(Fine-tuning)方式接入特定領(lǐng)域語料,即可在保持通用語義理解能力的同時,適配行業(yè)特有術(shù)語表達(dá),極大地提高了術(shù)語提取的精準(zhǔn)度與魯棒性。實驗研究表明,基于BERT的術(shù)語識別模型在醫(yī)學(xué)、法律、計算機(jī)等專業(yè)語料中的識別F1值普遍超過 90% ,遠(yuǎn)高于傳統(tǒng)模型。

1.2 當(dāng)前主流識別方法與應(yīng)用實踐

目前,術(shù)語識別在人工智能支持下呈現(xiàn)多路徑融合趨勢。主流方法大致可分為三類:一是基于深度學(xué)習(xí)的序列標(biāo)注方法,如BiLSTM-CRF、Transformer-CRF等,廣泛用于命名實體識別任務(wù)中,其在術(shù)語識別中也表現(xiàn)出良好的結(jié)構(gòu)建模能力;二是端到端的文本分類或片段識別模型,如基于BERT的Tokenclassification模型,可自動學(xué)習(xí)術(shù)語的上下文特征,無須人工設(shè)定詞性或模板;三是多模態(tài)與多通道融合方法,將詞向量、上下文向量、詞性特征、外部知識庫嵌入進(jìn)行集成,提高術(shù)語識別在低資源領(lǐng)域的穩(wěn)定性。

在實際運(yùn)用中,英語術(shù)語識別在法律合同智能審校、醫(yī)學(xué)文獻(xiàn)摘要提取、金融風(fēng)險詞匯檢測以及工程項目資料自動分類等場景中有著廣泛應(yīng)用,比如中國科學(xué)院自動化研究所開發(fā)的“智言術(shù)語識別平臺”,可支持中英文雙語術(shù)語的語義識別以及實時高亮顯示,擁有術(shù)語復(fù)現(xiàn)率檢測、術(shù)語相似度匹配以及可視化分析等功能,有效提高了翻譯前準(zhǔn)備階段的效率。

1.3 英語術(shù)語識別面臨的技術(shù)瓶頸

盡管現(xiàn)階段術(shù)語識別技術(shù)持續(xù)取得進(jìn)展,然而在應(yīng)用的廣度以及深度層面,依舊面臨著諸多瓶頸。(1)語義歧義問題較大。術(shù)語一般有很強(qiáng)的領(lǐng)域依賴性,同一個術(shù)語在不同的語境里會表達(dá)不一樣的概念,比如說“interface\"這個詞,在計算機(jī)領(lǐng)域所代表的意思是“接口”,然而在工程結(jié)構(gòu)方面,它有可能指的是“接合面”。傳統(tǒng)模型沒辦法有效地判別這種語義切換,就算是預(yù)訓(xùn)練模型,也得依靠大規(guī)模帶有標(biāo)簽的數(shù)據(jù),才可得到高置信度的輸出。(2)領(lǐng)域術(shù)語知識比較欠缺。雖然大語言模型有通用語料訓(xùn)練的優(yōu)勢,可是在醫(yī)藥、能源、軍事、核技術(shù)等冷門領(lǐng)域,由于缺乏高質(zhì)量的訓(xùn)練數(shù)據(jù),使得模型沒辦法精準(zhǔn)地學(xué)習(xí)術(shù)語語義表達(dá)以及詞義遷移規(guī)律,識別精度出現(xiàn)明顯下降,并且生成的結(jié)果大多存在“語義漂移”的現(xiàn)象。

2 英語術(shù)語智能翻譯優(yōu)化路徑分析

2.1上下文語義驅(qū)動的術(shù)語翻譯一致性提升機(jī)制

術(shù)語的最大特點(diǎn)在于語義高度凝練且概念邊界清晰,然而其意義大多時候依賴于上下文語境的限定,比如說,“margin”這個詞在經(jīng)濟(jì)學(xué)領(lǐng)域被譯為“利潤率”,在金融術(shù)語范疇中則可為“保證金”,在印刷行業(yè)里又可指“頁邊距”。傳統(tǒng)的翻譯手段一般是以詞表或者固定短語庫作為基礎(chǔ)的,缺少上下文建模機(jī)制,使得術(shù)語翻譯在多個場景中出現(xiàn)一致性欠佳、譯義存在偏差等問題。

由BERT或T5等預(yù)訓(xùn)練模型構(gòu)建而成的智能翻譯系統(tǒng),可憑借對上下文的深度建模,達(dá)成術(shù)語語義在句法結(jié)構(gòu)里的精確投射。比如在同一個句子中“interestmargin”和“grossprofit”同時出現(xiàn)時,大語言模型可依據(jù)語義聚類結(jié)果判定術(shù)語所處語境屬于財務(wù)報表范疇,統(tǒng)一翻譯口徑,自動調(diào)用金融術(shù)語子庫,輸出兼具專業(yè)性與一致性的譯文。借助上下文感知機(jī)制,還可有效判斷術(shù)語是否處于否定結(jié)構(gòu)、強(qiáng)調(diào)結(jié)構(gòu)或者非陳述句中,提高譯文在語法層面的自然度與邏輯性。

2.2 基于知識增強(qiáng)模型的術(shù)語翻譯準(zhǔn)確率優(yōu)化策略

通用語言模型在多數(shù)文本任務(wù)里有著出色表現(xiàn),然而在術(shù)語翻譯方面,存在專業(yè)語義不夠的問題。在冷門專業(yè)或者新興技術(shù)領(lǐng)域,因缺少訓(xùn)練語料的支持,生成的譯文大多時候會出現(xiàn)“語義漂移”或者“偽術(shù)語”的狀況。為處理這個問題,近些年來研究者提出了“知識提高型術(shù)語翻譯模型”的想法,也就是在語言模型的基礎(chǔ)上,融合專業(yè)術(shù)語知識圖譜、術(shù)語關(guān)系網(wǎng)絡(luò)等外部知識資源,以此提高模型對術(shù)語語義結(jié)構(gòu)以及譯文選項的理解能力[3]。

2.3 語義聚類與術(shù)語歸一的術(shù)語規(guī)范化方法

在涉及眾多文獻(xiàn)、多個項目以及多種語體的場景當(dāng)中,術(shù)語翻譯的一致性大多時候會因為譯員自身的個人偏好以及上下游語料不統(tǒng)一而陷入混亂。就拿“cloudcomputing\"這個詞來說,在一部分文檔里面被翻譯為“云計算”,然而在某些IT系統(tǒng)測試說明當(dāng)中卻被譯成了“云端處理”。術(shù)語存在多種不同的表述,給內(nèi)容審校以及系統(tǒng)集成工作帶來了極大的困擾。術(shù)語翻譯的規(guī)范化機(jī)制已然成為智能術(shù)語翻譯體系的關(guān)鍵部分,當(dāng)下主流的術(shù)語歸一化策略是采用“術(shù)語識別一語義聚類一最優(yōu)項生成一術(shù)語替換”這樣的四步方法。先是由識別模塊去定位術(shù)語候選,接著依靠聚類算法比如K-means、BERTEmbedding聚類等,將同義項或者概念相似的項整合起來,最后依據(jù)頻率、專業(yè)文獻(xiàn)權(quán)威程度、術(shù)語偏好標(biāo)準(zhǔn)等一系列原則挑選出最優(yōu)的譯項,以此完成整個流程的術(shù)語歸一化。比如說,工程建設(shè)領(lǐng)域的“l(fā)oad-bearingstructure”這個詞,智能翻譯系統(tǒng)可檢測到它在五個文檔里分別呈現(xiàn)為“承重構(gòu)件”“載重結(jié)構(gòu)”“受力骨架”等不同的表述,借助聚類算法來分析其語義的重疊性,把它統(tǒng)一替換為“承重結(jié)構(gòu)”,保證術(shù)語在項目周期內(nèi)的使用規(guī)范且統(tǒng)一。

2.4譯員交互反饋與人機(jī)協(xié)同的術(shù)語翻譯閉環(huán)機(jī)制

盡管當(dāng)前術(shù)語翻譯自動化水平不斷提高,但在人機(jī)協(xié)同的多輪翻譯流程中,譯員反饋依然是提升術(shù)語處理質(zhì)量不可或缺的核心環(huán)節(jié)。一方面,術(shù)語使用具有明顯領(lǐng)域主觀性與策略性,單靠機(jī)器無法完全判斷譯者對術(shù)語風(fēng)格、習(xí)慣用法、語域風(fēng)格的偏好;另一方面,譯員在使用智能術(shù)語翻譯系統(tǒng)時積累的大量反饋數(shù)據(jù),恰恰構(gòu)成術(shù)語優(yōu)化的關(guān)鍵資源。為實現(xiàn)術(shù)語翻譯的動態(tài)閉環(huán)優(yōu)化,目前部分術(shù)語系統(tǒng)已引入“術(shù)語譯文評分一個性化偏好建模一自適應(yīng)調(diào)整”的反饋機(jī)制。例如,譯員在項目A中選擇將“greenfieldinvestment”翻譯為“綠地投資”,系統(tǒng)將此記錄為領(lǐng)域偏好項,在項目B中若識別到語義相似的句式,可優(yōu)先推薦此術(shù)語譯項。同時,系統(tǒng)根據(jù)譯員對術(shù)語譯文的評分行為(如“準(zhǔn)確”“語義不當(dāng)\"“表達(dá)生硬”等標(biāo)簽)進(jìn)行樣本標(biāo)注,用于微調(diào)術(shù)語翻譯模塊,實現(xiàn)個性化術(shù)語生成。

3結(jié)語

在人工智能深度嵌人語言服務(wù)行業(yè)的時代背景下,英語術(shù)語的自動識別與智能翻譯正經(jīng)歷從“靜態(tài)處理”向“動態(tài)協(xié)同”的根本性轉(zhuǎn)型。本文圍繞術(shù)語識別技術(shù)演進(jìn)路徑、翻譯優(yōu)化機(jī)制及人機(jī)協(xié)同模式展開系統(tǒng)探討,指出以大語言模型為代表的智能技術(shù)已成為術(shù)語翻譯提質(zhì)增效的重要引擎。通過引入上下文語義建模、知識增強(qiáng)機(jī)制、語義聚類歸一化算法以及譯員反饋閉環(huán)體系,可顯著提升術(shù)語處理的準(zhǔn)確性、一致性與場景適應(yīng)能力,從根本上改變傳統(tǒng)術(shù)語管理效率低、靈活性差、譯文不統(tǒng)一等問題。

參考文獻(xiàn)

[1]雷達(dá)欣.科技類文本中專業(yè)術(shù)語翻譯的探討:以物流英語為例[J].現(xiàn)代語言學(xué),2024,12(12):5.

[2]李寧艷.基于機(jī)器視覺的英語自動翻譯語法錯誤檢測系統(tǒng)研究[J].自動化與儀器儀表,2023(3):279-283.

[3]邢浩,魏向清.金融英語翻譯教學(xué)中的術(shù)語意識培養(yǎng)[J].中國科技術(shù)語,2024,26(2):81-87.

主站蜘蛛池模板: 狠狠色狠狠色综合久久第一次| 三上悠亚一区二区| 多人乱p欧美在线观看| 在线欧美一区| 亚洲品质国产精品无码| 亚洲欧美不卡| 一区二区理伦视频| 亚洲人成网7777777国产| 国产成人亚洲精品色欲AV| 尤物午夜福利视频| 在线亚洲小视频| 欧美成人精品在线| 国产精品夜夜嗨视频免费视频| 性喷潮久久久久久久久| 又黄又爽视频好爽视频| 久草中文网| 国产尤物在线播放| 18黑白丝水手服自慰喷水网站| 国产亚洲日韩av在线| 啪啪免费视频一区二区| 欧美自拍另类欧美综合图区| 无码有码中文字幕| 免费黄色国产视频| 亚洲日韩国产精品无码专区| 99ri精品视频在线观看播放| 免费看久久精品99| 国产成人一区| 精品国产Av电影无码久久久| 91免费国产高清观看| 亚洲男人的天堂网| 国产女人18水真多毛片18精品| 女人18毛片久久| 日韩中文欧美| 国产精品性| 中文字幕 91| 久久精品波多野结衣| 亚洲中文字幕手机在线第一页| a级毛片免费在线观看| 97国产成人无码精品久久久| 成人夜夜嗨| 免费无码又爽又黄又刺激网站| 99久久精品国产综合婷婷| 国产人前露出系列视频| 99青青青精品视频在线| 亚亚洲乱码一二三四区| 亚洲区视频在线观看| 波多野结衣久久精品| 1769国产精品视频免费观看| 又粗又硬又大又爽免费视频播放| 久久久久青草线综合超碰| 精品91在线| 国产精品主播| 91精品国产91欠久久久久| 亚洲精品无码不卡在线播放| 欧美日韩午夜| 一级毛片基地| 好吊妞欧美视频免费| 在线观看免费人成视频色快速| 亚洲国产天堂久久综合| 欧美在线视频不卡第一页| 婷婷色狠狠干| 亚洲综合第一区| 亚洲精品黄| 在线无码私拍| 农村乱人伦一区二区| 中国美女**毛片录像在线| 婷婷午夜影院| 亚洲第一av网站| 亚洲中文字幕日产无码2021| 九九九久久国产精品| 视频一本大道香蕉久在线播放| 国产成人亚洲综合A∨在线播放| 日韩午夜福利在线观看| 成人欧美日韩| 狠狠色噜噜狠狠狠狠奇米777 | 中文字幕在线看视频一区二区三区| 国产香蕉在线视频| 国产福利大秀91| 亚洲欧美激情小说另类| P尤物久久99国产综合精品| 国产成人精品男人的天堂下载| 在线观看精品国产入口|