孫 夏
合肥師范學院 外國語學院,安徽 合肥230601
對翻譯質量的評價研究是近些年語言處理方向的研究熱點之一,對于翻譯系統的深入研究具有重要意義[1]。但當前翻譯準確性評定主要由相關領域的專家人工評價,但因各專家受自身的才能限制,導致結果準確性不高,不具有客觀性。
為此,國內有學者提出基于神經網絡的機器翻譯評價系統[2],如文獻[2]描述系統漢英翻譯,在基礎詞匯、句子準確度和流暢度方面效果較好,無效翻譯少,平均質量基本達到及格水準;與此同時,在罕見詞、復雜長句、隱性邏輯等方面也相對由于其他機械翻譯。上述研究結果表明,神經網絡機器翻譯質量較高,能為人類譯員提供高效輔助。不足之處是,機器翻譯存在無法克服的問題,尤其在文化、語境、交際等層面。文獻[3]設計并改進基于語義網絡的英語機器翻譯模型,采用基于向量混合的短語合成語義統計英語機器翻譯方法,在翻譯相似度模型中,經過帶權向量加法的計算,極易辨別兩個相似向量的不同之處,從而獲取精準的英語翻譯結果。
構建英語語義翻譯評定的約束對象模型,在語義相關度的最大關聯約束控制下[4],構建英語語義翻譯準確性評定的目標函數和約束參數集[5-6],可實現英語語義翻譯準確性評定和優化設計,最后進行仿真測試分析,展示了本文方法在提高英語語義翻譯準確性評定能力方面的優越性能。
考慮目前已有翻譯系統準確性不高、客觀性差的特點,從語義翻譯的角度入手,建立語義翻譯評定的約束對象模型。
為了實現基于無監督學習的英語語義翻譯準確性評定,構建英語語義翻譯評定的約束對象模型,采用上下文關聯映射方法[7],實現對英語語義翻譯準確性評價的模糊性融合處理。在英語語義上下文關聯映射本體映射分布的關聯規則約束控制下,得到英語語義上下文關聯映射的相似度特征分布系數為ω=(ω1,ω2,…,ωi),ωi∈[0,1],采用自然語言映射和語義本體模塊設計的方法,建立英語語義上下文關聯映射本體參數分布規則集,表示為:
式中,a表示英語語義上下文關聯詞片段,s表示英語語義上下文關聯映射。采用本體映射過程中概念之間語義特征分解的方法,得到英語語義上下文關聯模型表示為:

式中,表示關鍵字詞在全文中的權重。
在本體結構特征分布中,采用相似傳遞性原則實現對英語義分析過程中的塊匹配和特征提取[8],構建語義映射的關系集合,如圖1所示。

圖1 英語語義翻譯的語義映射關系集合
根據圖1所示的語義映射的關系集合分布,實現對上下文關聯映射語義檢索,計算每個子句的語義相似度值,采用強化的無監督學習方法[9],分析英語語義翻譯的語義本體特征集,建立本體之間多種語義映射模型[10],得到本體之間語義相關性特征量表示為β∈[0,1],即:

假設(sk,ak),k∈[-0.5,0.5)為上下文的本體結構特征分量,采用父概念(Super-Concept)和子概念(Sub-Concept)聯合特征分析的方法,英語語義翻譯準確性評定的模糊映射集為:

根據對英語語義翻譯準確性評定的最佳約束函數構造,得到語義不相交映射關系模型表示為:

式中,λi為語義不相交映射的模糊加權值,p為決策概率。研究本體之間的語義泛化關系,得到2個英語語義翻譯準確性評定的數據塊m1和m2,使用關聯語義模糊化解析模型[11],得到英語語義上下文的副本中的關聯度為:

建立英語語義翻譯準確性評定的語言語義相關度計算模型,采用無監督學習方法,得到英語語義翻譯的語義映射模型[12],如圖2所示。

圖2 語義本體結構特征構造
曾有人提出深度信任網絡無監督學習算法,通過無監督學習的方法來解決深度神經網絡在訓練上存在的問題。深度神經網絡具有較好的特征學習能力,通過學習獲得的特征更能對數據的本質進行描述,在數據可視化或分類等方面非常有效。采用無監督學習方法,實現對英語語義翻譯過程中的非語句主干的分段學習控制[13],通過邏輯推理的方法,得到英語語義翻譯的語義映射的關聯度模型表達式為:

式中,x為本體之間語義映射因子,y為語義標識的最優解析因子,Hi為概念詞語知識的語義分布函數。根據語義詞典庫和領域知識,采用無監督學習方法,得到語義翻譯準確性評估的特征函數為:

分析每個普通實詞的靜態語義特性,本文定義一個動態傳遞函數描述英語翻譯中存在的歧義項,進行上下文的語義映射[14],映射表達式為:

將各個分詞的語義特征量采用模糊聚類方法實現信息融合,得到不同本體的概念分布序列e={e1,e2,…,ei},將連接詞和逗號表示成析取形式,采用無監督的語義本體構造的方法,得到不同本體的概念之間的語義關聯維分布為:

其中,t為給定的映射集合,n為不同本體的兩個概念的相似度。語義等價模型為L(n),采用語義模糊化解析控制,得到無監督學習因子為:

根據上述分析,采用無監督學習方法,實現對英語語義翻譯過程中的非語句主干的分段學習,根據分段學習結果實現語義翻譯準確性評價。
隨著翻譯軟件的革新,英語機器翻譯軟件的準確度已不能滿足新的要求。在采用英語翻譯軟件進行英漢翻譯過程中,受到英語語句的歧義性和語言表達習慣等因素的影響,導致英漢翻譯中出現模糊語句,對語義的分析準確性不好,以致翻譯質量下降,需要進行英漢翻譯模型的優化設計。
在建立本體之間的語義映射時,把語義塊的j個英語語義翻譯的語義映射作為做信息包實現詞語知識融合,得到概念集為Xj,在有向圖節點模型中,將概念的語義表示成邏輯公式(g1,Y1),(g2,Y2),…,(gq,Yq),根據概念附近的各種本體相關性關系,得到語義標識過程的模糊度向量■,分析語義翻譯的準確性評估模型,根據語義成分的邏輯相關性關系,得到英語語義翻譯準確性評定結果,英語語義翻譯準確性評定的暫態函數為:

式中,tc為[n+1]的語義相似度分布特征序列,ta為參考本體與概念本體的融合系數,得到英語語義翻譯準確性評價的決策函數為:

在語義等價中,得到語義關系所對應的本體節點,定義兩點之間的相似度特征分布聚類中心,在語義相關度的最大關聯約束控制下,構建英語語義翻譯準確性評定的目標函數和約束參數集[15]。根據對英語語義翻譯準確性評定的無監督學習結果實現加權學習和自適應權重分析,結果如圖3所示。

圖3 英語語義翻譯準確性評定決策實現流程
為了測試本文方法在實現英語語義翻譯準確性評定的應用性能,進行試驗測試分析,試驗的場景如圖4所示。

圖4 試驗場景設定
根據圖2的英語語義翻譯準確性評定的實驗場景設定,設定英語語義翻譯語義評價集的個數為1 024個實例集,迭代次數為200,得到英語語義翻譯準確性評定的模糊決策屬性表見表1。

表1 英語語義翻譯準確性評定的模糊決策屬性表
分析表1結果,語義特征值越高,關聯系數和相似度系數越高。由此揭示:對于不同語義,相似度隨其特征值及關聯系數總體呈現出正相關的表征。
為實現英語語義翻譯準確性評定,英語語義翻譯準確性評定的目標函數變化值如圖5所示。

圖5 英語語義翻譯準確性評定的目標函數變化值
根據評定結果,測試英語語義翻譯準確性評定的收斂性,得到結果如圖6所示。
收斂性通常用于描述函數無限趨近于某值的性質,這里用一組函數計算結果的終值描述其收斂性,以進一步衡量翻譯的準確性。

圖6 收斂性分析
由圖6得知,本文方法實現英語語義翻譯準確性評定的收斂性較好。英語語義翻譯準確性評定的
穩定性較高,評定結果可靠。結果如下圖7。

圖7 準確性分析
綜上,本文實現英語語義翻譯準確性評定的方法具有穩定性高,評定結果準確的優勢。
本文提出基于無監督學習的英語語義翻譯準確性評定系統,采用相似傳遞性原則實現對英語語義分析過程中的塊匹配和特征提取。建立本體之間多種語義映射模型,首先構建語言的內部意義翻譯評定的約束對象模型,利用上下文關聯映射,模糊性融合處理英語語義翻譯準確性評價;其次根據英語語義上下文關聯映射本體映射分布的關聯規則約束控制,得到英語語義上下文關聯映射的相似度特征分布系數,以實現對上下文關聯映射語義檢索。根據語義詞典庫和領域知識,采用無監督學習方法,分析每個普通實詞的靜態語義特性;根據對英語語義翻譯準確性評定的無監督學習結果實現加權學習和自適應權重分析,由此實現英語語義翻譯準確性評定決策。