嚴松思 珠 杰 汪 超
(1.西藏大學信息科學技術學院 拉薩 850000)(2.省部共建西藏信息化協同創新中心 拉薩 850000)
一方面,深入研究藏漢機器翻譯有助于非藏文母語的其他學者了解和掌握藏族的歷史和文化;另一方面,深入研究藏漢機器翻譯能夠促進民族之間的交往交流交融,有助于民族團結。因此藏漢機器翻譯研究有非常重要的意義。
藏漢機器翻譯近年來的研究進展如下。2017年李亞超等[1]研究了藏漢神經網絡機器翻譯;趙陽等[2]在CCMT2019評測中針對民漢機器翻譯采用知識蒸餾、反向翻譯+聯合訓練和多策略模型等方法,實驗結果表明,這些方法能夠有效提高翻譯的質量;2020年沙九等[3]探究了不同切分粒度的藏漢雙向神經機器翻譯,該文章提出了藏漢雙向機器翻譯的具有音節、詞語以及音詞融合的多粒度訓練方法;2020 年慈禎嘉措[4]通過單語語言模型的融合,迭代式回譯策略的應用提高了藏漢(漢藏)機器的效果;2021年沙九等[5]構建了面向司法領域的高質量開源藏漢平行語料庫;2021年頭旦才讓等[6]研究了基于改進字節對編碼的漢藏機器翻譯,該研究改進了字節對編碼算法,提出了帶字數閾值的藏文字節對編碼算法。2021 年劉賽虎[7]進行了基于注意力機制的藏漢雙語機器翻譯技術研究,該研究在不同切分粒度的實驗中,探討了以藏字漢字、藏詞漢詞、藏詞漢詞+BPE 三種切分粒度形態下的兩種模型的藏漢機器翻譯效果。2022 年孫義棟等[8]通過改進生成藏漢詞表來提升下游藏漢雙向翻譯性能。……