Skip to content

Latest commit

 

History

History
43 lines (16 loc) · 787 Bytes

Machine Translation Challenge.md

File metadata and controls

43 lines (16 loc) · 787 Bytes

refer: 朱靖波-东北大学 小牛翻译 知识星球

external knowledge

https://ttv.cn/archives/4719 机器翻译中外部知识的引入:两个实例, 张岳

domain machine translation

method 1

通过收集目标垂直领域的双语句对,直接训练垂直领域的机器翻译模型。

method 2

在通用机器翻译模型上,采用增量式训练调优。

method 3

领域自适应学习/迁移学习

method 4

采用目标垂直领域的双语术语词典缓解领域迁移问题。

method 5

利用目标垂直领域的单语数据构建伪数据进行增量式训练,引导通用机器翻译模型进行领域迁移。

(伪数据-即利用现有的翻译系统将单语翻译成多种语言以此构建平行语料)