【TAUS】采访Unbable公司副总裁Alon Lavie:解决特定用例的端到端流程

链接:https://blog.taus.net/end-to-e ... lavie 


概要:

这篇文章阐述了机器翻译与人工编辑结合、数据与算法协调对于多语交流的重要性,提出了目前机器翻译领域待解决的难题,以及对未来创新发展的预测。

TAUS采访了国际翻译自动化专家Alon Lavie先生,他曾供职于Safaba和亚马逊,管理机器翻译团队,现为欧洲翻译公司Unbable的语言技术副总裁。

采访内容主要涵盖以下四个方面:

一、 Unbable面临的挑战

企业的需求实质是多语内容的传递与交流,Unbable的工作不是单纯的翻译,而是根据不同企业用例的特殊性,从多个角度考虑,利用技术服务翻译,结合机器翻译和人工编辑,为客户提供整套解决方案,有效解决特定用例。

二、 数据与算法

机器翻译在算法层面上的研究更注重神经结构、训练算法和解码等方面;企业需要翻译的数据涉及不同内容,如软件、网站、邮件等类型,面向的对象也有所不同。不同的数据类型需要采用不同的算法进行处理,二者相辅相成,合理搭配,可以更好地解决多语交流中的问题。

以往翻译项目中的数据分析是按照领域进行内容分类,将常规与定制机器翻译的实际问题过于简化,容易忽略上下文关系,不利于高质量译文的产出。目前已有多种注重上下文关系的机器翻译建模方法,数据组织方式十分重要,不仅需要协调常规数据和特定数据,更需要可以有效体现用例特点的数据,这是现今标准翻译记忆库也难以完整提供的。

三、 质量评估

Unbable发展初期在网络社区发布翻译任务,由世界各地的译者参与。伴随着快速扩张的业务,翻译质量评估体系的意义愈加凸显。一些企业需求的机器翻译质量需要达到人类译员水平,并人为评定译文是否达标。翻译自动化对企业意义重大,若能对机器翻译结果进行全面合理的质量评估,可以使其更好地与人工干预结合,协助判断是否需要人工编辑、以及需要何种人工编辑等问题。

多维翻译质量标准MQM可以定位机器翻译错误的区域,但批注仍需人工编写。双语翻译质量评估工具BLEU可以评估机器翻译的质量,但不考虑文本意义,且评判标准过于注重词汇匹配,容易造成语义错误、同义词难以识别等问题,导致评分不准确,因此参考意义比较有限。在质量评估上,我们还有很长的路要走。

四、 未来创新

翻译行业的底层结构和技术生态系统或将面临巨大的颠覆。未来的机器翻译与翻译记忆若能以新的方式融合,翻译记忆管理可能不再是翻译流程中的独立步骤,而是成为云软件服务。语言服务提供商也需要逐渐转型,构建新的基础设施,采用集成端到端流程,减少人工管理。


思考:

1. 翻译准确度
针对不同用途和对象,翻译公司与客户商讨后可以适当调整翻译的准确度,例如企业对内的简单交流有时只需达意即可,而经济法律领域和企业对外内容需要更加严谨;对于广告语等富有文化意义的内容,字词一一对应的翻译往往收效甚微,需要另辟蹊径以达到源语言在对应市场的效果。翻译公司可以根据准确度来调整机器翻译与人工编辑的比重,服务的价格也可以按照译员的参与度和工作量灵活地进行相应调整。

2. 人类译员的意义
尽管机器翻译发展迅速,一定程度上减轻了人类译员的劳动负担,但它无法思考、缺乏逻辑,仍然不能完全取代人类。在一些没有上下文的场景中,机器翻译很容易制造出让人哭笑不得的译文,例如爱彼迎曾发来一封标题为“只是检查”的邮件,内容却是充满温情的礼品确认信,阅毕难免令人尴尬。如果换成人类译员去翻译或审校,想必不会出现这样的闹剧。


问题:

机器翻译与译后编辑的质量评估标准有哪些异同?


术语:

End-to-end process / 端到端流程
Quality evaluation / 质量评定
State-of-the-art technology / 前沿技术
Multidimensional Quality Metrics (MQM) / 多维翻译质量标准
Bilingual Evaluation Understudy (BLEU) / 双语翻译质量评估工具作者:

张晓彤
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向)

0 个评论

要回复文章请先登录注册