【SLATOR】研究发现,神经机器翻译 (NMT) 字幕可以在没有专门培训的情况下进行字幕工作

文章标题:
【SLATOR】研究发现,神经机器翻译(NMT)字幕可以在没有专门培训的情况下进行字幕工作


链接:
https://slator.com/academia/nm ... inds/

概要:
NMT还没有广泛应用到字母翻译,然而,考虑到快速增长的内容量以及比以往任何时候都更大的截止日期和利润压力,机器翻译在字幕制作方面有很强的应用潜力。对此,Simon Reinsperger针对NMT对字母翻译的应用展开了一系列论证和猜想。
 
Reinsperger的第一个假设是,字幕翻译系统可以从学习翻译一般的领域句子中获益,然后再进行字幕翻译。
Reinsperger还认为,字幕的细微差别会给机器翻译带来挑战,但NMT使翻译预算不允许的内容成为可能。此外,日益紧迫的截止日期和资源限制的挑战使NMT在媒体本地化中成为一个有吸引力的前景。

Reinsperger利用WMT16等两个数据库进行进一步探究。
Reinsperger的研究假设是,字幕语料库很可能由于光学字符识别(OCR)错误、句子排列不当等原因而包含有噪声数据,因而使用底层通用语料库训练的模型比仅由字幕组成的模型性能更好。然而,实验结果证明,只接受字幕训练的模型略差于经过微调的模型。因此,可能不需要进行微调或特定领域的培训。

虽然NMT可能还没有被广泛地用于字幕制作,但媒体本地化的主要买家已经开始积极研究机器翻译。尽管如此,NMT应用到字幕翻译还有很长的一段路要走。


思考:
“神经机器翻译是否即将取代字母翻译员的饭碗”这样的问题毫无意义,作为本地化方向的学习者,我们不仅需要“术”(语言)还需要“器”(技能)的支撑,时刻让自己走在科技前沿。


问题:
在深度学习快速发展的今天,对于语言服务行业来说,如何普及NMT?


术语:
NMT/神经机器翻译
Finetuning/微调,特征提取器
OCR/光学字符识别


作者:
郝婧含
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向)

0 个评论

要回复文章请先登录注册