【GALA】7个步骤:成功完成在线学习本地化录制

陈鑫 发表了文章 • 0 个评论 • 272 次浏览 • 2019-05-07 20:58 • 来自相关话题

链接:
https://www.gala-global.org/bl ... rding
 
概要:
本文作者是本地化企业博芬(Boffin)的子公司VideoLocalize的首席执行官Richard Shi。作者首先简单介绍了音频对于在线学习的重要性,然后提出了博芬的7步流程。这一套流程可以达到以目标语言制作高质量的录音,提升在线学习体验感的目的。
 
要成功录制高质量的在线学习音频,需要完成以下步骤:
 
1.准备标准的语音样本
根据课程提供的故事脚本,Boffin能够识别不同的录制场景和角色特征。角色的特征分为性别、年龄、性格和职业。然后,公司会提供几个可以选择的对应语音样本。此外,为了节省时间,避免意外,公司还会再选择一名语音人员作为备用。
 
2.创建发音指南
脚本中的某些单词可能会不同的发音,在语种不同的情况下也会出现不同。此类单词包括公司名称、产品名称或者品牌名称,以及序列号等。
因此,录制开始之前,公司会和语音人员一起识别这些单词,并与客户确认发音。这样也可以避免音频中出现错误发音,从而减少可能浪费的项目时间和成本。
 
3.录制自定义语音样本
为了确保录制好的音频具有一致的风格和节奏,同时,特殊单词的发音也是正确的,公司会要求对应的语音人员为客户提供特定项目的记录样本。如果客户有不满意,公司会要求语音人员进行相应调整。如果该人员无法满足客户要求,公司可能会更换语音人员。这一步是确保所选择的语音人员适合特定项目的关键步骤。
 
4.录制音频
上述准备工作完成之后,公司会向所选择的语音人员发送必要的项目文件,启动项目的实际记录工作。这些文件包括:
(1)脚本。包含文件名称、录制文本、角色和人员名称。其中还会使用彩色来凸显字符的变化。
(2)特殊词汇发音指南
(3)批准的样本
(4)样式和格式记录要求
 
5.确保质量
公司会将录制的文件和脚本发送给另一个目标语母语人士,检查内容和发音的准确性。如果发现问题,该人士会在脚本中记录下来并返回给公司。
 
6.识别并纠正问题
上一步完成之后,这一步将解决记录下来的问题,例如缺少文本、误读、重读和发音错误等。这些问题部分会交给语音人员重新录制,并且,样式、格式、音量都要求一致。
 
7.后期制作
公司常用的后期制作软件是Adobe Audition和Sony Sound Forge等。主要编辑的内容有:降噪、音量一致化、音频拆分、格式转换。
 
 
思考:
1.录制本地化音频看似简单,实际却涵盖了许多细节,需要整个专业的团队协调才能处理得当。本地化本身就包含许多部分,不可轻视任何一个环节。
 
问题:
1.要成为一名本地化项目人才,是否需要系统学习并掌握Adobe Audition这类专业软件?
 
术语:
pickup(s) / 问题
storyboard / 故事脚本
noise reduction / 降噪
 
作者:
陈鑫
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向)
  
 
 
 
 
 
  查看全部
链接:
https://www.gala-global.org/bl ... rding
 
概要:
本文作者是本地化企业博芬(Boffin)的子公司VideoLocalize的首席执行官Richard Shi。作者首先简单介绍了音频对于在线学习的重要性,然后提出了博芬的7步流程。这一套流程可以达到以目标语言制作高质量的录音,提升在线学习体验感的目的。
 
要成功录制高质量的在线学习音频,需要完成以下步骤:
 
1.准备标准的语音样本
根据课程提供的故事脚本,Boffin能够识别不同的录制场景和角色特征。角色的特征分为性别、年龄、性格和职业。然后,公司会提供几个可以选择的对应语音样本。此外,为了节省时间,避免意外,公司还会再选择一名语音人员作为备用。
 
2.创建发音指南
脚本中的某些单词可能会不同的发音,在语种不同的情况下也会出现不同。此类单词包括公司名称、产品名称或者品牌名称,以及序列号等。
因此,录制开始之前,公司会和语音人员一起识别这些单词,并与客户确认发音。这样也可以避免音频中出现错误发音,从而减少可能浪费的项目时间和成本。
 
3.录制自定义语音样本
为了确保录制好的音频具有一致的风格和节奏,同时,特殊单词的发音也是正确的,公司会要求对应的语音人员为客户提供特定项目的记录样本。如果客户有不满意,公司会要求语音人员进行相应调整。如果该人员无法满足客户要求,公司可能会更换语音人员。这一步是确保所选择的语音人员适合特定项目的关键步骤。
 
4.录制音频
上述准备工作完成之后,公司会向所选择的语音人员发送必要的项目文件,启动项目的实际记录工作。这些文件包括:
(1)脚本。包含文件名称、录制文本、角色和人员名称。其中还会使用彩色来凸显字符的变化。
(2)特殊词汇发音指南
(3)批准的样本
(4)样式和格式记录要求
 
5.确保质量
公司会将录制的文件和脚本发送给另一个目标语母语人士,检查内容和发音的准确性。如果发现问题,该人士会在脚本中记录下来并返回给公司。
 
6.识别并纠正问题
上一步完成之后,这一步将解决记录下来的问题,例如缺少文本、误读、重读和发音错误等。这些问题部分会交给语音人员重新录制,并且,样式、格式、音量都要求一致。
 
7.后期制作
公司常用的后期制作软件是Adobe Audition和Sony Sound Forge等。主要编辑的内容有:降噪、音量一致化、音频拆分、格式转换。
 
 
思考:
1.录制本地化音频看似简单,实际却涵盖了许多细节,需要整个专业的团队协调才能处理得当。本地化本身就包含许多部分,不可轻视任何一个环节。
 
问题:
1.要成为一名本地化项目人才,是否需要系统学习并掌握Adobe Audition这类专业软件?
 
术语:
pickup(s) / 问题
storyboard / 故事脚本
noise reduction / 降噪
 
作者:
陈鑫
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向)
  
 
 
 
 
 
 

【SLATOR】关于的机译后编辑看法的调查

SherryZhang 发表了文章 • 1 个评论 • 404 次浏览 • 2019-05-05 21:23 • 来自相关话题

链接:https://slator.com/academia/su ... lsps/
 概要:
文章第一部分交代了两项调查的内容。首先这两项调查由博士生Clara Ginovart发起,主要研究从业者对机器翻译后编辑(PEMT)的看法。
第一次调查旨在从商业角度来考察PEMT现状。本次调查的66名受访者均有外包机器翻译编辑的经验。
第二项调查旨在从译后编辑角度考察PEMT。142名受访者中84%为自由译者或独立译者。
 
第二部分:资源模型、容量和内容类型
1、LSP为后期编辑任务提供了多种模型。85%的人表示,他们在一定程度上依赖于一群自由的后期编辑人员,而少数人(15%)表示,他们不外包任何后期编辑任务。
2、超过一半(58%)的LSP受访者表示,他们会在内部进行某种形式的后期编辑。
3、大多数LSP受访者(56%)称,是否使用后期编辑工作流由客户决定,而41%的人说这个决定是内部做出的。
4、在58名LSP受访者中,有60%表示,他们在使用机器翻译时会通知客户。
5、在96名自由职业者受访者中,大多数人(78%)表示,他们做的大部分后期编辑工作是针对LSP的,而只有20%的人表示,他们做的大部分后期编辑工作是针对直接客户的。
6、四分之三的人说,客户负责决定是否适当使用PEMT,而18%的人说他们自己选择是否使用PEMT。
7、73%的LSP受访者和62%的后期编辑表示,后期编辑在所有翻译工作中所占比例不超过25%。同样数量的LSP受访者(21%)和后期编辑(18%)表示,后期编辑占所有翻译工作的26%至50%。
8、100名后期编辑表示,他们后期编辑了高能见度的内容(供公众消费),67名后期编辑表示,他们后期编辑了低能见度的内容(供有限传播)。
 
第三部分:产品质量与质量管理
大多数LSP受访者(73%)表示,达到专业人工翻译水平是机译后编辑最常见的标准。
LSP受访者和译后编辑发现这样一个差异: 73%LSP受访者和42%的机译后编辑认为后期编译包括将中等质量译文修改至出版级别,而56%的译后编辑称,他们被要求将较差译文修改到一般水平。
另一差异在于受访者接受的说明水平:46%的译后编辑表示尽管译后编辑工作效率高于LSP受访者,他们未收到PEMT指南。
 
第四部分:工具及培训
常见的机器翻译工具包括谷歌、DeepL、SDL (Adaptive MT、Language Cloud或ETS)、Amazon Translate和SYSTRAN。对于后期编辑和LSPs,最常用的工具(CAT)是SDL Trados Studio,其他工具包括memoQ、Memsource、Wordfast、MateCat、Smartcat、Across、Transifex、localalize和GlobalSight。
顶级QA工具有Xbench和none,LSPs的下一个首选选项是Verifika和QA Distiller,而后期编辑则使用更广泛的QA工具。
对于现有的PEMT培训课程的质量,LSPs和后期编辑都有不同的看法:41个后期编辑认为课程不够好,45个后期编辑认为课程足够好。一些后期编辑(23%)接受过公司提供的培训课程,少数人接受过外部培训(12%),或是在大学里接受过培训(8%)。42%的LSP受访者认为目前的PEMT培训课程不够,35%的受访者持相反意见。
53%的后期编辑表示,他们从未参加过PEMT培训课程,而三分之二(67%)的LSP表示,他们尚未组织过有关PEMT的具体培训。
 
思考:记得和一位中公老师讨论过机器翻译后再处理是否有违职业道德的问题。他认为修改机器翻译结果所得到的译文质量永远不会达到纯人工翻译水平,所以使用机器翻译对文本进行初步加工,再对译文修改是对客户的不负责任。
 
术语:
PEMT post-editing of machine translation 机器翻译后处理
 
作者:
张雪薇
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向) 查看全部
链接:https://slator.com/academia/su ... lsps/
 概要:
文章第一部分交代了两项调查的内容。首先这两项调查由博士生Clara Ginovart发起,主要研究从业者对机器翻译后编辑(PEMT)的看法。
第一次调查旨在从商业角度来考察PEMT现状。本次调查的66名受访者均有外包机器翻译编辑的经验。
第二项调查旨在从译后编辑角度考察PEMT。142名受访者中84%为自由译者或独立译者。
 
第二部分:资源模型、容量和内容类型
1、LSP为后期编辑任务提供了多种模型。85%的人表示,他们在一定程度上依赖于一群自由的后期编辑人员,而少数人(15%)表示,他们不外包任何后期编辑任务。
2、超过一半(58%)的LSP受访者表示,他们会在内部进行某种形式的后期编辑。
3、大多数LSP受访者(56%)称,是否使用后期编辑工作流由客户决定,而41%的人说这个决定是内部做出的。
4、在58名LSP受访者中,有60%表示,他们在使用机器翻译时会通知客户。
5、在96名自由职业者受访者中,大多数人(78%)表示,他们做的大部分后期编辑工作是针对LSP的,而只有20%的人表示,他们做的大部分后期编辑工作是针对直接客户的。
6、四分之三的人说,客户负责决定是否适当使用PEMT,而18%的人说他们自己选择是否使用PEMT。
7、73%的LSP受访者和62%的后期编辑表示,后期编辑在所有翻译工作中所占比例不超过25%。同样数量的LSP受访者(21%)和后期编辑(18%)表示,后期编辑占所有翻译工作的26%至50%。
8、100名后期编辑表示,他们后期编辑了高能见度的内容(供公众消费),67名后期编辑表示,他们后期编辑了低能见度的内容(供有限传播)。
 
第三部分:产品质量与质量管理
大多数LSP受访者(73%)表示,达到专业人工翻译水平是机译后编辑最常见的标准。
LSP受访者和译后编辑发现这样一个差异: 73%LSP受访者和42%的机译后编辑认为后期编译包括将中等质量译文修改至出版级别,而56%的译后编辑称,他们被要求将较差译文修改到一般水平。
另一差异在于受访者接受的说明水平:46%的译后编辑表示尽管译后编辑工作效率高于LSP受访者,他们未收到PEMT指南。
 
第四部分:工具及培训
常见的机器翻译工具包括谷歌、DeepL、SDL (Adaptive MT、Language Cloud或ETS)、Amazon Translate和SYSTRAN。对于后期编辑和LSPs,最常用的工具(CAT)是SDL Trados Studio,其他工具包括memoQ、Memsource、Wordfast、MateCat、Smartcat、Across、Transifex、localalize和GlobalSight。
顶级QA工具有Xbench和none,LSPs的下一个首选选项是Verifika和QA Distiller,而后期编辑则使用更广泛的QA工具。
对于现有的PEMT培训课程的质量,LSPs和后期编辑都有不同的看法:41个后期编辑认为课程不够好,45个后期编辑认为课程足够好。一些后期编辑(23%)接受过公司提供的培训课程,少数人接受过外部培训(12%),或是在大学里接受过培训(8%)。42%的LSP受访者认为目前的PEMT培训课程不够,35%的受访者持相反意见。
53%的后期编辑表示,他们从未参加过PEMT培训课程,而三分之二(67%)的LSP表示,他们尚未组织过有关PEMT的具体培训。
 
思考:记得和一位中公老师讨论过机器翻译后再处理是否有违职业道德的问题。他认为修改机器翻译结果所得到的译文质量永远不会达到纯人工翻译水平,所以使用机器翻译对文本进行初步加工,再对译文修改是对客户的不负责任。
 
术语:
PEMT post-editing of machine translation 机器翻译后处理
 
作者:
张雪薇
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向)

【SLATOR】迎接现代语言技术的挑战

sunrui 发表了文章 • 0 个评论 • 284 次浏览 • 2019-05-05 17:37 • 来自相关话题

链接:https://slator.com/sponsored-c ... logy/

摘要:
这篇文章内容由XTM国际公司CEO Bob Willans提出,主要关于推动本地化公司变革的几个关键趋势,以及应该如何迎接挑战。
文章主要包括以下几个部分:
1.一体化和互操作性
语言技术领域的逐渐复杂化促使客户要求更高的互操作性和与系统一体化。

2.数据
现在语言服务的客户对数据的量上提出了需求,也希望能以自己想要的方式参与数据操作,而这两点又转化为了第一点一体化和互操作性的需求

3.可扩展性与功能性
许多大型企业的数据量非常大,他们需要所有平台都能容纳他们的数据。XTM做到了,还通过默认关闭了很多界面上的功能保持了界面的简洁。

4.自动化
越来越多的大型企业在使用神经机器翻译,他们也希望能在一个平台上完成所有任务,这说明自动化与前几个趋势都是有关联的。但机器翻译在法律文件等方面也不能完全避免错误,所以XTM公司正在与合作伙伴共同开发适合垂直行业的白标签版本的神经机器翻译。

5.译者的最佳选择
XTM公司新开发的XTM v12满足了以上所有要求,它的核心是工作人员从头开始重新设计的XTM工作台,更灵活直观。XTM v12将为译者带来方便。

思考:
1.一体化、互操作性、大数据、可伸缩性和自动化这些趋势都是相互有关联的,相互转化,不是独立存在的。

2.像法律等垂直行业需要翻译的质量极高,在这个领域翻译技术还有待提升。

问题:
机器翻译怎样改良才能符合垂直市场的需求?

术语:
niche 有利可图的市场(商业)
API 应用程序编程接口
NMT 神经机器翻译
MT 机器翻译
white label version 白标签版本,意为附加的可选择的版本

作者:
孙睿
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向)
  查看全部
链接:https://slator.com/sponsored-c ... logy/

摘要:
这篇文章内容由XTM国际公司CEO Bob Willans提出,主要关于推动本地化公司变革的几个关键趋势,以及应该如何迎接挑战。
文章主要包括以下几个部分:
1.一体化和互操作性
语言技术领域的逐渐复杂化促使客户要求更高的互操作性和与系统一体化。

2.数据
现在语言服务的客户对数据的量上提出了需求,也希望能以自己想要的方式参与数据操作,而这两点又转化为了第一点一体化和互操作性的需求

3.可扩展性与功能性
许多大型企业的数据量非常大,他们需要所有平台都能容纳他们的数据。XTM做到了,还通过默认关闭了很多界面上的功能保持了界面的简洁。

4.自动化
越来越多的大型企业在使用神经机器翻译,他们也希望能在一个平台上完成所有任务,这说明自动化与前几个趋势都是有关联的。但机器翻译在法律文件等方面也不能完全避免错误,所以XTM公司正在与合作伙伴共同开发适合垂直行业的白标签版本的神经机器翻译。

5.译者的最佳选择
XTM公司新开发的XTM v12满足了以上所有要求,它的核心是工作人员从头开始重新设计的XTM工作台,更灵活直观。XTM v12将为译者带来方便。

思考:
1.一体化、互操作性、大数据、可伸缩性和自动化这些趋势都是相互有关联的,相互转化,不是独立存在的。

2.像法律等垂直行业需要翻译的质量极高,在这个领域翻译技术还有待提升。

问题:
机器翻译怎样改良才能符合垂直市场的需求?

术语:
niche 有利可图的市场(商业)
API 应用程序编程接口
NMT 神经机器翻译
MT 机器翻译
white label version 白标签版本,意为附加的可选择的版本

作者:
孙睿
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向)
 

【GALA】eLearning产品的本地化

Yur1Van 发表了文章 • 0 个评论 • 284 次浏览 • 2019-05-03 19:54 • 来自相关话题

链接:
https://www.gala-global.org/bl ... rning

概要:

这篇文章总结了一些在eLearning产品本地化过程中的注意事项。网上学习(eLearning)越来越成为一种高效快捷的供培训、学习的方式。eLearning产品的翻译只是其本地化的第一步,为了发挥其优势,我们还应考虑以下几个因素。
 
1. 内容连贯
 
无论是语言专家还是技术支持人员都要坚持产品内容前后一致,后者还需进行产品测试保证内容在平台上呈现理想效果。
 
2. 完全翻译
 
不仅是翻译文字,屏幕上的图形、图片、文字都需迎合目标语的文化习惯。
 
3. 阅读习惯从左至右还是从右至左
 
有些语言如希伯来语、阿拉伯语、乌尔都语的阅读顺序是从右至左,因此,针对这些语言的课程因注意字幕、图片的阅读顺序。
 
4. 更新网页链接和网址
 
有些网课内含外链,因此,外链的内容也需要进行本地化,这也与第一条原则相吻合。
 
5. 多媒体文件
 
对于课程材料中的音频视频文件,例如字幕的翻译质量把控,画外音的配音以及后期的质量评估,都需要目标语为母语的语言人才的进行审校。
 
6. 学习管理系统 LMS
 
这是所有线上学习平台至关重要的一个因素,语言服务提供商最好找到有经验的学习管理系统专家助力实现平台上更好的交互体验。
 
此外,语言服务提供商还需将浏览设备的性能,课件等课程素材与LMS系统的兼容性等问题。
 
思考:
 
elearning产品本身包含文件比较复杂,因此对于elearning产品的翻译要兼顾多方面。eLearning产品本地化和网站本地化、字幕翻译有些许共通之处,我们发现一种语言的网站内容、结构和界面未必全部适用于另外一种语言,因此可能需要对内容进行编制、重新定制从而符合目标语言的习惯。本地化过程要从目标语用户角度出发,和客户方商讨添加更有利于目标语用户使用的新功能,同时符合来自不同地区的后台管理者的需求。
 
问题:
 
除了慕课、高翻学堂等成熟的在线学习网站,网络上还有很多学习资源,而这些资料的源语言非母语,许多同学受制于看不懂网页、字幕而无法进行学习,有没有在线网页翻译小插件或者字幕翻译小工具能帮助自主学习者们突破语言障碍,更好地自主学习呢?
 
术语:
 
voice-over 画外音
 
万宇
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向)
  查看全部
链接:
https://www.gala-global.org/bl ... rning

概要:

这篇文章总结了一些在eLearning产品本地化过程中的注意事项。网上学习(eLearning)越来越成为一种高效快捷的供培训、学习的方式。eLearning产品的翻译只是其本地化的第一步,为了发挥其优势,我们还应考虑以下几个因素。
 
1. 内容连贯
 
无论是语言专家还是技术支持人员都要坚持产品内容前后一致,后者还需进行产品测试保证内容在平台上呈现理想效果。
 
2. 完全翻译
 
不仅是翻译文字,屏幕上的图形、图片、文字都需迎合目标语的文化习惯。
 
3. 阅读习惯从左至右还是从右至左
 
有些语言如希伯来语、阿拉伯语、乌尔都语的阅读顺序是从右至左,因此,针对这些语言的课程因注意字幕、图片的阅读顺序。
 
4. 更新网页链接和网址
 
有些网课内含外链,因此,外链的内容也需要进行本地化,这也与第一条原则相吻合。
 
5. 多媒体文件
 
对于课程材料中的音频视频文件,例如字幕的翻译质量把控,画外音的配音以及后期的质量评估,都需要目标语为母语的语言人才的进行审校。
 
6. 学习管理系统 LMS
 
这是所有线上学习平台至关重要的一个因素,语言服务提供商最好找到有经验的学习管理系统专家助力实现平台上更好的交互体验。
 
此外,语言服务提供商还需将浏览设备的性能,课件等课程素材与LMS系统的兼容性等问题。
 
思考:
 
elearning产品本身包含文件比较复杂,因此对于elearning产品的翻译要兼顾多方面。eLearning产品本地化和网站本地化、字幕翻译有些许共通之处,我们发现一种语言的网站内容、结构和界面未必全部适用于另外一种语言,因此可能需要对内容进行编制、重新定制从而符合目标语言的习惯。本地化过程要从目标语用户角度出发,和客户方商讨添加更有利于目标语用户使用的新功能,同时符合来自不同地区的后台管理者的需求。
 
问题:
 
除了慕课、高翻学堂等成熟的在线学习网站,网络上还有很多学习资源,而这些资料的源语言非母语,许多同学受制于看不懂网页、字幕而无法进行学习,有没有在线网页翻译小插件或者字幕翻译小工具能帮助自主学习者们突破语言障碍,更好地自主学习呢?
 
术语:
 
voice-over 画外音
 
万宇
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向)
 

【GALA】广告活动本地化基本指南

张晓彤 发表了文章 • 0 个评论 • 255 次浏览 • 2019-05-02 22:00 • 来自相关话题

链接:https://www.gala-global.org/bl ... aigns 


概要:

这篇文章简述了广告活动本地化的基本流程,从市场营销的角度提供了一些工作思路和值得关注的细节。

作为市场营销的重要手段,广告活动可以对产品和服务进行宣传。符合社会价值和市场需求的广告可以有效提高品牌知名度,吸引客户。

在品牌国际化的过程中,企业应当根据不同市场的情况相应调整广告,而面对不同地区的语言和文化,需要采用不同特色的本地化策略。

本文将广告本地化分为以下六个步骤:

1. 前期准备
在本地化前期,先做好全局规划,进行市场调研,洞察受众与需求,判断源广告在目标市场是否适合,以确定定制化程度和策略,和所需人力及经费。

2. 关注文化
不同地区有不同的文化,“一刀切”的方法不可能适用于所有市场,一成不变的广告难以吸睛。根据目标地区的特点制定营销策略,从历史、风俗、甚至法律等方面分析文化差异,抓住其价值、兴趣及热点。

3. 确定基调
根据受众身份、年龄等特点,确定广告基调正式与否,并恰当用词。需要注意人称的转换,例如英文中没有“你”和“您”的差别,而目标语言中或许并非如此;同一种语言在不同的地区也存在用法差异,例如西班牙语人称在哥伦比亚的特殊用法。

4. 创译
广告本地化不仅仅是翻译,而是对内容的再创作。除了文案以外,企业名称、标语、宣传册等也需要由目标地区的相关专家进行改良,以符合当地实际,通过不同的方式传递相同的品牌信息。

5. 视觉处理
图像是广告中最直观的部分,第一印象十分重要。应当考虑颜色、图形和符号蕴含的文化含义,避免造成误解。

6. 营销渠道
定位合适的渠道进行宣传,可以在展示优质内容的基础上,提升曝光率。在网络发达的地区,可以通过当地流行的社交网站发布广告;在传统媒体占优势的地区,则可以利用电视、报纸、广播等开展宣传。还应根据目标地区使用的搜索引擎,有针对性地进行搜索引擎优化,例如谷歌在美国很常用,在亚洲则落后于雅虎,百度和Naver。

广告活动是产品和服务的门面,无论是初期的策划,还是后续的本地化,都需要从多个角度仔细考量。


思考:

1. 本地化
翻译是本地化的真子集,本地化过程中还需注意阅读习惯、接入平台等方面。成果最终是为人所用,因此本地化人员不仅要从自己的视角出发,更要站在最终用户的立场思考。万金油难寻,除了本文中建议的以当地货币进行报价,还有很多需要考虑的细节,例如计量单位、数字和日期格式、布局排版、甚至功能等。不恰当的本地化举措不仅不实用,还可能闹出笑话,例如目前引导中国观众到谷歌搜索,或到油管观看更多内容的广告肯定不妥;引导中国玩家使用脸书或推特登录的游戏也不合理,不支持支付宝或微信支付进行付费更是欠考虑。

2. 营销
4P营销组合策略,即产品Product、价格Price、渠道Place和推广Promotion相结合。在企业进入新市场的过程中,产品、价格和渠道和推广需要进行本地化,而推广及运营等关键部分恐怕很难由本地化公司代劳。因此建立本地化部门或招聘本地化人员是更好的选择,但还需平衡人力成本与营收利润。


问题:

本地化中还有哪些容易被忽略的小细节呢?


术语:

Advertising campaign / 广告活动
Media channel / 媒体渠道
Transcreate / 创译
Cultural nuance / 文化差异



作者:

张晓彤
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向) 查看全部
链接:https://www.gala-global.org/bl ... aigns 


概要:

这篇文章简述了广告活动本地化的基本流程,从市场营销的角度提供了一些工作思路和值得关注的细节。

作为市场营销的重要手段,广告活动可以对产品和服务进行宣传。符合社会价值和市场需求的广告可以有效提高品牌知名度,吸引客户。

在品牌国际化的过程中,企业应当根据不同市场的情况相应调整广告,而面对不同地区的语言和文化,需要采用不同特色的本地化策略。

本文将广告本地化分为以下六个步骤:

1. 前期准备
在本地化前期,先做好全局规划,进行市场调研,洞察受众与需求,判断源广告在目标市场是否适合,以确定定制化程度和策略,和所需人力及经费。

2. 关注文化
不同地区有不同的文化,“一刀切”的方法不可能适用于所有市场,一成不变的广告难以吸睛。根据目标地区的特点制定营销策略,从历史、风俗、甚至法律等方面分析文化差异,抓住其价值、兴趣及热点。

3. 确定基调
根据受众身份、年龄等特点,确定广告基调正式与否,并恰当用词。需要注意人称的转换,例如英文中没有“你”和“您”的差别,而目标语言中或许并非如此;同一种语言在不同的地区也存在用法差异,例如西班牙语人称在哥伦比亚的特殊用法。

4. 创译
广告本地化不仅仅是翻译,而是对内容的再创作。除了文案以外,企业名称、标语、宣传册等也需要由目标地区的相关专家进行改良,以符合当地实际,通过不同的方式传递相同的品牌信息。

5. 视觉处理
图像是广告中最直观的部分,第一印象十分重要。应当考虑颜色、图形和符号蕴含的文化含义,避免造成误解。

6. 营销渠道
定位合适的渠道进行宣传,可以在展示优质内容的基础上,提升曝光率。在网络发达的地区,可以通过当地流行的社交网站发布广告;在传统媒体占优势的地区,则可以利用电视、报纸、广播等开展宣传。还应根据目标地区使用的搜索引擎,有针对性地进行搜索引擎优化,例如谷歌在美国很常用,在亚洲则落后于雅虎,百度和Naver。

广告活动是产品和服务的门面,无论是初期的策划,还是后续的本地化,都需要从多个角度仔细考量。


思考:

1. 本地化
翻译是本地化的真子集,本地化过程中还需注意阅读习惯、接入平台等方面。成果最终是为人所用,因此本地化人员不仅要从自己的视角出发,更要站在最终用户的立场思考。万金油难寻,除了本文中建议的以当地货币进行报价,还有很多需要考虑的细节,例如计量单位、数字和日期格式、布局排版、甚至功能等。不恰当的本地化举措不仅不实用,还可能闹出笑话,例如目前引导中国观众到谷歌搜索,或到油管观看更多内容的广告肯定不妥;引导中国玩家使用脸书或推特登录的游戏也不合理,不支持支付宝或微信支付进行付费更是欠考虑。

2. 营销
4P营销组合策略,即产品Product、价格Price、渠道Place和推广Promotion相结合。在企业进入新市场的过程中,产品、价格和渠道和推广需要进行本地化,而推广及运营等关键部分恐怕很难由本地化公司代劳。因此建立本地化部门或招聘本地化人员是更好的选择,但还需平衡人力成本与营收利润。


问题:

本地化中还有哪些容易被忽略的小细节呢?


术语:

Advertising campaign / 广告活动
Media channel / 媒体渠道
Transcreate / 创译
Cultural nuance / 文化差异



作者:

张晓彤
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向)

【TAUS】修复翻译生态系统

陈鑫 发表了文章 • 0 个评论 • 306 次浏览 • 2019-04-29 22:46 • 来自相关话题

链接: https://blog.taus.net/fixing-t ... ystem
 
 
概要:
 
本文是TAUS网站的建立者Jaap van der Meer在2018年10月30日发布在其网站上的一篇文章。作者认为,由于机器翻译和人工智能等新技术的出现,传统翻译生态系统已经不能满足翻译行业的持续健康发展需求。只有对现有的翻译生态进行改革,号召所有从业者一起行动,才能扭转局势。作者从三个方面提出了建议,分别是:
 
1. 修复知识差距
 
作者认为,人们目前对于机器翻译的失误过于敏感,而对于人工翻译的失误却有相当高的忍受能力。但是,已经有许多数据证明机器翻译在许多方面已经超过了人工翻译。这显示出大部分利益相关者并没有引起足够的重视。他们有意或无意地忽视了技术突破带来的影响,而新技术也许会颠覆整个行业。所以,作者认为翻译从业人员需要主动学习、熟练掌握新技术。翻译人员要成为拥有多种技能的复合型人才,同时,行业也要加大对培训和人力资本的投资。
 
2.修正操作差距
 
由于当前传统运营模式、企业指标、定价系统和协议等还相对独立,统一的测量、翻译度量还没有形成。作者认为,业界需要在基本生产原则上保持一致。并且还提出了一个测量指标,即TAUS DQF指标,希望推广这个指标,作为组织内部基准测试乃至整个行业规范标准。
 
3.缩小数据差距
 
数据已经成为了新的“石油”,成为了所有人希望控制的对象。要消除差异,实际上要尽可能的缩小人们输入引擎的数据差异。作者认为需要改变传统收集数据的方法,而建立“数据市场”是最有效的方式。从业者可以生成数据,在市场中销售、交换数据,运用市场“看不见的手”来促使数据更新、引擎调整。“数据市场“将造福整个翻译行业的从业者。
 
这些建议都被写进了名为《Nunc Est Tempus》的电子书之中。作者呼吁整个翻译界,行业内的买家和卖家、运营商和从业者,政策制定者一道修复翻译生态系统。
 
 
思考:
 
1. 新技术改变传统翻译行业的趋势势不可挡,唯有拥抱技术,加强提升个人能力,才能在未来的翻译行业中争得一席之地。
 
2. 不仅是翻译人员,整个行业也应该携手共进,共同应对新的形势、新的挑战。
 
 
问题:
 
1. 除了在专门学校里系统地学习翻译技术,业余翻译人员怎么才能提升综合能力、系统学习新技术知识呢?MOOC平台是否能成为一个好的学习途径?
 
 
术语:

Translation Ecosystem / 翻译生态系统
white paper / 白皮书
data marketplace / 数据市场
 
作者:

陈鑫
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向)
  查看全部
链接: https://blog.taus.net/fixing-t ... ystem
 
 
概要:
 
本文是TAUS网站的建立者Jaap van der Meer在2018年10月30日发布在其网站上的一篇文章。作者认为,由于机器翻译和人工智能等新技术的出现,传统翻译生态系统已经不能满足翻译行业的持续健康发展需求。只有对现有的翻译生态进行改革,号召所有从业者一起行动,才能扭转局势。作者从三个方面提出了建议,分别是:
 
1. 修复知识差距
 
作者认为,人们目前对于机器翻译的失误过于敏感,而对于人工翻译的失误却有相当高的忍受能力。但是,已经有许多数据证明机器翻译在许多方面已经超过了人工翻译。这显示出大部分利益相关者并没有引起足够的重视。他们有意或无意地忽视了技术突破带来的影响,而新技术也许会颠覆整个行业。所以,作者认为翻译从业人员需要主动学习、熟练掌握新技术。翻译人员要成为拥有多种技能的复合型人才,同时,行业也要加大对培训和人力资本的投资。
 
2.修正操作差距
 
由于当前传统运营模式、企业指标、定价系统和协议等还相对独立,统一的测量、翻译度量还没有形成。作者认为,业界需要在基本生产原则上保持一致。并且还提出了一个测量指标,即TAUS DQF指标,希望推广这个指标,作为组织内部基准测试乃至整个行业规范标准。
 
3.缩小数据差距
 
数据已经成为了新的“石油”,成为了所有人希望控制的对象。要消除差异,实际上要尽可能的缩小人们输入引擎的数据差异。作者认为需要改变传统收集数据的方法,而建立“数据市场”是最有效的方式。从业者可以生成数据,在市场中销售、交换数据,运用市场“看不见的手”来促使数据更新、引擎调整。“数据市场“将造福整个翻译行业的从业者。
 
这些建议都被写进了名为《Nunc Est Tempus》的电子书之中。作者呼吁整个翻译界,行业内的买家和卖家、运营商和从业者,政策制定者一道修复翻译生态系统。
 
 
思考:
 
1. 新技术改变传统翻译行业的趋势势不可挡,唯有拥抱技术,加强提升个人能力,才能在未来的翻译行业中争得一席之地。
 
2. 不仅是翻译人员,整个行业也应该携手共进,共同应对新的形势、新的挑战。
 
 
问题:
 
1. 除了在专门学校里系统地学习翻译技术,业余翻译人员怎么才能提升综合能力、系统学习新技术知识呢?MOOC平台是否能成为一个好的学习途径?
 
 
术语:

Translation Ecosystem / 翻译生态系统
white paper / 白皮书
data marketplace / 数据市场
 
作者:

陈鑫
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向)
 

【GALA】从印加时代到数字时代:新媒体、新故事和译者的角色——冉冉升起的新星

sunrui 发表了文章 • 0 个评论 • 232 次浏览 • 2019-04-28 22:25 • 来自相关话题

链接:https://www.gala-global.org/pu ... inner 

概要:
这篇文章通过2018年GALA新星奖学金竞赛获奖者之一劳拉·里纳雷斯的获奖论文,对新媒体对翻译任务与方法的影响等问题做出了回答。
文章主要包括以下几个部分:
1.介绍
计算机辅助翻译工具和自动化翻译等数字革命的产物,也就是新媒体,会对翻译和本地化行业产生不小的影响,对译者有利有弊,还会引起叙事方面的变化。

2.新媒体、新规则:技术在叙事建构和故事传播方面的影响
技术的进步引起了叙事方式的变化,印加人的传统结绳编码“quipu”近来被破译,这个编码的破译有助于人类理解语言的转变。为秘鲁土著人发声的交互式网站纪录片“古秘鲁结绳文字项目”正是使用了新媒体,它体现了新媒体的两大特点:参与性与互动性。

3.轮回:马琳切,一个混合的世界和译者在社会中的新角色
古代著名的翻译马琳切使人们始终对译者保有背叛者的印象,认为作者地位高于译者,但在现代翻译和新媒体结合后这个想法不会再成立了。“古秘鲁结绳文字项目”就是多元化协作和多语种交流的成功例子。译者借助技术可以在原文的基础上创造新的故事,将在语言文化全球化的过程中发挥突出作用。

思考:
1.将新媒体(视频本地化,电子教学等)与翻译结合好
作为助力文化全球化的新起之秀,新媒体应该成为译者掌握的一种技能,或是应用于文化翻译传播过程中的工具。

2.技术和语言的变化是息息相关的
语言和技术的进步也促成了人们叙事方式的变化。

问题:
怎样将新媒体广泛应用于翻译中?

术语:
metizo 混血的
quipu 古秘鲁人的结绳文字
indigenous Peruvians 秘鲁土著人
Quechua 盖丘亚语
the Nouveau Roman movement 新小说运动

作者:
孙睿
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向) 
  查看全部
链接:https://www.gala-global.org/pu ... inner 

概要:
这篇文章通过2018年GALA新星奖学金竞赛获奖者之一劳拉·里纳雷斯的获奖论文,对新媒体对翻译任务与方法的影响等问题做出了回答。
文章主要包括以下几个部分:
1.介绍
计算机辅助翻译工具和自动化翻译等数字革命的产物,也就是新媒体,会对翻译和本地化行业产生不小的影响,对译者有利有弊,还会引起叙事方面的变化。

2.新媒体、新规则:技术在叙事建构和故事传播方面的影响
技术的进步引起了叙事方式的变化,印加人的传统结绳编码“quipu”近来被破译,这个编码的破译有助于人类理解语言的转变。为秘鲁土著人发声的交互式网站纪录片“古秘鲁结绳文字项目”正是使用了新媒体,它体现了新媒体的两大特点:参与性与互动性。

3.轮回:马琳切,一个混合的世界和译者在社会中的新角色
古代著名的翻译马琳切使人们始终对译者保有背叛者的印象,认为作者地位高于译者,但在现代翻译和新媒体结合后这个想法不会再成立了。“古秘鲁结绳文字项目”就是多元化协作和多语种交流的成功例子。译者借助技术可以在原文的基础上创造新的故事,将在语言文化全球化的过程中发挥突出作用。

思考:
1.将新媒体(视频本地化,电子教学等)与翻译结合好
作为助力文化全球化的新起之秀,新媒体应该成为译者掌握的一种技能,或是应用于文化翻译传播过程中的工具。

2.技术和语言的变化是息息相关的
语言和技术的进步也促成了人们叙事方式的变化。

问题:
怎样将新媒体广泛应用于翻译中?

术语:
metizo 混血的
quipu 古秘鲁人的结绳文字
indigenous Peruvians 秘鲁土著人
Quechua 盖丘亚语
the Nouveau Roman movement 新小说运动

作者:
孙睿
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向) 
 

【slator】语言如何影响印度人上网行为

SherryZhang 发表了文章 • 0 个评论 • 398 次浏览 • 2019-04-28 17:54 • 来自相关话题

链接:https://slator.com/demand-driv ... line/ 
 
概要:
文章开头首先抛出一个现状:2019年,印度消费者使用的大多数产品和服务线下用印度语进行营销,线上则以英语支持。也就是说,传统渠道(如印刷和电视)的广告和营销早已转向印度语。
第二段写印度语言分布情况: 印度官方认可语言有22种之多,但一半以上人口讲印度语,可见印度语的重要性。
第三、四段讲印度公司尚未意识到印度语在线上起到的积极作用。以印度最大零售电商平台BigBasket为例,在其APP 或网站上,消费者很难见到印语。
 第五段:印度语在线服务获暴利。印度语用户数量已达在互联2.34亿,增长速度超过英语用户。在印度排名前10的应用程序中,至少有7个提供本地语言支持,这不是巧合。这些应用程序并非源自印度,但开发商懂得本地化的重要性。
 
第二部分:购买决策。
前三段举例论证线上交易方式越来越流行。如果一位消费者决定换新手机,或者买辆车,她会先看看有没有最便宜、最符合她实际需求的产品。通常情况下,她会和一位最近可能购买过类似商品的朋友交谈,因为一手信息对她很重要。此外,她还通过网上阅读用户评论获得信息。
第四段通过对比两组数据说明线上用户猛增,线下渠道不再是影响印度消费者的主要因素。2014年尼尔森调查显示48%的消费者在购车之前会从网上搜集信息,而到了2018年这一比例达到89%。
第五段,用户生成内容平台Momspresso以及社交媒体网络ShareChat正在为地区语言用户提供一个用当地语言在线讨论、分享和互动的空间。然而,印度语内容广度仍然不如英语。
 
第三部分:让消费者付费。
网上付费有诸多渠道可选,许多人认为付费市场已经饱和,这是错误的认知。然而确实大部分印度消费者拒绝在网上付费。原因在于付费过程全以英文显示,消费者安全感何来?
 
第四部分:语音驱动。
2018年,三分之一的谷歌搜索是由语音驱动的。同年,沃尔玛支持的电子商务公司Flipkart收购了一家印度语音语言技术初创公司。印度领先的电信和互联网服务提供商Reliance Jio也对Reverie进行了类似收购。亚马逊Alexa也决定学习印度语言。
印度消费者与其他多语言社会的消费者没什么不同,他们喜欢你用他们的语言和他们交谈。印度的本地化曲线可能不完全像《voice》杂志一开始所显示的那样,与更成熟的经济体相似。但“本地化对印度来说可有可无”这一想法很危险。
 
思考:如何对一个项目进行本地化程度把控?一个会说中文的外国人比只会说本国语言的外国人更受欢迎,但是一个整成中国人相貌的外国人呢?
 
问题:印度市场如此广阔,为何本地化程度缓慢,是什么阻碍了本地化进程?


术语:
Nielsen  尼尔森
 
作者:张雪薇
北京语言大学高翻学院
2019级翻译专业硕士(本地化管理方向) 查看全部
链接:https://slator.com/demand-driv ... line/ 
 
概要:
文章开头首先抛出一个现状:2019年,印度消费者使用的大多数产品和服务线下用印度语进行营销,线上则以英语支持。也就是说,传统渠道(如印刷和电视)的广告和营销早已转向印度语。
第二段写印度语言分布情况: 印度官方认可语言有22种之多,但一半以上人口讲印度语,可见印度语的重要性。
第三、四段讲印度公司尚未意识到印度语在线上起到的积极作用。以印度最大零售电商平台BigBasket为例,在其APP 或网站上,消费者很难见到印语。
 第五段:印度语在线服务获暴利。印度语用户数量已达在互联2.34亿,增长速度超过英语用户。在印度排名前10的应用程序中,至少有7个提供本地语言支持,这不是巧合。这些应用程序并非源自印度,但开发商懂得本地化的重要性。
 
第二部分:购买决策。
前三段举例论证线上交易方式越来越流行。如果一位消费者决定换新手机,或者买辆车,她会先看看有没有最便宜、最符合她实际需求的产品。通常情况下,她会和一位最近可能购买过类似商品的朋友交谈,因为一手信息对她很重要。此外,她还通过网上阅读用户评论获得信息。
第四段通过对比两组数据说明线上用户猛增,线下渠道不再是影响印度消费者的主要因素。2014年尼尔森调查显示48%的消费者在购车之前会从网上搜集信息,而到了2018年这一比例达到89%。
第五段,用户生成内容平台Momspresso以及社交媒体网络ShareChat正在为地区语言用户提供一个用当地语言在线讨论、分享和互动的空间。然而,印度语内容广度仍然不如英语。
 
第三部分:让消费者付费。
网上付费有诸多渠道可选,许多人认为付费市场已经饱和,这是错误的认知。然而确实大部分印度消费者拒绝在网上付费。原因在于付费过程全以英文显示,消费者安全感何来?
 
第四部分:语音驱动。
2018年,三分之一的谷歌搜索是由语音驱动的。同年,沃尔玛支持的电子商务公司Flipkart收购了一家印度语音语言技术初创公司。印度领先的电信和互联网服务提供商Reliance Jio也对Reverie进行了类似收购。亚马逊Alexa也决定学习印度语言。
印度消费者与其他多语言社会的消费者没什么不同,他们喜欢你用他们的语言和他们交谈。印度的本地化曲线可能不完全像《voice》杂志一开始所显示的那样,与更成熟的经济体相似。但“本地化对印度来说可有可无”这一想法很危险。
 
思考:如何对一个项目进行本地化程度把控?一个会说中文的外国人比只会说本国语言的外国人更受欢迎,但是一个整成中国人相貌的外国人呢?
 
问题:印度市场如此广阔,为何本地化程度缓慢,是什么阻碍了本地化进程?


术语:
Nielsen  尼尔森
 
作者:张雪薇
北京语言大学高翻学院
2019级翻译专业硕士(本地化管理方向)

【SLATOR】亚洲语言神经网络机器翻译现状

张晓彤 发表了文章 • 1 个评论 • 736 次浏览 • 2019-04-25 16:02 • 来自相关话题

链接:https://slator.com/features/th ... ages/ 


概要:

这篇文章概括了亚洲语言资源现状及其对神经网络机器翻译的影响,提出了现有的应对方案和未来的努力方向。

近年来,亚洲经济发展,各国交流需求增多,神经网络机器翻译是大势所趋,一些企业也开始为此项研究贡献力量。由于当下许多亚洲语言资源不充足,且载体非罗马文字,所以研究难度仍然较大。

Slator以访谈的形式邀请两位专家回答亚洲语言神经网络机器翻译相关问题,他们分别是:

刘伍颖先生,现就职于广东外语外贸大学的语言工程与计算实验室,发表学术论文并管理机器翻译与语言资源论坛。
Lucy Park女士,现就职于韩国搜索引擎巨头公司Naver,旗下的翻译软件拥有千万用户。

采访内容主要涵盖以下三个方面:

一、 亚洲低资源语言现状及应对方案

刘伍颖准备研发机器翻译系统,将东盟国家的语言转换为中文,让自然语言处理更好地为贸易文化交流服务。他研究的一个重点是将自然语言处理技术与适当人工干预相结合,建立双语语料库。随着技术不断进步,代码不是问题,大规模语料库才是瓶颈。

东南亚语言资源十分稀缺,在没有优质双语语料库的情况下,刘伍颖主张使用源语言中意义或主题相近的文本对,建立对比语料库。同源语言之间的转移学习可以有效缓解资源上的限制,生成式对抗网络等深度学习模型也可以降低机器学习对数据的依赖。

Lucy Park认为由于亚洲语言结构复杂,所以拆分语素和标注词性十分重要。同时还要考虑到不同语言的特点,例如韩语中有敬语平语之分,还经常省略主语。

二、 东西方自然语言处理和神经网络机器翻译

刘伍颖提出西方语言多为同源,且采用拉丁文字,欧盟组织也为各种语言交流提供了良好环境;亚洲语言来源复杂多样,且语料库不足,自然语言处理和神经网络机器翻译正处于资源积累阶段,但势头良好,前景开阔。

Lucy Park提出现有的大多数机器翻译方法都以英-德、英-法等西方主要语言对为基准,不一定适用于亚洲语言。针对亚洲语言独特的语法和书写系统,立足语言特点进行合理改良,可以促进亚洲自然语言处理和神经网络机器翻译的研究。因此开放源代码和数据的意义重大,她本人也致力于开发韩语分词标注组件KoNLPy。

三、 亚洲语言神经网络机器翻译的未来

去年以来,人们的关注范围愈加广泛,除中日韩语言之外,关于东南亚语言翻译的研究也越来越多,坚持纵向研究,兼顾横向发展。

亚洲许多学术机构和互联网企业活跃在亚洲语言神经网络机器翻译领域,人工智能和开源项目加速了更适应亚洲市场的产品和服务出现。


思考:

1. 亚洲语言之间的转换
在Naver搜索关于Lucy Park的信息时,使用谷歌翻译进行韩译中的效果确实不佳,译文不是很通顺,一些短词的译文甚至不达意;但将英语作为桥梁,先进行韩译英,再英译中,效果就会好一些。使用Naver开发的翻译工具Papago直接进行韩译中,译文相比之下优于谷歌翻译的产物。以上测试虽然不够全面,但面对亚洲语言之间的转换,应当多考虑语言特色,有针对性的处理。
 
2.  分词标注
在语言学习和机器翻译中,词性扮演着着烟雾弹般令人又爱又恨的重要角色。“一把把把手把住”这短短的一句话里就出现了“把”字的三种词性。不同的断句方法能够赋予同一句话不同的含义,“下雨天留客天留我不留”,美感与歧义同在。在训练机器去理解语义的过程中,拆分词句和标注词性起到了十分重要的作用,恰当的处理可以有效提高译文准确率。

3.  语料库
在自然语言处理中,使用和建立标准且丰富的语料库意义重大。机器翻译的本质与语音识别和音字转换的本质一样,都是转换问题。语音识别是将音频转换成文字,所以标准的语音输入是关键。然而许多语音语料在录制时就存在错读、错断和语气不当的现象,影响了语音识别的准确度。关于音字转换,目前网络上含有中文拼音与文字一一对应的完整读物的语料库寥寥无几。大多数在线拼音标注类网站提供的结果已经是算法生成的产物,不能作为严谨的实验数据使用。哈尔滨工业大学自然语言处理实验室的WI输入法使用的语料是人民日报1997年至2007年的所有文章,其拼音由机器自动标注与人工添加逻辑相结合生成。虽然严谨的语料带来的效果很好,但也暴露了一些问题,比如逻辑没有覆盖的拼音标注数据成为了实验噪声,语料缺乏时效性且具有内容局限性,毕竟流行用语和新兴词汇在人民日报中鲜有出现,而这些词的读音往往比普通词汇更加特别。由以上两个例子可以得见,在建立语料库时不仅需要标准,还要保证丰富度。
 

问题:

在激烈的商业竞争背景下,如何推动源代码和数据的开放?


术语:

Neutral Machine Translation (NMT) / 神经网络机器翻译
Natural Language Processing (NLP) / 自然语言处理
Language-centric AI / 以语言为中心的人工智能
Low-resource language / 低资源语言
SEA language / 东南亚语言
Generative Adversarial Network (GAN) / 生成式对抗网络
General Public License (GPL) / 通用公共授权协议
 
 

作者:

张晓彤
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向) 查看全部
链接:https://slator.com/features/th ... ages/ 


概要:

这篇文章概括了亚洲语言资源现状及其对神经网络机器翻译的影响,提出了现有的应对方案和未来的努力方向。

近年来,亚洲经济发展,各国交流需求增多,神经网络机器翻译是大势所趋,一些企业也开始为此项研究贡献力量。由于当下许多亚洲语言资源不充足,且载体非罗马文字,所以研究难度仍然较大。

Slator以访谈的形式邀请两位专家回答亚洲语言神经网络机器翻译相关问题,他们分别是:

刘伍颖先生,现就职于广东外语外贸大学的语言工程与计算实验室,发表学术论文并管理机器翻译与语言资源论坛。
Lucy Park女士,现就职于韩国搜索引擎巨头公司Naver,旗下的翻译软件拥有千万用户。

采访内容主要涵盖以下三个方面:

一、 亚洲低资源语言现状及应对方案

刘伍颖准备研发机器翻译系统,将东盟国家的语言转换为中文,让自然语言处理更好地为贸易文化交流服务。他研究的一个重点是将自然语言处理技术与适当人工干预相结合,建立双语语料库。随着技术不断进步,代码不是问题,大规模语料库才是瓶颈。

东南亚语言资源十分稀缺,在没有优质双语语料库的情况下,刘伍颖主张使用源语言中意义或主题相近的文本对,建立对比语料库。同源语言之间的转移学习可以有效缓解资源上的限制,生成式对抗网络等深度学习模型也可以降低机器学习对数据的依赖。

Lucy Park认为由于亚洲语言结构复杂,所以拆分语素和标注词性十分重要。同时还要考虑到不同语言的特点,例如韩语中有敬语平语之分,还经常省略主语。

二、 东西方自然语言处理和神经网络机器翻译

刘伍颖提出西方语言多为同源,且采用拉丁文字,欧盟组织也为各种语言交流提供了良好环境;亚洲语言来源复杂多样,且语料库不足,自然语言处理和神经网络机器翻译正处于资源积累阶段,但势头良好,前景开阔。

Lucy Park提出现有的大多数机器翻译方法都以英-德、英-法等西方主要语言对为基准,不一定适用于亚洲语言。针对亚洲语言独特的语法和书写系统,立足语言特点进行合理改良,可以促进亚洲自然语言处理和神经网络机器翻译的研究。因此开放源代码和数据的意义重大,她本人也致力于开发韩语分词标注组件KoNLPy。

三、 亚洲语言神经网络机器翻译的未来

去年以来,人们的关注范围愈加广泛,除中日韩语言之外,关于东南亚语言翻译的研究也越来越多,坚持纵向研究,兼顾横向发展。

亚洲许多学术机构和互联网企业活跃在亚洲语言神经网络机器翻译领域,人工智能和开源项目加速了更适应亚洲市场的产品和服务出现。


思考:

1. 亚洲语言之间的转换
在Naver搜索关于Lucy Park的信息时,使用谷歌翻译进行韩译中的效果确实不佳,译文不是很通顺,一些短词的译文甚至不达意;但将英语作为桥梁,先进行韩译英,再英译中,效果就会好一些。使用Naver开发的翻译工具Papago直接进行韩译中,译文相比之下优于谷歌翻译的产物。以上测试虽然不够全面,但面对亚洲语言之间的转换,应当多考虑语言特色,有针对性的处理。
 
2.  分词标注
在语言学习和机器翻译中,词性扮演着着烟雾弹般令人又爱又恨的重要角色。“一把把把手把住”这短短的一句话里就出现了“把”字的三种词性。不同的断句方法能够赋予同一句话不同的含义,“下雨天留客天留我不留”,美感与歧义同在。在训练机器去理解语义的过程中,拆分词句和标注词性起到了十分重要的作用,恰当的处理可以有效提高译文准确率。

3.  语料库
在自然语言处理中,使用和建立标准且丰富的语料库意义重大。机器翻译的本质与语音识别和音字转换的本质一样,都是转换问题。语音识别是将音频转换成文字,所以标准的语音输入是关键。然而许多语音语料在录制时就存在错读、错断和语气不当的现象,影响了语音识别的准确度。关于音字转换,目前网络上含有中文拼音与文字一一对应的完整读物的语料库寥寥无几。大多数在线拼音标注类网站提供的结果已经是算法生成的产物,不能作为严谨的实验数据使用。哈尔滨工业大学自然语言处理实验室的WI输入法使用的语料是人民日报1997年至2007年的所有文章,其拼音由机器自动标注与人工添加逻辑相结合生成。虽然严谨的语料带来的效果很好,但也暴露了一些问题,比如逻辑没有覆盖的拼音标注数据成为了实验噪声,语料缺乏时效性且具有内容局限性,毕竟流行用语和新兴词汇在人民日报中鲜有出现,而这些词的读音往往比普通词汇更加特别。由以上两个例子可以得见,在建立语料库时不仅需要标准,还要保证丰富度。
 

问题:

在激烈的商业竞争背景下,如何推动源代码和数据的开放?


术语:

Neutral Machine Translation (NMT) / 神经网络机器翻译
Natural Language Processing (NLP) / 自然语言处理
Language-centric AI / 以语言为中心的人工智能
Low-resource language / 低资源语言
SEA language / 东南亚语言
Generative Adversarial Network (GAN) / 生成式对抗网络
General Public License (GPL) / 通用公共授权协议
 
 

作者:

张晓彤
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向)

【GALA】人类问题:机器学习与语言产业

haojinghan 发表了文章 • 0 个评论 • 305 次浏览 • 2019-04-24 09:20 • 来自相关话题

链接:https://www.gala-global.org/pu ... ustry

概要:

这篇文章主要针对“语言产业的利益相关者应该做些什么来为机器学习的发展做好准备?”以及“ 面对机器学习,人类将在其中扮演什么样的角色?”等问题作出了回答。

文章主要包括以下几个部分:

1.机器翻译在过去十年取得了巨大成功,并且逐渐形成了具有一定利益空间的市场。

2.为了融入机器学习的演变,语言产业、企业和个体服务供应者可以承担的角色。
    2.1对于语言产业和企业而言,应该将技术作为卖点。
    2.2行业、个体与政府应该共同投身于重新培养和提升劳动人口的技能。
    2.3一方面,企业对审稿人,编辑和质量保证测试人员的需求增加;另一方面,个体应该不断探索新的业务活动以成为一名全能的服务提供者。
     2.4修正人工智能应用于语言产业时存在的语义偏见问题。

3.2016-2018全球未来人权理事会的白皮书中就应对“人工智能使人类边缘化”这一挑战提出了多条建议,其中一部分可用于语言行业。
     3.1确保开发团队的多样性并参与数据共享。
     3.2培训系统设计人员及开发人员履行人权责任。
     3.3组织研究并了解公司所在技术领域的表现。
     3.4在适当的情况下校准系统以确保公平度。


思考:

1.提升技术
随着科学技术的不断成熟,语言产业将会受到越来越大的冲击与挑战。对于企业和个人而言,应该以技术作为桥梁,连接机器学习与语言产业,提升竞争力。

2.融合借鉴
作为人工智能实现的途径之一,机器学习最初是为了解决人类问题而创建的。 业内所有利益相关者必须立即采取行动。 我们需要积极地了解它,与之互动,将其用于生产手段从而创造共同利益。


问题:

除了机器学习,语言产业还面临着哪些科技带来的挑战?


术语:

machine learning(ML)/机器学习
post-edit machine translation (PEMT)/机器翻译译后编辑
Quality Assurance (QA)/质量评价



作者:

郝婧含
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向) 查看全部
链接:https://www.gala-global.org/pu ... ustry

概要:

这篇文章主要针对“语言产业的利益相关者应该做些什么来为机器学习的发展做好准备?”以及“ 面对机器学习,人类将在其中扮演什么样的角色?”等问题作出了回答。

文章主要包括以下几个部分:

1.机器翻译在过去十年取得了巨大成功,并且逐渐形成了具有一定利益空间的市场。

2.为了融入机器学习的演变,语言产业、企业和个体服务供应者可以承担的角色。
    2.1对于语言产业和企业而言,应该将技术作为卖点。
    2.2行业、个体与政府应该共同投身于重新培养和提升劳动人口的技能。
    2.3一方面,企业对审稿人,编辑和质量保证测试人员的需求增加;另一方面,个体应该不断探索新的业务活动以成为一名全能的服务提供者。
     2.4修正人工智能应用于语言产业时存在的语义偏见问题。

3.2016-2018全球未来人权理事会的白皮书中就应对“人工智能使人类边缘化”这一挑战提出了多条建议,其中一部分可用于语言行业。
     3.1确保开发团队的多样性并参与数据共享。
     3.2培训系统设计人员及开发人员履行人权责任。
     3.3组织研究并了解公司所在技术领域的表现。
     3.4在适当的情况下校准系统以确保公平度。


思考:

1.提升技术
随着科学技术的不断成熟,语言产业将会受到越来越大的冲击与挑战。对于企业和个人而言,应该以技术作为桥梁,连接机器学习与语言产业,提升竞争力。

2.融合借鉴
作为人工智能实现的途径之一,机器学习最初是为了解决人类问题而创建的。 业内所有利益相关者必须立即采取行动。 我们需要积极地了解它,与之互动,将其用于生产手段从而创造共同利益。


问题:

除了机器学习,语言产业还面临着哪些科技带来的挑战?


术语:

machine learning(ML)/机器学习
post-edit machine translation (PEMT)/机器翻译译后编辑
Quality Assurance (QA)/质量评价



作者:

郝婧含
北京语言大学高级翻译学院
2019级翻译专业硕士(本地化管理方向)