Windows XP系统无法安装SDL Trados Studio 2015

SDL Trados Studio 2015王楠鑫 回复了问题 • 3 人关注 • 3 个回复 • 467 次浏览 • 2018-04-07 23:41 • 来自相关话题

怎么用CAT工具搞定拼写问题?

memoQ王楠鑫 回复了问题 • 3 人关注 • 2 个回复 • 448 次浏览 • 2018-04-07 23:27 • 来自相关话题

有哪些下载YouTube视频的好方法?

效率工具李盛 回复了问题 • 3 人关注 • 2 个回复 • 2118 次浏览 • 2018-04-05 19:06 • 来自相关话题

哪些工具可以方便处理PDF格式的文件?

文件格式朱小二 回复了问题 • 3 人关注 • 2 个回复 • 559 次浏览 • 2018-04-04 15:27 • 来自相关话题

翻译XML或DITA文件,如何在CAT中利用正则定义导入规则?

文件格式韩林涛 回复了问题 • 2 人关注 • 1 个回复 • 478 次浏览 • 2018-04-01 11:39 • 来自相关话题

Mac OS中有哪些可以提高工作效率的工具?

效率工具韩林涛 发表了文章 • 0 个评论 • 1247 次浏览 • 2018-03-31 16:09 • 来自相关话题

现在很多同学都在使用Mac OS,但是我发现大部分同学都不会充分利用Mac OS上丰富的软件,所以我在这个帖子中将会分享我认为可以提高译者工作效率的工具。
 
1. 虚拟机软件

选择一:Parallel Desktop

网址:http://www.parallels.com/products/desktop/

官网价格:550 RMB

国内代理价格:349 RMB

代理网址:http://item.shop.edu.cn/item?id=572

选择二:VirtualBox

网址:https://www.virtualbox.org/wiki/Downloads

价格:免费

韩林涛的评价:我自己用的是收费版的Parallel Desktop,虽然会花些钱,但是比免费版的VirtualBox好用。关于免费版的VirtualBox,我自己做了一个镜像,大概有15个G,如果要用的话需要联系我拷贝(仅限北语高翻同学),记得拿移动硬盘,不要那U盘哦。

2. PDF阅读和编辑软件

选择一:PDF Expert

工具介绍:http://www.hitnology.com/video-835.html

App Store 价格:388 RMB

官网:https://pdfexpert.com/

选择二:Abbyy FineReader

App Store 价格:798 RMB

韩林涛评价:Mac本身自带的工具可以阅读PDF,但是没办法编辑PDF,我推荐的这两款都是专业级的PDF,可以等工作了之后再买,我也并不是买的原价,都是在打折的时候买的,能便宜一半。

3. Office 系列

Mac上通用的“免费”的Office系列软件基本上都是老版本的,可以在很多地方下载到。我用的是付费版的Office 2016 for Mac,当时淘宝上还可以买到一年100元的折扣卡,可惜现在没有了,只能买到400多的一次性密钥。据说也有破解版,但是我没有试过。

4. 工具窗口控制软件Moom

我在用Mac的时候需要将一些软件移到左侧、移动右侧,或者把一个软件全屏,Mac自带的窗口控制功能很差,所以需要用到这个叫Moom的工具。

官网:https://manytricks.com/moom/

App Store 价格:68 RMB

韩林涛评价:这是每一个Mac用户必备的提高效率的工具,在没有Moom的Mac上我都不知道该怎么操作工具窗口。

5. 解压缩工具

选择一:The Unarchiver

App Store 价格:免费

选择二:Stuffit Expander

App Store 价格:免费

韩林涛评价:我觉得这两个免费工具可以替代Mac自带的解压缩工具。

6. 视频编辑软件

Mac自带的iMovie是一款非常不错的免费视频编辑软件。但是我比较喜欢用Camtasia。

官网:http://shop.techsmith.com/stor ... 32000

官网价格:1163 RMB(教育价格)

韩林涛评价:因为我自己经常会录制很多软件教学视频,所以这个软件是我必备的工具,而且用的都是正版的。

7. YouTube视频下载软件

我自己用过很多YouTube下载软件,最喜欢的是4K Video Downloader

官网:https://www.4kdownload.com/pro ... oader

官网价格:69 RMB

韩林涛评价:这个软件本身可以免费下载,但是免费版一次最多可以下载5个视频,如果你每次都是一个个下载的话用免费版就行,我自己有的时候会一次性下载一整个YouTube频道的视频,所以花了点钱买了一个授权,这样就可以一次性下载很多视频了。

8. 视频压缩软件

有的时候我自己用Camtasia录制的视频导出后非常大,传到高翻学堂后大家观看很费流量,所以我会使用下面这个叫HandBrake的免费软件来压缩。

官网:https://handbrake.fr/

韩林涛评价:这个软件真得是超级赞,不光Mac上可以用,Windows上也可以用。视频压缩后清晰度还不会发生很大变化。
 





 
这是我自己用的电脑上在某一时刻软件使用情况截屏,我简要介绍一下我常用的软件:

1. Finder(免费)
苹果自带软件,类似于Windows电脑里的文件管理器。

2. Siri(免费)
苹果自带软件,大家都知道Siri是干什么的吧。

3. Safari(免费)
苹果自带的浏览器。

4. LaunchPad(免费)
点开后可以查看电脑上所有已安装的软件。

5. 日历(免费)
我最喜欢的日程管理软件,和我的手机日历实时同步,方便记录要做的事情。

6. App Store(免费)
苹果的应用商店,用来下载软件的,但并不是所有软件都可以在上面下载到。

7. Microsoft OneNote(收费)
我的笔记软件之一,主要用来记录非常重要的个人数据。

8. Chrome(免费)
我最喜欢的浏览器。

9. 备忘录(免费)
我最喜欢的笔记软件之一,和我的手机备忘录实时同步。

10. Microsoft Excel(收费)
这个就不多介绍了。

11. QuickTime Player(免费)
苹果自带的视频播放软件,我除了用它来看视频外,还用它来录屏。

12. Moom(收费)
我在用Mac的时候需要将一些软件移到左侧、移动右侧,或者把一个软件全屏,Mac自带的窗口控制功能很差,所以需要用到这个叫Moom的工具。
官网:https://manytricks.com/moom/
App Store 价格:68 RMB

13. PDF Expert(收费)
PDF阅读和编辑软件。
工具介绍:http://www.hitnology.com/video-835.html
App Store 价格:388 RMB

14. QQ(免费)
聊天工具,Mac上的QQ没有其他版本的QQ好用,不过我也不怎么用QQ

15. 有道云协作(免费)
最好用的多人协作和个人文档管理平台。

16. 预览(免费)
苹果自带的PDF、图片等文件阅读器。

17. Scrivener(收费)
网址:https://www.literatureandlatte.com/scrivener.php
Mac上最好用的写作软件。
官网价格:266 RMB(教育版)

18. Sublime Text 2 (免费)
最好用的编辑器,用来写代码、编辑txt文件什么的。

19. Scapple(收费)
和上面的Scrivener是一家的,最好用的思维导图工具。
网址:http://www.literatureandlatte.com/scapple.php
官网价格:84 RMB (教育版)

20.  DEVONagent Pro(收费)
Mac上最好用的搜索引擎助手
网址:http://www.devontechnologies.c ... .html
官网价格:347 RMB

21.  DEVONthink Office Pro(收费)
Mac上最要用的文档管理软件。
网址:http://www.devontechnologies.c ... .html
官网价格:1043 RMB

22. 微信(免费)
地球人都知道

23. Teamviewer(免费)
远程控制软件,我的每一台设备上都装了这个软件,用手机就可以控制任何一台电脑。

24. Audacity(免费)
Mac上最好用的音频播放和编辑工具,我的各种格式的音频文件都是通过它转换成mp3的。另外,在Mac上再安装一个叫做Soundflower的工具,配合Audacity一起用,可以让Siri自动听写音频和视频的字幕。教程参见:http://blog.sina.com.cn/s/blog ... .html

25. Mindjet Mindmanager(收费)
Mac上我最喜欢的思维导图工具之一。
中文官网:http://www.mairuan.com/product/mindmanager-7
价格:998 RMB

26. Microsoft Word(收费)
啧啧,天天不离手的软件。 查看全部
现在很多同学都在使用Mac OS,但是我发现大部分同学都不会充分利用Mac OS上丰富的软件,所以我在这个帖子中将会分享我认为可以提高译者工作效率的工具。
 
1. 虚拟机软件

选择一:Parallel Desktop

网址:http://www.parallels.com/products/desktop/

官网价格:550 RMB

国内代理价格:349 RMB

代理网址:http://item.shop.edu.cn/item?id=572

选择二:VirtualBox

网址:https://www.virtualbox.org/wiki/Downloads

价格:免费

韩林涛的评价:我自己用的是收费版的Parallel Desktop,虽然会花些钱,但是比免费版的VirtualBox好用。关于免费版的VirtualBox,我自己做了一个镜像,大概有15个G,如果要用的话需要联系我拷贝(仅限北语高翻同学),记得拿移动硬盘,不要那U盘哦。

2. PDF阅读和编辑软件

选择一:PDF Expert

工具介绍:http://www.hitnology.com/video-835.html

App Store 价格:388 RMB

官网:https://pdfexpert.com/

选择二:Abbyy FineReader

App Store 价格:798 RMB

韩林涛评价:Mac本身自带的工具可以阅读PDF,但是没办法编辑PDF,我推荐的这两款都是专业级的PDF,可以等工作了之后再买,我也并不是买的原价,都是在打折的时候买的,能便宜一半。

3. Office 系列

Mac上通用的“免费”的Office系列软件基本上都是老版本的,可以在很多地方下载到。我用的是付费版的Office 2016 for Mac,当时淘宝上还可以买到一年100元的折扣卡,可惜现在没有了,只能买到400多的一次性密钥。据说也有破解版,但是我没有试过。

4. 工具窗口控制软件Moom

我在用Mac的时候需要将一些软件移到左侧、移动右侧,或者把一个软件全屏,Mac自带的窗口控制功能很差,所以需要用到这个叫Moom的工具。

官网:https://manytricks.com/moom/

App Store 价格:68 RMB

韩林涛评价:这是每一个Mac用户必备的提高效率的工具,在没有Moom的Mac上我都不知道该怎么操作工具窗口。

5. 解压缩工具

选择一:The Unarchiver

App Store 价格:免费

选择二:Stuffit Expander

App Store 价格:免费

韩林涛评价:我觉得这两个免费工具可以替代Mac自带的解压缩工具。

6. 视频编辑软件

Mac自带的iMovie是一款非常不错的免费视频编辑软件。但是我比较喜欢用Camtasia。

官网:http://shop.techsmith.com/stor ... 32000

官网价格:1163 RMB(教育价格)

韩林涛评价:因为我自己经常会录制很多软件教学视频,所以这个软件是我必备的工具,而且用的都是正版的。

7. YouTube视频下载软件

我自己用过很多YouTube下载软件,最喜欢的是4K Video Downloader

官网:https://www.4kdownload.com/pro ... oader

官网价格:69 RMB

韩林涛评价:这个软件本身可以免费下载,但是免费版一次最多可以下载5个视频,如果你每次都是一个个下载的话用免费版就行,我自己有的时候会一次性下载一整个YouTube频道的视频,所以花了点钱买了一个授权,这样就可以一次性下载很多视频了。

8. 视频压缩软件

有的时候我自己用Camtasia录制的视频导出后非常大,传到高翻学堂后大家观看很费流量,所以我会使用下面这个叫HandBrake的免费软件来压缩。

官网:https://handbrake.fr/

韩林涛评价:这个软件真得是超级赞,不光Mac上可以用,Windows上也可以用。视频压缩后清晰度还不会发生很大变化。
 

21363317f63b787731.png

 
这是我自己用的电脑上在某一时刻软件使用情况截屏,我简要介绍一下我常用的软件:

1. Finder(免费)
苹果自带软件,类似于Windows电脑里的文件管理器。

2. Siri(免费)
苹果自带软件,大家都知道Siri是干什么的吧。

3. Safari(免费)
苹果自带的浏览器。

4. LaunchPad(免费)
点开后可以查看电脑上所有已安装的软件。

5. 日历(免费)
我最喜欢的日程管理软件,和我的手机日历实时同步,方便记录要做的事情。

6. App Store(免费)
苹果的应用商店,用来下载软件的,但并不是所有软件都可以在上面下载到。

7. Microsoft OneNote(收费)
我的笔记软件之一,主要用来记录非常重要的个人数据。

8. Chrome(免费)
我最喜欢的浏览器。

9. 备忘录(免费)
我最喜欢的笔记软件之一,和我的手机备忘录实时同步。

10. Microsoft Excel(收费)
这个就不多介绍了。

11. QuickTime Player(免费)
苹果自带的视频播放软件,我除了用它来看视频外,还用它来录屏。

12. Moom(收费)
我在用Mac的时候需要将一些软件移到左侧、移动右侧,或者把一个软件全屏,Mac自带的窗口控制功能很差,所以需要用到这个叫Moom的工具。
官网:https://manytricks.com/moom/
App Store 价格:68 RMB

13. PDF Expert(收费)
PDF阅读和编辑软件。
工具介绍:http://www.hitnology.com/video-835.html
App Store 价格:388 RMB

14. QQ(免费)
聊天工具,Mac上的QQ没有其他版本的QQ好用,不过我也不怎么用QQ

15. 有道云协作(免费)
最好用的多人协作和个人文档管理平台。

16. 预览(免费)
苹果自带的PDF、图片等文件阅读器。

17. Scrivener(收费)
网址:https://www.literatureandlatte.com/scrivener.php
Mac上最好用的写作软件。
官网价格:266 RMB(教育版)

18. Sublime Text 2 (免费)
最好用的编辑器,用来写代码、编辑txt文件什么的。

19. Scapple(收费)
和上面的Scrivener是一家的,最好用的思维导图工具。
网址:http://www.literatureandlatte.com/scapple.php
官网价格:84 RMB (教育版)

20.  DEVONagent Pro(收费)
Mac上最好用的搜索引擎助手
网址:http://www.devontechnologies.c ... .html
官网价格:347 RMB

21.  DEVONthink Office Pro(收费)
Mac上最要用的文档管理软件。
网址:http://www.devontechnologies.c ... .html
官网价格:1043 RMB

22. 微信(免费)
地球人都知道

23. Teamviewer(免费)
远程控制软件,我的每一台设备上都装了这个软件,用手机就可以控制任何一台电脑。

24. Audacity(免费)
Mac上最好用的音频播放和编辑工具,我的各种格式的音频文件都是通过它转换成mp3的。另外,在Mac上再安装一个叫做Soundflower的工具,配合Audacity一起用,可以让Siri自动听写音频和视频的字幕。教程参见:http://blog.sina.com.cn/s/blog ... .html

25. Mindjet Mindmanager(收费)
Mac上我最喜欢的思维导图工具之一。
中文官网:http://www.mairuan.com/product/mindmanager-7
价格:998 RMB

26. Microsoft Word(收费)
啧啧,天天不离手的软件。

你也想代表人类挑战微软的实时口语机器翻译系统吗?

机器翻译应用韩林涛 发表了文章 • 0 个评论 • 358 次浏览 • 2018-03-29 16:05 • 来自相关话题

背景

3月22-23日,北京语言大学举办了“翻译自动化协会(TAUS)亚洲峰会”,现场提供了两种同声传译服务:人工同传和机器同传。

1、人工同传:北京语言大学高级翻译学院英语口译专业研二的四位同学

四位同学坐在会场二层的同传箱中为现场的观众提供同传服务,现场观众通过手中的同传设备收听他们的口译结果。

下图是其中一位译员朱乾坤同学从同传箱中拍摄的照片:







2、机器同传:微软公司提供的实时机器翻译

微软公司早些时候向公众发布了名为“Presentation Translator”的Microsoft PowerPoint插件,安装后可以为正在播放的PPT提供实时字幕,配合手机上的“微软翻译”APP可以收听机器合成的多个国家语言的译文语音。

下图是现场演讲人发言时PPT下方实时出现的语音识别结果:






下图是手机上看到的机器翻译结果,带上耳机后能在会场清晰听到机器合成的声音:






经过两天的会议,大家普遍的感觉是:目前的机器翻译质量还远远达不到“替代人类译者”的效果,但这种形式背后的技术还是让人极为称赞的。假以时日,这套系统如果能够精准识别不同环境下不同演讲人的内容和形式都极为复杂的发言,那么那时机器翻译的质量应当能够达到令人满意的程度。

现在这套机器翻译系统(以及所有同类型的系统)似乎最大的问题是无法识别语义。

会后,译员朱乾坤同学给高翻学院名誉院长刘和平教授发了一封邮件,内容发布在了刘老师的微信公众号上,大家可以点击查看他的思考:

机器翻译将代替人?一位口译硕士生的回答......

如何体验这套微软的机器翻译系统?

为了方便所有人都能体验到这套系统,我录制了一个长视频(约19分钟),详细介绍了:

1、如何在自己的电脑上安装微软提供的插件

2、如何基于这个插件训练PPT中的文本数据以提高语音识别效果

3、如何在演讲时获得实时机器翻译的结果

4、如何在手机上收听机器翻译的实时语音合成结果

如果你也想体验这套系统,请耐心观看完这个视频,再去尝试。欢迎大家在尝试完后在下方留言告诉我你的感受。

视频链接:https://v.qq.com/x/page/i0613g9j1an.html

视频: 查看全部
背景

3月22-23日,北京语言大学举办了“翻译自动化协会(TAUS)亚洲峰会”,现场提供了两种同声传译服务:人工同传和机器同传。

1、人工同传:北京语言大学高级翻译学院英语口译专业研二的四位同学

四位同学坐在会场二层的同传箱中为现场的观众提供同传服务,现场观众通过手中的同传设备收听他们的口译结果。

下图是其中一位译员朱乾坤同学从同传箱中拍摄的照片:

微信图片_20180325171211.jpg



2、机器同传:微软公司提供的实时机器翻译

微软公司早些时候向公众发布了名为“Presentation Translator”的Microsoft PowerPoint插件,安装后可以为正在播放的PPT提供实时字幕,配合手机上的“微软翻译”APP可以收听机器合成的多个国家语言的译文语音。

下图是现场演讲人发言时PPT下方实时出现的语音识别结果:

DSC00372.JPG


下图是手机上看到的机器翻译结果,带上耳机后能在会场清晰听到机器合成的声音:

test.jpg


经过两天的会议,大家普遍的感觉是:目前的机器翻译质量还远远达不到“替代人类译者”的效果,但这种形式背后的技术还是让人极为称赞的。假以时日,这套系统如果能够精准识别不同环境下不同演讲人的内容和形式都极为复杂的发言,那么那时机器翻译的质量应当能够达到令人满意的程度。

现在这套机器翻译系统(以及所有同类型的系统)似乎最大的问题是无法识别语义。

会后,译员朱乾坤同学给高翻学院名誉院长刘和平教授发了一封邮件,内容发布在了刘老师的微信公众号上,大家可以点击查看他的思考:

机器翻译将代替人?一位口译硕士生的回答......

如何体验这套微软的机器翻译系统?

为了方便所有人都能体验到这套系统,我录制了一个长视频(约19分钟),详细介绍了:

1、如何在自己的电脑上安装微软提供的插件

2、如何基于这个插件训练PPT中的文本数据以提高语音识别效果

3、如何在演讲时获得实时机器翻译的结果

4、如何在手机上收听机器翻译的实时语音合成结果

如果你也想体验这套系统,请耐心观看完这个视频,再去尝试。欢迎大家在尝试完后在下方留言告诉我你的感受。

视频链接:https://v.qq.com/x/page/i0613g9j1an.html

视频:


人工智能时代传统翻译教育的危机

翻译教育技术韩林涛 发表了文章 • 0 个评论 • 346 次浏览 • 2018-03-29 16:00 • 来自相关话题

危机一:翻译专业生源不佳

不管机器翻译的水平有没有超过人类译者,经过最近几年媒体的渲染,在高中生家长和考研学生那里,机器翻译早已超过人类译者,“翻译”作为一种职业已经激发不起优秀学生在这个专业求学的欲望。

开设翻译专业本科和翻译专业硕士的学校是不会担心招不到学生的,因为本科文凭和硕士帽子是人人都要拿的,但语言水平特别优秀的高中生和语言底子打得不错的考研学生应该是不会考虑读翻译专业了。

本来优秀的双语转换技能就是一个经年累月才能打磨出来的稀罕能力,学生要是底子薄,老师再怎么努力也白搭。本科就四年,还不是全学语言和翻译;研究生就两年到三年,原本就不怎么样的语言水平加上不到一年的高强度职业化训练,何以能打磨出优秀的译者和译员?

如今的大学生和研究生被各种事情和事物转移注意力,要学的东西多,学东西的时间又不够。当年我读大学的时候虽然没怎么认真学习,但觉得看书的时间和学习的时间要比现在的大学生多得多。大家知道吗,现在的大学生已经忙得没有时间读书了!

危机二:翻译专业技术背景师资匮乏

虽然读翻译专业的好苗子越来越少,但好学校依然能招到好学生,可是好学校招聘老师的门槛也越来越高,非博士/非本科985211的博士/非双一流的博士/非海外的博士......一大堆条条框框把搞翻译实践的职业译者挡在了象牙塔外,把有技术背景的师资挡在了门外。

许多翻译专业教师还搞不清楚“计算机辅助翻译”的时候,更让人搞不懂的“人工智能”已经全面侵袭而来。绝大多数翻译专业的教师是没有理科背景的,即便有理科背景,能看懂“机器翻译原理”的也不多。本来是急需新鲜血液补充的关键时刻,文理交叉背景的人又难以进入翻译专业师资队伍担任专职教师。

仔细看看国内教计算机辅助翻译的老师,除了教具体的某几个工具的使用方法外,有多少能将最新的技术应用到翻译教学、翻译实践、翻译研究?

据我所知,如今北大的计算机辅助翻译专业毕业生这两三年基本上没有人能进入高校参与翻译专业的建设和翻译人才的培养。这个链条一旦断了,高校的翻译专业建设更加岌岌可危。

危机三:翻译教育信息化建设非常落后

教育技术搞了那么多年,外语教育技术、国际汉语教育技术倒是成效不少,但办了十来年的翻译教育技术发展却不甚乐观。

人工智能技术里面有一大堆的技术都广泛应用于了外语教学和汉语教学,多种多样的学习工具、学习平台四处开花,那翻译教学呢?

教育信息化要靠资金投入,也不一定全靠资金投入,关键还是靠管理者的思维转变,要靠翻译教育技术专家的不断投入。只是目前看来,这方面的建设还只能依赖销售翻译教育技术产品的企业从外而内去推动,翻译人才培养单位由内而外的变革微乎其微。

危机四:“翻译”的内涵不断变化,传统翻译教育的课程设置早已落后

“翻译”是一个不断变化的概念,不同的人在不同的场景下面对不同的需求有着不一样的理解。根据“DIKW”模型,如果用“数据-信息-知识-智慧”所组成的金字塔来看待“翻译”的内涵,本质上说“翻译”是针对“数据”转换而产生的一种行为。传统的翻译面对的还是文本类型的数据(笔译)和语音类型的数据(口译),但今天的“翻译”面对的则是图像、声音、视频等多种类型的数据。


在这样的情境下,传统翻译教育培养的学生有多少能在人工智能时代逃避那些他们处理不了的数据类型呢?然而,他们在学校期间老师们并没有教他们如何去应对。 查看全部
危机一:翻译专业生源不佳

不管机器翻译的水平有没有超过人类译者,经过最近几年媒体的渲染,在高中生家长和考研学生那里,机器翻译早已超过人类译者,“翻译”作为一种职业已经激发不起优秀学生在这个专业求学的欲望。

开设翻译专业本科和翻译专业硕士的学校是不会担心招不到学生的,因为本科文凭和硕士帽子是人人都要拿的,但语言水平特别优秀的高中生和语言底子打得不错的考研学生应该是不会考虑读翻译专业了。

本来优秀的双语转换技能就是一个经年累月才能打磨出来的稀罕能力,学生要是底子薄,老师再怎么努力也白搭。本科就四年,还不是全学语言和翻译;研究生就两年到三年,原本就不怎么样的语言水平加上不到一年的高强度职业化训练,何以能打磨出优秀的译者和译员?

如今的大学生和研究生被各种事情和事物转移注意力,要学的东西多,学东西的时间又不够。当年我读大学的时候虽然没怎么认真学习,但觉得看书的时间和学习的时间要比现在的大学生多得多。大家知道吗,现在的大学生已经忙得没有时间读书了!

危机二:翻译专业技术背景师资匮乏

虽然读翻译专业的好苗子越来越少,但好学校依然能招到好学生,可是好学校招聘老师的门槛也越来越高,非博士/非本科985211的博士/非双一流的博士/非海外的博士......一大堆条条框框把搞翻译实践的职业译者挡在了象牙塔外,把有技术背景的师资挡在了门外。

许多翻译专业教师还搞不清楚“计算机辅助翻译”的时候,更让人搞不懂的“人工智能”已经全面侵袭而来。绝大多数翻译专业的教师是没有理科背景的,即便有理科背景,能看懂“机器翻译原理”的也不多。本来是急需新鲜血液补充的关键时刻,文理交叉背景的人又难以进入翻译专业师资队伍担任专职教师。

仔细看看国内教计算机辅助翻译的老师,除了教具体的某几个工具的使用方法外,有多少能将最新的技术应用到翻译教学、翻译实践、翻译研究?

据我所知,如今北大的计算机辅助翻译专业毕业生这两三年基本上没有人能进入高校参与翻译专业的建设和翻译人才的培养。这个链条一旦断了,高校的翻译专业建设更加岌岌可危。

危机三:翻译教育信息化建设非常落后

教育技术搞了那么多年,外语教育技术、国际汉语教育技术倒是成效不少,但办了十来年的翻译教育技术发展却不甚乐观。

人工智能技术里面有一大堆的技术都广泛应用于了外语教学和汉语教学,多种多样的学习工具、学习平台四处开花,那翻译教学呢?

教育信息化要靠资金投入,也不一定全靠资金投入,关键还是靠管理者的思维转变,要靠翻译教育技术专家的不断投入。只是目前看来,这方面的建设还只能依赖销售翻译教育技术产品的企业从外而内去推动,翻译人才培养单位由内而外的变革微乎其微。

危机四:“翻译”的内涵不断变化,传统翻译教育的课程设置早已落后

“翻译”是一个不断变化的概念,不同的人在不同的场景下面对不同的需求有着不一样的理解。根据“DIKW”模型,如果用“数据-信息-知识-智慧”所组成的金字塔来看待“翻译”的内涵,本质上说“翻译”是针对“数据”转换而产生的一种行为。传统的翻译面对的还是文本类型的数据(笔译)和语音类型的数据(口译),但今天的“翻译”面对的则是图像、声音、视频等多种类型的数据。


在这样的情境下,传统翻译教育培养的学生有多少能在人工智能时代逃避那些他们处理不了的数据类型呢?然而,他们在学校期间老师们并没有教他们如何去应对。

“谜一样的新技术”与“自甘堕落的老行业”:TAUS最新翻译行业报告读后感

机器翻译应用韩林涛 发表了文章 • 0 个评论 • 325 次浏览 • 2018-03-29 15:59 • 来自相关话题

前言

12月13日,位于荷兰阿姆斯特丹的翻译自动化用户协会(TAUS)发布了最新的翻译行业报告,题目是《Nunc est Tempus: Redesign your translation business, now!》

“Nunc est Tempus”是拉丁语,译成英文是“Now is the time”,中文可译成“时机已到”。后半部分可译为“即刻重塑你的翻译业务”。

在TAUS发给所有会员的邮件中,这样描述这份报告:“the most daring ebook in the history of TAUS, a veritable industry event more than anything”,可见TAUS自己如何重视这份报告。

作为TAUS在中国的代表,我第一时间就看到了这份报告,看完后有很多感想,整理了一下写在这里。我今天这篇文章主要围绕报告第二章的六个话题,将我在看完后的一些真实的想法结合我对中国的翻译行业的观察记录下来,希望对正在学翻译的学生和正在教翻译的老师提供一些参考。至于翻译行业的从业者,尤其是翻译公司的管理人员,我建议去购买这份报告,仔细读一下全部的内容。

正文

我这篇读后感的题目叫:“谜一样的新技术”与“自甘堕落的老行业”。后面一部分非常激进,我想表达的确实是一种我站在外围对这个由传统翻译公司构成的翻译行业的最直接的态度,我觉得传统的翻译公司应当思考如何转型,并且付诸实际行动,否则命不久矣。

同时,我也在这里建议,优秀的翻译专业学生毕业后暂时不要考虑前往传统的翻译公司,而是去那些能让你的语言服务价值得到认可并能使之持续提升的企业。我所谓的“传统的翻译公司”是指还没有在工作流程中的方方面面进行技术升级换代的翻译公司。

我也建议各位即将报考翻译专业的大学生,在择校前要看清楚你报考的那所学校的翻译专业是否已经或正在推动技术与翻译教学、翻译实践、翻译研究等的结合,如果还没有请慎重考虑,否则研究生的两年里即便你能拿到梦想的“研究生帽子”,也无法在接下来5-10年的职业快速发展期得到升华。

我接下来尽量少说废话,把我的思考直接说出来。每一点都对应报告第二章的的一节。

一、开源算法越来越多,行业内却无人能用

“开源技术”(Open Source)是一种免费的开放技术。如果你想做一个多语言的公司网站,但又没有钱找人开发,那么可以去网上找别人开放了源代码的程序,下载下来安装在自己的服务器上,就可以上线运营了。

同样的,如果你想拥有自己的“谷歌翻译”、“百度翻译”,你也可以自己去网上下载谷歌等大企业免费共享的机器翻译引擎源代码。

这两年来,各种开源技术层出不穷,但是,行业里竟然没有几家翻译公司能在自己的服务器上搭建机器翻译引擎来训练自己的机器翻译系统。原因很简单,翻译公司一般没有自己的技术支持团队,即便有也没有机器翻译技术背景,所以免费的技术摆在面前也无法使用,只能求助懂得搭建开源机器翻译系统的高校科研团队。

但大部分翻译公司又发现他们的服务很贵,而且还不是一次性的服务,开源技术在使用过程中如果没有长期的技术支持,一旦出了问题就无法修复。很多翻译公司还不愿意将自己手里的双语数据交给陌生人。

对于翻译公司的管理人员而言,不论参加多少场神经机器翻译的讲习班,始终都觉得“神经机器翻译技术”是谜一样的技术,大致了解,但无法加以使用。

二、劳动力驱动的行业在转变成数据驱动的过程中坐吃山空

上帝毁掉巴别塔阻止人们相互沟通,那每一个人都希望语言互通吗?

翻译行业本是一个劳动力驱动的行业,有些翻译公司可以没有一个译者,但什么业务都敢接,因为业务拿到手了再全世界到处找人都来得及。有时候低价接的业务再低价给译者,因为他们业务的上游就不是什么高质量的客户。

机器翻译技术的发展让许多翻译公司也意识到机器翻译的质量比他们招聘的不少译者的质量的还要好,从排斥机器翻译到接受机器翻译。于是有人告诉翻译公司,把你们手里的“数据”拿出来,不但可以卖钱,还可以进一步提升机器翻译的质量。

从机器翻译技术起步的时候开始,技术人员就从许多机构内部获取了高质量的成熟的双语或多语语料,这些来源包括联合国、欧洲议会等语言服务的需求方(甲方),他们付钱购买语言服务,自然也拥有语言服务的产品。

除了欧洲议会这种政府背景的甲方外,还有许多商业公司作为甲方,手中也有许多成熟的语料,比如许多IT公司,在将产品卖到全世界的同时也购买了许多翻译服务来帮助他们更好的国际化,这也就是“本地化”的起源。

当机器翻译技术人员掏空了政府和商业公司的语料后,就开始通过“爬虫”来下载互联网上公开的双语或多语信息,比如网站信息、文档内容等。

等互联网的语言数据被榨干后,又有人打起了翻译公司、学校和个人的主意。比如我们国内有UTH、TMXmall、语言大数据联盟等企业和组织,尽最大程度从不同渠道购买数据、分享数据、清洗数据和过滤数据。

有些翻译公司手里的数据最开始就没有做好共享的准备,都在各种类型的文档中杂乱的存储,在共享的过程中就付出了很多精力来清洗数据,比如把PDF、图片转换成Word再进行句句对齐。有些翻译公司动作太晚,采购方有一套比对数据是否已经存在的流程,一对比发现不少翻译公司提供的数据早就有人提供了,这样的数据自然就买不上好价钱。

当翻译公司因为没有技术实力让自己手中的价值升值而卖出自己的数据给数据交易公司时,就已经走上了坐吃山空的道路。

三、翻译公司在翻译行业技术升级的过程中一败再败

中国的翻译行业升级换代过程非常缓慢,直接体现就是在翻译行业提供技术服务的公司发展缓慢。许多技术公司意识到翻译公司要使用计算机辅助翻译技术,于是向他们卖国外的现成产品,但翻译公司更喜欢用免费的单机盗版软件,一直不购买服务器版的更为强大的正版计算机辅助翻译软件。像SDL Trados这样的计算机辅助翻译工具在中国的翻译公司身上是赚不到钱的。

而计算机辅助翻译软件也在发生着从桌面端到云端的技术变革,国内外出现了大量的在浏览器里就能使用的计算机辅助翻译工具。但不少翻译公司依然拒绝这种变革,其中一个理由就是,不愿意将自己的数据放在别人的服务器上。最保险的还是自己电脑上装的盗版软件。

而当技术公司看准机器翻译技术的发展契机,开始向翻译公司提供定制机器翻译服务时,翻译公司依然因为缺钱和群心眼,无法接受定制机器翻译服务。

在这样的发展过程中,翻译公司的技术升级缓慢推进,而技术公司则看清了这些抠门的家伙,不再视他们为目标客户。既然赚不到你们的钱,要么忽视你们,要么就消灭你们。于是,一场从翻译行业上游发起的技术革命正在悄然开始。

这场“甲方翻译技术革命”是从两个方面展开的,一方面是向甲方提供节省翻译服务成本的方案,另一方面就是培养甲方,在高校里培养离不开翻译技术的翻译专业学生。

这场革命还在悄悄进行中,而且中国这么大,需要翻译服务的客户群体那么大,优秀学生的培养速度又跟不上,革命能否成功还无法预料。

可以预见的是,与“翻译”相关的衍生服务将会越来越多,原本与翻译没有关系的公司也来提供翻译服务,原本需要翻译公司介入的流程现在都在“去中间化”,互联网让翻译服务变得像水电一样随处可得,翻译服务的需求方通过技术手段可以跳过翻译公司直接获取个人的翻译服务。在中国这样的环境下,这个进程只会加速,不会衰减。

技术要替代的不是翻译服务,也许是传统的翻译公司。

四、语音翻译和语音控制让翻译服务与大众生活融入在一起

我已经不止一次用语音控制的方法来设置手机闹钟,我享受这种不用动手就能实现目的的过程。无论是国外的谷歌、微软,还是国内的百度、搜狗、腾讯,都在推动口语翻译技术的发展。

我曾经这样说,他们的目的也许并不是替代同声传译员,而是让用户可以用语音的方式与这个世界交互,用语音控制设备。

如今很多人开始使用跨语言检索的方式来浏览国外的网站,他们搜的是中文,看到的是中文,因为搜到的外文信息已经在后台转换成了中文。你能搜到的东西越多,就越想去搜索,你的搜索次数越多看到的广告也就越多,搜索引擎的广告服务就越赚钱。

当机器翻译可以把你输入的文字精准转换成另一个语言时,机器就可以把任何外文通过机器翻译转换成机器可以“看懂”的指令。机器翻译服务隐藏了后台,你可以用语音跟硬件设备(比如机器人?)交互。外国人不用学中文也可以控制中国制造的智能家居,这是不是很让人兴奋的一件事?

搞机器翻译的不需要知道文学文本如何翻译,这与他们的商业目的和最终目标没有关系,他们在乎的是在商业的世界机器翻译如何发挥更大的价值。专业的口笔译员压根没有入人家的法眼,不过是机器翻译技术发展过程中的陪跑者而已,到了终点就只剩全场的聚光灯了,没有人会去关注陪跑的人。

五、与中文有关的翻译服务和中国市场将不断升值

这部分我没有什么想说的。全世界的人都想赚中国人的钱,中国人也想把自己的产品卖到全世界。大家只需要知道:与中文相关的翻译服务将会不断产生新的价值。在这个过程中,翻译公司的作用将会不断被更多不同类型的商业服务所替代。传统的翻译公司还能在中国市场存活下去,但没有大钱可赚。包括翻译在内的高级语言服务将更有价值。

六、要深入挖掘数据中的洞见

翻译服务的上游是“数据”,下游也是“数据”。大部分的翻译公司单纯傻傻的输入数据输出数据,而不提供对数据的解读。咨询公司需要翻译服务、律师事务所需要翻译服务、公关公司需要翻译服务,但他们比翻译公司更能赚钱,原因就是他们能够从翻译完之后的数据中获取更多洞见,为客户提供更多价值,从而赚更多的钱。

如果你现在正在学习的是如何做翻译,那么你更应该学习的是如何在技术的辅助下快速做完翻译,然后在技术的帮助下更好的理解你产出的文本,从中发现更多的价值。

结语

写到这里,我把我看完TAUS报告的大部分所思所想都记录了下来。需要说明的是,这些不是报告里的内容,只是读完报告后瞎想的内容。

看完这个报告后,我给这篇文章起了一个耸人听闻的题目,这实际上是我对当今的翻译行业和翻译教育行业的担忧。因为,目前,这个行业给优秀技术人员的进入和先进技术的融合制造了很大很大的困难。“技术”对这个行业的人来说,永远是个看不透的“谜”。如果一个行业不从内向外突围,就只能被人从外到内侵蚀。

这个行业相当不缺“会说”的人,但万分欠缺“能做”的人。我的这些话只能写给还没有进入这个行业的学生们,因为只有你们开始改变,未来才会充满惊喜。 查看全部
前言

12月13日,位于荷兰阿姆斯特丹的翻译自动化用户协会(TAUS)发布了最新的翻译行业报告,题目是《Nunc est Tempus: Redesign your translation business, now!》

“Nunc est Tempus”是拉丁语,译成英文是“Now is the time”,中文可译成“时机已到”。后半部分可译为“即刻重塑你的翻译业务”。

在TAUS发给所有会员的邮件中,这样描述这份报告:“the most daring ebook in the history of TAUS, a veritable industry event more than anything”,可见TAUS自己如何重视这份报告。

作为TAUS在中国的代表,我第一时间就看到了这份报告,看完后有很多感想,整理了一下写在这里。我今天这篇文章主要围绕报告第二章的六个话题,将我在看完后的一些真实的想法结合我对中国的翻译行业的观察记录下来,希望对正在学翻译的学生和正在教翻译的老师提供一些参考。至于翻译行业的从业者,尤其是翻译公司的管理人员,我建议去购买这份报告,仔细读一下全部的内容。

正文

我这篇读后感的题目叫:“谜一样的新技术”与“自甘堕落的老行业”。后面一部分非常激进,我想表达的确实是一种我站在外围对这个由传统翻译公司构成的翻译行业的最直接的态度,我觉得传统的翻译公司应当思考如何转型,并且付诸实际行动,否则命不久矣。

同时,我也在这里建议,优秀的翻译专业学生毕业后暂时不要考虑前往传统的翻译公司,而是去那些能让你的语言服务价值得到认可并能使之持续提升的企业。我所谓的“传统的翻译公司”是指还没有在工作流程中的方方面面进行技术升级换代的翻译公司。

我也建议各位即将报考翻译专业的大学生,在择校前要看清楚你报考的那所学校的翻译专业是否已经或正在推动技术与翻译教学、翻译实践、翻译研究等的结合,如果还没有请慎重考虑,否则研究生的两年里即便你能拿到梦想的“研究生帽子”,也无法在接下来5-10年的职业快速发展期得到升华。

我接下来尽量少说废话,把我的思考直接说出来。每一点都对应报告第二章的的一节。

一、开源算法越来越多,行业内却无人能用

“开源技术”(Open Source)是一种免费的开放技术。如果你想做一个多语言的公司网站,但又没有钱找人开发,那么可以去网上找别人开放了源代码的程序,下载下来安装在自己的服务器上,就可以上线运营了。

同样的,如果你想拥有自己的“谷歌翻译”、“百度翻译”,你也可以自己去网上下载谷歌等大企业免费共享的机器翻译引擎源代码。

这两年来,各种开源技术层出不穷,但是,行业里竟然没有几家翻译公司能在自己的服务器上搭建机器翻译引擎来训练自己的机器翻译系统。原因很简单,翻译公司一般没有自己的技术支持团队,即便有也没有机器翻译技术背景,所以免费的技术摆在面前也无法使用,只能求助懂得搭建开源机器翻译系统的高校科研团队。

但大部分翻译公司又发现他们的服务很贵,而且还不是一次性的服务,开源技术在使用过程中如果没有长期的技术支持,一旦出了问题就无法修复。很多翻译公司还不愿意将自己手里的双语数据交给陌生人。

对于翻译公司的管理人员而言,不论参加多少场神经机器翻译的讲习班,始终都觉得“神经机器翻译技术”是谜一样的技术,大致了解,但无法加以使用。

二、劳动力驱动的行业在转变成数据驱动的过程中坐吃山空

上帝毁掉巴别塔阻止人们相互沟通,那每一个人都希望语言互通吗?

翻译行业本是一个劳动力驱动的行业,有些翻译公司可以没有一个译者,但什么业务都敢接,因为业务拿到手了再全世界到处找人都来得及。有时候低价接的业务再低价给译者,因为他们业务的上游就不是什么高质量的客户。

机器翻译技术的发展让许多翻译公司也意识到机器翻译的质量比他们招聘的不少译者的质量的还要好,从排斥机器翻译到接受机器翻译。于是有人告诉翻译公司,把你们手里的“数据”拿出来,不但可以卖钱,还可以进一步提升机器翻译的质量。

从机器翻译技术起步的时候开始,技术人员就从许多机构内部获取了高质量的成熟的双语或多语语料,这些来源包括联合国、欧洲议会等语言服务的需求方(甲方),他们付钱购买语言服务,自然也拥有语言服务的产品。

除了欧洲议会这种政府背景的甲方外,还有许多商业公司作为甲方,手中也有许多成熟的语料,比如许多IT公司,在将产品卖到全世界的同时也购买了许多翻译服务来帮助他们更好的国际化,这也就是“本地化”的起源。

当机器翻译技术人员掏空了政府和商业公司的语料后,就开始通过“爬虫”来下载互联网上公开的双语或多语信息,比如网站信息、文档内容等。

等互联网的语言数据被榨干后,又有人打起了翻译公司、学校和个人的主意。比如我们国内有UTH、TMXmall、语言大数据联盟等企业和组织,尽最大程度从不同渠道购买数据、分享数据、清洗数据和过滤数据。

有些翻译公司手里的数据最开始就没有做好共享的准备,都在各种类型的文档中杂乱的存储,在共享的过程中就付出了很多精力来清洗数据,比如把PDF、图片转换成Word再进行句句对齐。有些翻译公司动作太晚,采购方有一套比对数据是否已经存在的流程,一对比发现不少翻译公司提供的数据早就有人提供了,这样的数据自然就买不上好价钱。

当翻译公司因为没有技术实力让自己手中的价值升值而卖出自己的数据给数据交易公司时,就已经走上了坐吃山空的道路。

三、翻译公司在翻译行业技术升级的过程中一败再败

中国的翻译行业升级换代过程非常缓慢,直接体现就是在翻译行业提供技术服务的公司发展缓慢。许多技术公司意识到翻译公司要使用计算机辅助翻译技术,于是向他们卖国外的现成产品,但翻译公司更喜欢用免费的单机盗版软件,一直不购买服务器版的更为强大的正版计算机辅助翻译软件。像SDL Trados这样的计算机辅助翻译工具在中国的翻译公司身上是赚不到钱的。

而计算机辅助翻译软件也在发生着从桌面端到云端的技术变革,国内外出现了大量的在浏览器里就能使用的计算机辅助翻译工具。但不少翻译公司依然拒绝这种变革,其中一个理由就是,不愿意将自己的数据放在别人的服务器上。最保险的还是自己电脑上装的盗版软件。

而当技术公司看准机器翻译技术的发展契机,开始向翻译公司提供定制机器翻译服务时,翻译公司依然因为缺钱和群心眼,无法接受定制机器翻译服务。

在这样的发展过程中,翻译公司的技术升级缓慢推进,而技术公司则看清了这些抠门的家伙,不再视他们为目标客户。既然赚不到你们的钱,要么忽视你们,要么就消灭你们。于是,一场从翻译行业上游发起的技术革命正在悄然开始。

这场“甲方翻译技术革命”是从两个方面展开的,一方面是向甲方提供节省翻译服务成本的方案,另一方面就是培养甲方,在高校里培养离不开翻译技术的翻译专业学生。

这场革命还在悄悄进行中,而且中国这么大,需要翻译服务的客户群体那么大,优秀学生的培养速度又跟不上,革命能否成功还无法预料。

可以预见的是,与“翻译”相关的衍生服务将会越来越多,原本与翻译没有关系的公司也来提供翻译服务,原本需要翻译公司介入的流程现在都在“去中间化”,互联网让翻译服务变得像水电一样随处可得,翻译服务的需求方通过技术手段可以跳过翻译公司直接获取个人的翻译服务。在中国这样的环境下,这个进程只会加速,不会衰减。

技术要替代的不是翻译服务,也许是传统的翻译公司。

四、语音翻译和语音控制让翻译服务与大众生活融入在一起

我已经不止一次用语音控制的方法来设置手机闹钟,我享受这种不用动手就能实现目的的过程。无论是国外的谷歌、微软,还是国内的百度、搜狗、腾讯,都在推动口语翻译技术的发展。

我曾经这样说,他们的目的也许并不是替代同声传译员,而是让用户可以用语音的方式与这个世界交互,用语音控制设备。

如今很多人开始使用跨语言检索的方式来浏览国外的网站,他们搜的是中文,看到的是中文,因为搜到的外文信息已经在后台转换成了中文。你能搜到的东西越多,就越想去搜索,你的搜索次数越多看到的广告也就越多,搜索引擎的广告服务就越赚钱。

当机器翻译可以把你输入的文字精准转换成另一个语言时,机器就可以把任何外文通过机器翻译转换成机器可以“看懂”的指令。机器翻译服务隐藏了后台,你可以用语音跟硬件设备(比如机器人?)交互。外国人不用学中文也可以控制中国制造的智能家居,这是不是很让人兴奋的一件事?

搞机器翻译的不需要知道文学文本如何翻译,这与他们的商业目的和最终目标没有关系,他们在乎的是在商业的世界机器翻译如何发挥更大的价值。专业的口笔译员压根没有入人家的法眼,不过是机器翻译技术发展过程中的陪跑者而已,到了终点就只剩全场的聚光灯了,没有人会去关注陪跑的人。

五、与中文有关的翻译服务和中国市场将不断升值

这部分我没有什么想说的。全世界的人都想赚中国人的钱,中国人也想把自己的产品卖到全世界。大家只需要知道:与中文相关的翻译服务将会不断产生新的价值。在这个过程中,翻译公司的作用将会不断被更多不同类型的商业服务所替代。传统的翻译公司还能在中国市场存活下去,但没有大钱可赚。包括翻译在内的高级语言服务将更有价值。

六、要深入挖掘数据中的洞见

翻译服务的上游是“数据”,下游也是“数据”。大部分的翻译公司单纯傻傻的输入数据输出数据,而不提供对数据的解读。咨询公司需要翻译服务、律师事务所需要翻译服务、公关公司需要翻译服务,但他们比翻译公司更能赚钱,原因就是他们能够从翻译完之后的数据中获取更多洞见,为客户提供更多价值,从而赚更多的钱。

如果你现在正在学习的是如何做翻译,那么你更应该学习的是如何在技术的辅助下快速做完翻译,然后在技术的帮助下更好的理解你产出的文本,从中发现更多的价值。

结语

写到这里,我把我看完TAUS报告的大部分所思所想都记录了下来。需要说明的是,这些不是报告里的内容,只是读完报告后瞎想的内容。

看完这个报告后,我给这篇文章起了一个耸人听闻的题目,这实际上是我对当今的翻译行业和翻译教育行业的担忧。因为,目前,这个行业给优秀技术人员的进入和先进技术的融合制造了很大很大的困难。“技术”对这个行业的人来说,永远是个看不透的“谜”。如果一个行业不从内向外突围,就只能被人从外到内侵蚀。

这个行业相当不缺“会说”的人,但万分欠缺“能做”的人。我的这些话只能写给还没有进入这个行业的学生们,因为只有你们开始改变,未来才会充满惊喜。

“译者”在人工智能时代扮演什么样的角色?

机器翻译应用韩林涛 发表了文章 • 0 个评论 • 413 次浏览 • 2018-03-29 15:56 • 来自相关话题

背景

现代语音识别和自然语言处理研究的先驱、美国工程院院士Frederick Jelinek曾经有句名言:“Every time I fire a linguist, the performance of the speech recognizer goes up.”(我每开除一位语言学家,我的语言识别系统性能就会提升。)

人们有时候会误读这句话,认为在自然语言处理技术发展的进程中,语言专家的作用微乎其微,拯救世界的任务还得落在程序员身上。

我去专门查过Frederick Jelinek大牛的维基百科介绍,里面有段话很有意思(注意粗体加下划线的部分):

“Although its fame and iconic status are undisputed (it was for example used as the title of a 1998 speech by Julia Hirschberg), its context is unknown and its specific wording and dating are unclear. According to Daniel Jurafsky and James H. Martin, Jelinek himself recalled the quote as "Anytime a linguist leaves the group the recognition rate goes up" and dated it to December 1988 (Wayne, Pennsylvania), further noting that the quote did not appear in the published proceeding,[2][3] whereas Roger K. Moore gave the wording as "Every time we fire a phonetician/linguist, the performance of our system goes up" and dated it to an IEEE Automatic Speech Recognition and Understanding workshop held in 1985.[4] According to Steve Young, "the story goes that one day one of his linguists resigned, and Fred decided to replace him not by another linguist but by an engineer. A little while later, Fred noticed that the performance of his system improved significantly. So he encouraged another linguist to find alternative employment, and sure enough performance improved again."”

来源:https://en.wikipedia.org/wiki/ ... ote-6

思考

自然语言处理专家嘴边经常提及这句话,搞机器翻译技术的专家也时不时拿这句话调侃一下。如今很多机器翻译团队里并没有所谓的“语言学家”(Linguist),不需要任何语言学家就能搭建一套高效能的机器翻译程序,产出他们眼中高质量的机器翻译译文,发布令他们兴奋不已的成果。

而令他们兴奋不已的论文数据又会令媒体记者的双手颤抖不已,写下惊天地泣鬼神,令翻译人员闻字丧胆的热文。

但以下新闻引发了我的思考:

新闻一:

《谷歌:用算法和大数据“干掉”语言学家》

时间:2013年9月25日

摘要:

谷歌是一家极度看重算法、充满工程师文化的公司,但或许你还是会为此而感到惊奇——他们认为翻译是一个数学和统计学方面的问题。最近,位于谷歌总部的谷歌翻译团队正迅速扩张,他们新招了数名德国计算机科学家,但却没有招收一名语言学家。

来源:钛媒体 http://www.tmtpost.com/498825.html

新闻二:

《实现无监督学习?谷歌雇百名语言学家为训练数据“镀金”》

时间:2016年12月01日

摘要:

谷歌组织了一个由大量语言学博士组成团队,它把这支团队称为“Pygmalion”,使用这些语言学家人工筛选的数据来训练神经网络。实际上,谷歌的机器通过观察人类的做法来学习如何从长段落中提取相关答案,这个过程需要重复多遍,相当漫长。这些艰苦的努力同时证明了深度学习的能力和局限性。为了训练像这样的人工智能系统,需要大量的、由专业人士筛选过的数据。这些数据不容易得到,也不便宜,而且对这种数据的需求不会很快消失。

来源:新智元 https://mp.weixin.qq.com/s/AmLvehhPpTB-eoGFlXISSA

新闻三:

《特写 | 人工智能背后的人》

时间:2017年4月7日

摘要:

秦娇今年刚满 30 岁,几个月前刚刚从呼叫中心跳槽到一家「数据加工」公司。虽然跨了行业,她并不觉得两份工作有什么不同,都是按照甲方的要求和己方的工作节奏,把人手安排到一个又一个项目中去。

公司刚成立不到一年,眼下业务大多是标注数据,即根据项目方要求,人工为图片、视频和语音内容打标签、做标记。标注好的数据会被人工智能公司用来训练算法模型,然后应用到图像识别、语音识别等不同领域。

「数据加工」公司所在地距「大数据之城」贵阳五十多公里,是一座只接受科技公司入驻的「数字小镇」。

小镇的隔壁有一间规模不小的高职学校,学校的学生构成了这家公司目前主要的员工来源。高职学校初建的目的是教育扶贫,因此学生们大多来自贫困山区,学校会提供不少补助和奖学金。在数据加工公司兼职赚来的钱不仅足够生活,有些学生还会拿出一部分补贴家用。偶尔这份工作还能成为职业跳板,「我们的学生踏实又努力,有的去北京实习,因为熟悉标注工作、又认真,反馈回来说比同样实习的北京大学生强得多」。

除此之外,她们还可以承接小语种的语料收集工作。地处西南、临近东南亚,当地的人际关系链和频繁的商务交往能提供不少便利。

来源:机器之心 https://zhuanlan.zhihu.com/p/26181394

我不知道诸位读者看到这三条新闻后是什么样的感受?我的感受是这样的:

严格意义上来说,“语言学家”、“语言专家”、“语言学博士”与“翻译学家”、“翻译家”、“翻译专家”、“翻译学博士”是两个圈子的人。我如果说“我身边最牛的翻译根本不知道语言学是什么”,你信吗?我如果说“做翻译根本不需要语言学知识”,你信吗?我如果说“现在的翻译专业学生根本不需要《语言学》”,你信吗?

机器翻译研发团队之所以没有大牛翻译,并不是因为翻译人员没有作用,而是因为他们已经过气了,机器翻译研发团队手里拿来训练机器翻译程序的“语料/数据”是哪儿来的?还不是一堆他们并不知道名字的译者一个字一个字翻译出来的,但翻译完就完了,他们并不清楚自己的译文以后会起到什么作用,以为只是作为“作品”被陌生读者阅读罢了。

谷歌之所以又需要语言学博士来标注数据了,并不是因为他们的技术没有作用,而是因为他们手里的数据不够用了,需要由人来补充新的更高质量的数据。而机器翻译研发团队还没有开始招募“语言学博士”、“翻译学博士”,是因为人翻译的速度太慢了,价格又太贵了,短时间内提供的高质量的双语数据对机器翻译程序性能的提升并没有太大提升,而直接从第三方公司手中买廉价的双语数据或者自己写程序去抓取免费的双语数据则更划算一些。

标注数据这种工作跟富士康流水线上装配手机的工作一样,“恶心但必需”。“人工智能”时代,耗费多少“人工”,就有多么“智能”。

译者通常认为自己产出的“双语平行文本”没有什么用,但通过技术可以进一步挖掘双语平行文本中的诸多信息,比如双语术语、语义信息、句法信息等。那些年长的译者花几十年从双语文本中靠经验挖掘出来的“知识”可能远不及计算机程序几秒钟挖掘出来的的信息。

那人工智能时代,“译者”究竟扮演着什么样的角色?在我看来,只要世界不停转,译者就有翻译不完的文字,只要有翻译不完的文字就有赚不完的钱,所以译者的生存问题是不会受到影响的。

但,在今天的翻译行业生态环境下,“译者”也要顺应适者生存、优胜劣汰的法则,总有人因为不适应人工智能时代工作模式的变革而被淘汰,也总有人会在人工智能时代找到驾驭技术迎难而上的突破口。

人工智能时代,聪明的“译者”要做一个“变革者”,熟悉技术、拥抱技术、使用技术。但在这个过程中,译者其实处于非常弱势的位置,因为最终改变译者命运的不是译者自己,而是为译者提供技术服务的开发者。因此,聪明的“译者”还要做一个“合作者”,熟悉提供技术服务的人、使用他们提供的技术。

结语

人工智能时代,年轻一代译者的价值应当在两方面凸显,一方面是自身的翻译水平,另一方面是自身的技术认识。老一辈的译者可以在翻译水平方面引领年轻一代译者的发展,但不能冥顽不化,令年轻一代错失认识技术的良机。“技术”包罗万象,年轻一代译者并不需要样样精通,也绝无可能,需要有人引领年轻一代译者认识对其有价值的真技术。

作为年轻一代译者,被机器翻译专家开除并不可怕,可怕的是被翻译专家开除。 查看全部
背景

现代语音识别和自然语言处理研究的先驱、美国工程院院士Frederick Jelinek曾经有句名言:“Every time I fire a linguist, the performance of the speech recognizer goes up.”(我每开除一位语言学家,我的语言识别系统性能就会提升。)

人们有时候会误读这句话,认为在自然语言处理技术发展的进程中,语言专家的作用微乎其微,拯救世界的任务还得落在程序员身上。

我去专门查过Frederick Jelinek大牛的维基百科介绍,里面有段话很有意思(注意粗体加下划线的部分):

“Although its fame and iconic status are undisputed (it was for example used as the title of a 1998 speech by Julia Hirschberg), its context is unknown and its specific wording and dating are unclear. According to Daniel Jurafsky and James H. Martin, Jelinek himself recalled the quote as "Anytime a linguist leaves the group the recognition rate goes up" and dated it to December 1988 (Wayne, Pennsylvania), further noting that the quote did not appear in the published proceeding,[2][3] whereas Roger K. Moore gave the wording as "Every time we fire a phonetician/linguist, the performance of our system goes up" and dated it to an IEEE Automatic Speech Recognition and Understanding workshop held in 1985.[4] According to Steve Young, "the story goes that one day one of his linguists resigned, and Fred decided to replace him not by another linguist but by an engineer. A little while later, Fred noticed that the performance of his system improved significantly. So he encouraged another linguist to find alternative employment, and sure enough performance improved again."”

来源:https://en.wikipedia.org/wiki/ ... ote-6

思考

自然语言处理专家嘴边经常提及这句话,搞机器翻译技术的专家也时不时拿这句话调侃一下。如今很多机器翻译团队里并没有所谓的“语言学家”(Linguist),不需要任何语言学家就能搭建一套高效能的机器翻译程序,产出他们眼中高质量的机器翻译译文,发布令他们兴奋不已的成果。

而令他们兴奋不已的论文数据又会令媒体记者的双手颤抖不已,写下惊天地泣鬼神,令翻译人员闻字丧胆的热文。

但以下新闻引发了我的思考:

新闻一:

《谷歌:用算法和大数据“干掉”语言学家》

时间:2013年9月25日

摘要:

谷歌是一家极度看重算法、充满工程师文化的公司,但或许你还是会为此而感到惊奇——他们认为翻译是一个数学和统计学方面的问题。最近,位于谷歌总部的谷歌翻译团队正迅速扩张,他们新招了数名德国计算机科学家,但却没有招收一名语言学家。

来源:钛媒体 http://www.tmtpost.com/498825.html

新闻二:

《实现无监督学习?谷歌雇百名语言学家为训练数据“镀金”》

时间:2016年12月01日

摘要:

谷歌组织了一个由大量语言学博士组成团队,它把这支团队称为“Pygmalion”,使用这些语言学家人工筛选的数据来训练神经网络。实际上,谷歌的机器通过观察人类的做法来学习如何从长段落中提取相关答案,这个过程需要重复多遍,相当漫长。这些艰苦的努力同时证明了深度学习的能力和局限性。为了训练像这样的人工智能系统,需要大量的、由专业人士筛选过的数据。这些数据不容易得到,也不便宜,而且对这种数据的需求不会很快消失。

来源:新智元 https://mp.weixin.qq.com/s/AmLvehhPpTB-eoGFlXISSA

新闻三:

《特写 | 人工智能背后的人》

时间:2017年4月7日

摘要:

秦娇今年刚满 30 岁,几个月前刚刚从呼叫中心跳槽到一家「数据加工」公司。虽然跨了行业,她并不觉得两份工作有什么不同,都是按照甲方的要求和己方的工作节奏,把人手安排到一个又一个项目中去。

公司刚成立不到一年,眼下业务大多是标注数据,即根据项目方要求,人工为图片、视频和语音内容打标签、做标记。标注好的数据会被人工智能公司用来训练算法模型,然后应用到图像识别、语音识别等不同领域。

「数据加工」公司所在地距「大数据之城」贵阳五十多公里,是一座只接受科技公司入驻的「数字小镇」。

小镇的隔壁有一间规模不小的高职学校,学校的学生构成了这家公司目前主要的员工来源。高职学校初建的目的是教育扶贫,因此学生们大多来自贫困山区,学校会提供不少补助和奖学金。在数据加工公司兼职赚来的钱不仅足够生活,有些学生还会拿出一部分补贴家用。偶尔这份工作还能成为职业跳板,「我们的学生踏实又努力,有的去北京实习,因为熟悉标注工作、又认真,反馈回来说比同样实习的北京大学生强得多」。

除此之外,她们还可以承接小语种的语料收集工作。地处西南、临近东南亚,当地的人际关系链和频繁的商务交往能提供不少便利。

来源:机器之心 https://zhuanlan.zhihu.com/p/26181394

我不知道诸位读者看到这三条新闻后是什么样的感受?我的感受是这样的:

严格意义上来说,“语言学家”、“语言专家”、“语言学博士”与“翻译学家”、“翻译家”、“翻译专家”、“翻译学博士”是两个圈子的人。我如果说“我身边最牛的翻译根本不知道语言学是什么”,你信吗?我如果说“做翻译根本不需要语言学知识”,你信吗?我如果说“现在的翻译专业学生根本不需要《语言学》”,你信吗?

机器翻译研发团队之所以没有大牛翻译,并不是因为翻译人员没有作用,而是因为他们已经过气了,机器翻译研发团队手里拿来训练机器翻译程序的“语料/数据”是哪儿来的?还不是一堆他们并不知道名字的译者一个字一个字翻译出来的,但翻译完就完了,他们并不清楚自己的译文以后会起到什么作用,以为只是作为“作品”被陌生读者阅读罢了。

谷歌之所以又需要语言学博士来标注数据了,并不是因为他们的技术没有作用,而是因为他们手里的数据不够用了,需要由人来补充新的更高质量的数据。而机器翻译研发团队还没有开始招募“语言学博士”、“翻译学博士”,是因为人翻译的速度太慢了,价格又太贵了,短时间内提供的高质量的双语数据对机器翻译程序性能的提升并没有太大提升,而直接从第三方公司手中买廉价的双语数据或者自己写程序去抓取免费的双语数据则更划算一些。

标注数据这种工作跟富士康流水线上装配手机的工作一样,“恶心但必需”。“人工智能”时代,耗费多少“人工”,就有多么“智能”。

译者通常认为自己产出的“双语平行文本”没有什么用,但通过技术可以进一步挖掘双语平行文本中的诸多信息,比如双语术语、语义信息、句法信息等。那些年长的译者花几十年从双语文本中靠经验挖掘出来的“知识”可能远不及计算机程序几秒钟挖掘出来的的信息。

那人工智能时代,“译者”究竟扮演着什么样的角色?在我看来,只要世界不停转,译者就有翻译不完的文字,只要有翻译不完的文字就有赚不完的钱,所以译者的生存问题是不会受到影响的。

但,在今天的翻译行业生态环境下,“译者”也要顺应适者生存、优胜劣汰的法则,总有人因为不适应人工智能时代工作模式的变革而被淘汰,也总有人会在人工智能时代找到驾驭技术迎难而上的突破口。

人工智能时代,聪明的“译者”要做一个“变革者”,熟悉技术、拥抱技术、使用技术。但在这个过程中,译者其实处于非常弱势的位置,因为最终改变译者命运的不是译者自己,而是为译者提供技术服务的开发者。因此,聪明的“译者”还要做一个“合作者”,熟悉提供技术服务的人、使用他们提供的技术。

结语

人工智能时代,年轻一代译者的价值应当在两方面凸显,一方面是自身的翻译水平,另一方面是自身的技术认识。老一辈的译者可以在翻译水平方面引领年轻一代译者的发展,但不能冥顽不化,令年轻一代错失认识技术的良机。“技术”包罗万象,年轻一代译者并不需要样样精通,也绝无可能,需要有人引领年轻一代译者认识对其有价值的真技术。

作为年轻一代译者,被机器翻译专家开除并不可怕,可怕的是被翻译专家开除。