巨头发力翻译技术:那些干翻译的 看完此文可以转行了
2015-01-12 17:06 巨头 技术 科技

语音识别的威力很强大,翻译只是其中一环。它目前的瓶颈在哪?语音识别的准确性太低了,它有三个步骤:识别——语义解析——知识图谱。每个步骤的准确性都不同。目前的APP大多只是把“识别”的准确性提高了,达到90%以上,而其余则很低。

i黑马:语音识别的威力很强大,翻译只是其中一环。目前的瓶颈在哪?语音识别的准确性太低了,它有三个步骤:识别——语义解析——知识图谱。每个步骤的准确性都不同。目前的APP大多只是把“识别”的准确性提高了,达到90%以上,而其余则很低。

不过趋势已经来了,谷歌、微软和Facebook等都加入到翻译技术的研发潮中,正在消除语言隔阂。

 
随着通信技术的不断发展,语言对沟通产生的阻碍越发明显,所以谷歌、微软和Facebook等各大科技公司都在努力开发翻译技术。
 
上月,微软旗下的语音通话服务Skype推出了英语与西班牙语之间的同声传译服务。谷歌也不甘人后,很快就会宣布对手机应用进行更新。谷歌翻译现在可以为90种语言提供笔译,而且能够听译多种热门语言。在最新的版本中,这款应用将自动识别某人说的是否是一种热门语言,并自动将其转换成文本。
 
当然,在我试用Skype的过程中,口译技术的效果仍然很糟糕。这项服务还需要佩戴耳机,而且只有当用户停下来倾听对方的话语时,才能达到最佳效果。这种感觉就像在用步话机通话一样。
 
尽管存在种种瑕疵,但这仍然不失为一项了不起的技术,它可以实现神奇的效果:几分钟内,我就会习惯这一过程,与一个来自哥伦比亚的人随意谈论他的妻子、孩子以及在麦德林的生活。事实上,作为我们之间最大的障碍,语言隔阂已经消失于无形。
 
虽然翻译中存在一些错误,但这些错误却是在线产品不断改进的关键所在。由于所谓的机器学习技术能够自动检测结果,并作出相应的调整,使得这类服务可以随着使用量的加大不断改进。事实上,在线拼写检查功能正是通过这种方式才变成令人依赖的功能,而地图导航和其他各种在线服务也都经历了类似的过程。
 
塞巴斯蒂安·库伯罗斯(Sebastian Cuberos),我的这位来自哥伦比亚的新朋友在我们的Skype通话中说:“在你对话的过程中,软件会进行学习。它目前已经很不错了。”虽然翻译出的内容在语法上还算不上精妙,但已经可以让我明白对方所要表达的意思。
 
目前在Skype上使用这项服务的只有几千人。随着不断的“学习”,它今后还将为将近4万人提供西班牙语和英语翻译服务。即使在发展初期,这项功能依然实现了一些不俗的功能,可以对美国和墨西哥的儿童展开社会调查,还可以帮助记者与身在叙利亚的某个家庭展开实施对话。
 
谷歌表示,该公司的翻译应用已经在Android手机上安装了1亿多次,其中多数都可以收到最新的升级。“我们在各大平台上共计拥有5亿多月活跃翻译用户。”谷歌翻译工程总监马克多夫·休吉斯(MacduffHughes)说。由于整个网络有80%至90%的内容都是用10种语言书写的,所以翻译将成为很多人的重要学习元素。
 
谷歌Chrome浏览器已经可以提供主要语种之间的网页自动翻译服务,人们可以借助这款浏览器将英语翻译成韩语。除此之外,Gmail设置等功能还支持140种语言。
 
用户完全可以将自己的电子邮件界面语言设计成克林贡语、海盗语、鸡蛋头语这种来自漫画或电影的语言。当然,Gmail同时也支持切罗基语等真正的小语种,而谷歌希望最终在翻译服务中全面支持这些语种。谷歌很快还将推出一项服务,使得用户将手机摄像头对准外语路牌,便可自动将其翻译成文字,并显示在屏幕上。
 
Twitter和Facebook都使用必应翻译引擎,Facebook拥有全球最大的图片分享服务,因此也扮演着重要的跨境沟通角色,所以他们自然不甘落后,同样在开发自己的翻译服务。该公司还为Skype等待名单上的数千名用户提供了其他同声翻译服务,涵盖了汉语和俄罗斯等语种。
对机器翻译而言,充实“语料库”是关键所在。谷歌使用人类翻译来启动这项服务,而在一名政府官员最近通过电视求助后,谷歌还增加了哈萨克语。“人们可能会强烈要求我们将他们的语言加入这项服务。”休吉斯说。
 
但还是有专家担心,随着机器通过语调和幽默等内容更加深入地了解人类,相关企业可能会把这些元素应用到广告中,甚至透露给执法部门。事实上,谷歌的搜索关键词和Facebook的“点赞”都已经走过了相同的道路。
 
“这项技术很神奇,但威胁同样很大。”未来通信研究公司Hypervoice Consortium联合创始人凯利·菲兹西蒙斯(KellyFitzsimmons)说,“万一政权更迭后,新的政府不喜欢你的言论,那么大量的对话内容就会对你构成威胁。”
 
菲兹西蒙斯表示,目前只有1%的消费者愿意让自己的数据被过度纪录。而事实上,当人们使用机器翻译或语音助理时,这种情况就会实实在在地发生。她认为,只有人们自己才能更好地管理自己的隐私,而不应将其外包给服务提供商。但在现阶段,为了获得种种便利,人们都在个人数据方面做出了让步。
 
Skype产品营销总监奥利维尔·方塔纳(OlivierFontana)表示,在人们看到翻译的内容前,对话会被分解成独立的文件。“不可能知道谁说了什么。”他说,“美国国家安全局也无法利用这些数据。”
 
休吉斯表示,谷歌也关注语音处理流程,因为一旦用声音识别技术取代密码,这便有可能对安全性造成威胁。除此之外,他还表示,突出翻译内容的差异也有一定的意义——如果我说中文,可以变成女声,这样人们就知道这是翻译出来的内容。