您的位置 首页 > 德语常识

百度翻译 - 智能小程序,百度翻译1

金磊发稿人:奥飞斯量子比特报告| 公众号QbitAI

10年后机器翻译系统将发生怎样的变化?

早在2011年,他就只有“汉译英”的翻译能力。然而,10年来,他在翻译领域不断提升自己。

百度翻译 - 智能小程序,百度翻译1

目前TA的开通方式如下。

全球首个互联网神经翻译系统发布,10年间翻译质量提升30分(国际常用评价指标BLEU),通常1分的提升就非常显着。

全球200种语言之间的翻译首次突破200种语言,10年间翻译语言数量增加了100倍。

它不再只是文字翻译技能,而是照片、视频、文档甚至同声传译的跨模态翻译。

除了输入框输入文字并翻译之外,我们还提供翻译App、AI同声传译会议版、同声传译助手、小程序、翻译开放平台等多种产品。

如今,全球翻译字符数量已超过1000亿个,相当于2000本大英百科全书,是十年前的10万倍。

就连Gartner 也这么说:

是神经网络机器翻译的标杆机构,也是国内唯一入围的机构。它在全球人工智能翻译服务中发挥着重要作用。

……

TA就是百度翻译。

但如果你仍然认为它只是一个翻译器,那可能有点片面了。

因为目前的百度翻译已经被“修改”了一点。

10岁的百度翻译是怎样的体验?十年前,百度翻译刚开始是一个只翻译中文和英文的网站。

因此,可以说翻译已经达到了一个新的水平。

首先,关于翻译语言,正如我前面提到的,百度翻译是世界上第一个可以在200多种语言之间进行翻译的系统。

而这不仅体现在翻译的语言数量上,还体现在翻译的难度上。

比如,我们涉足一些“冷门”语言,以《文言精华》为例,输入文字《学弈》。

弈秋是这个国家最好的球员之一。他让弈秋教他们俩下棋。一个人在专心玩游戏,而弈秋却听着。另一个正在听,以为是一只天鹅来了,想要救他,就用弓射了他。我向他学习,但我不如他。他为什么这么聪明?说:这不是真的。

只需点击一下,百度翻译即可立即以本地语言格式显示晦涩的古代文本。

然而,机器要做到这一点并不容易,因为除主要语言外,大多数语言的翻译资源都很稀缺,无法为人工智能提供足够的知识来学习。

然而,百度翻译不仅仅满足于文本翻译“更多”、“更好”,还花了10年的时间努力提升便利性。

不仅近期,百度翻译App更新至10.0版本,“花式翻译”得到了充分体现。

它不仅仅是输入文本并翻译的简单例程;它还集成了音频、图像、视频、文档和其他格式。

换句话说,如果您现在想要翻译,它不再是您输入文本的单一格式。

您还可以说出句子、拍照或直接导入完整文档来完成翻译。

不仅如此,百度翻译可以轻松进行同声传译等高级翻译。

百度翻译还荣获全球机器翻译大赛WMT(Workshop on Machine Translation)中英翻译组第一名。

不难理解,百度翻译花了10年的时间不仅横向扩张,还在每个产品的纵向“自学能力”上下功夫。现在这个大家庭欣欣向荣。

那么百度翻译是如何在10年内达到这个水平的呢?

百度翻译的演变首先,我们简单回顾一下机器翻译的发展历程。

“机器翻译”问题是由信息论先驱、美国科学家沃伦·韦弗于1946年,即第一台计算机ENIAC诞生一年后提出的。

从此,机器翻译首次进入“基于规则的方法”时代。

该方法本质上是将专家的翻译知识以规则的形式记录下来,并利用翻译规则通过软件来实现机器翻译过程。

但这种方法的缺点也很明显:构建和维护成本太高,而且每次都要重写整个程序。

20世纪80年代末90年代初,IBM提出了另一种机器翻译方法————统计机器翻译,打开了机器翻译时代的第二扇门。

与基于规则的机器翻译不同,统计机器翻译无需手动编写翻译规则,而是转向数据驱动的机器学习技术。

最大的优点是机器可以根据手动定义的特征进行“自学习”,而以前基于规则的方法需要人类专家亲自动手。

百度翻译服务之初,主要采用基于统计机器翻译的方法,但为了应对互联网上复杂多样的翻译请求,它也开发了整合现有方法的多策略模型,我当时正在开发它。

2010年,百度翻译成立了自己的研发团队,仅仅一年后就推出了网页版。

然而,统计机器翻译已经存在了20多年,其发展的瓶颈日益显现。翻译能力逐渐进入平台期,翻译质量下降,难以进一步提升,尤其是在远程点单和翻译流畅度方面。

我们需要以身作则,即使我们是摸着石头过河。 2013年,发表了题为《Recurrent Continuous Translation Models》的研究。

由于研究人员提出了一种新方法,机器翻译已经进入神经机器翻译(NMT)时代。

虽然这种神经网络方法固然是一种理想的“替代方案”,但它也给百度翻译团队带来了非常现实的问题。

这是“没有帮助”的,建模技术是全新的,没有经验可循。

此外,基于当时的技术水平,神经网络模型的机器翻译仍然是一个非常“资源密集型”的问题。

提高翻译效率是以消耗大量计算资源为代价的,翻译单个句子往往需要10秒以上。

快进到2015 年。即使在这种情况下,百度翻译团队还是做出了“敢为人先”的决定。

开始基于神经网络的机器翻译。

在技术方法上,百度翻译团队融合了上一代统计机器翻译的特点和NMT的缺点。

具体来说,NMT模型中融入了N-gram语言模型、短语表特征、长度特征等。

实验结果表明,这种“新旧结合”的方法显着提高了NMT 在汉英翻译中的翻译性能。

从项目立项到发布全球首个互联网神经网络机器翻译系统,百度翻译只用了不到六个月的时间。

这一速度比谷歌翻译整整领先了16 个月。

然而,百度翻译并不满足于此。

Bruno Pouliquen,世界知识产权组织机器翻译负责人,MTSUMMIT-2017

我们需要成为更多方向的“引领者”,要翻译成更多的语言,百度翻译也提出了《Multi-Task Learning for Multiple Language Translation》。

在本研究中,百度翻译提出了共享编码器多任务学习神经网络翻译模型,建立了基于神经网络的统一多语言翻译框架。

基于共享编码器的转换模型图

这也是百度翻译能够保持203种语言之间互译的关键。

2017年,百度翻译出人意料地推出了人工智能同声传译功能。

具体来说,我们提出了一种语义单元驱动的机器同声传译模型,解决了平衡翻译质量和同声传译延迟的问题。

同时,百度翻译团队还开发了高质量、低延迟的机器同声传译系统,翻译准确率超过80%,平均延迟3秒。

这是因为百度在机器翻译技术方面处于领先地位,翻译准确率很高。

这就是为什么很多国际会议和活动都选择百度翻译作为技术支持的原因。百度翻译的人工智能同声传译也已在服务贸易交易会、中国国际进口博览会等重要活动中得到部署。

……

这就提出了以下问题:

百度为何在翻译上投入如此大的精力?

翻译不仅仅是一个工具。首先我们需要澄清并达成共识的是,机器翻译是人工智能的最终目标之一,也是人工智能技术最具挑战性的应用之一。

这也是百度在机器翻译领域不断创新的原因。

然而,从另一个角度来看,百度翻译要做的事情并不像翻译本身那么简单。

从10年的发展历程来看,百度翻译目前正在“变味”。

它不仅仅是一种工具,更是世界文化的桥梁、窗口和接受者。

这应该如何理解呢?

从百度翻译所带来的“变化”或许有助于理解。

TA充当用户身边的翻译助手。例如,在交警执法过程中,我和一位外国(俄罗斯)朋友一起遇到了这样的情况。

他们不会说中文,所以交流总是一个问题。

最终,交警通过百度翻译成功解救了外籍船员。

另一个例子是工作场所的语言障碍阻碍了信息获取和沟通。

百度翻译软件让用户跨语言交流更加顺畅。

然而,这样的服务和体验应该是包括残疾人在内的每个人都应该拥有的体验。

为此,百度翻译支持视障开发者开发视障操作软件,帮助大量视障用户免费获得翻译服务。

因为这些真实的故事不断涌现,百度翻译不仅仅是一个翻译工具,还有一座桥梁、一扇窗户、一个传感器的意义。

TA正在帮助世界抗击传染病,但说实话,相比这段经历的“改变”,百度翻译正在逐步履行更深层次、更宏大的使命和价值观。

比如,在抗击疫情方面,百度翻译也在做出努力。

3M的口罩说明书是法文,防护服说明书是英文,三层口罩产品检验合格证是俄文……所有防疫物资都需要翻译。

然而,众所周知,抗击传染病不仅是一项艰巨的任务,也是一场与时间的赛跑。

百度翻译承担起疫情期间翻译工作的重担,仅用两天时间打造出高效易用的定制翻译工具,并立即免费提供给志愿者团队。

多语种防疫视频

虽然TA服务于国家的需求,为超越语言的交流铺平了道路,但百度翻译所做的事情仍然符合国家的需求。

国家在第二届“一带一路”国际合作高峰论坛上提出以下倡议:

互联互通是共建“一带一路”的关键。我们要构建全球互联互通伙伴关系,实现共同发展繁荣。

超越语言的沟通是实现这一目标的关键。

十年来,百度翻译逐步拓展一带一路沿线国家语言之间的翻译,翻译语言数量增长了100倍。

不难理解,这也顺应了各国乃至全球发展互联互通的大趋势。

从目前的情况来看,百度翻译仍然处于“转型期”,想要将翻译转变为一种生产力形式。

但归根结底,翻译还有很长的路要走,即使是取得了多项“世界第一”的百度翻译,也还有很长的路要走。

我想关注一下百度翻译未来在技术和价值方面会带来什么样的提升。 — 及更多— 量子位QbitAI·注册关注今日头条,第一时间了解最新技术动态

本站涵盖的内容、图片、视频等数据,部分未能与原作者取得联系。若涉及版权问题,请及时通知我们并提供相关证明材料,我们将及时予以删除!谢谢大家的理解与支持!

Copyright © 2023