您的位置  > 德语常识

德语字母音标手写体 A2iA:西方笔迹的专家

CNET科技信息网新京报2月5日讯(文/周亚):也许从1991年开始,Jean-Louis Fages就已经开始想象如何提高各行各业的工作效率——尽管现在人们打字越来越快,而且经常提笔忘记写字,还是无法避免大笔一挥的优美签名、永远看不懂的医生处方、人力资源手中堆积如山的表格和文件。 ..解决这些事情肯定需要付出很大的努力。 于是那一年,他在法国巴黎创立了科技公司A2iA。

Jean-Louis Fages,一个有着深棕色大眼睛的可爱老人,喜欢听郎朗、莫扎特、瓦格纳和肖邦的音乐,从 20 世纪 90 年代开始创新。 A2iA 是手写和印刷文本识别、信息提取和智能文档分类工具包的全球开发商。 这被认为是人工智能文本识别领域最早的浪潮。 公司三分之二是工程师,拥有7种西方语言的识别能力,业务覆盖36个国家。 该公司的一对一支票读取 (A2iA) 技术每年处理来自 1,000 家分行和银行的超过一百万张支票。

而如今,亲眼目睹西方手迹的A2iA携2015中法创新加速器(China 2015)来到中国。 “我们正在开始破解中国字迹,”让-路易斯谈到这个目标时,兴奋得像一位即将登顶的登山者。

数字化交易方式

让-路易斯谈论机器识别手写体的历史,就像谈论他院子里的果树一样。

在过去的30年里,人工智能以一种非常现代的方式快速发展,从20世纪80年代的机器人作为主要产品,到现在非常流行的人机对话。 文本识别是人机智能发展的基础关键技术。

尽管键盘输入已变得非常普遍,但全球仍有近 30 亿人在日常生活中手写。 出于安全考虑,金融机构仍然会比较和存档笔迹。 Jean-Louis 在过去 25 年所做的就是将人们从纸质数据的复杂处理中解放出来。

A2iA拥有的字符识别技术独树一帜,可以将一堆格式杂乱的手写表格转化为电子数据。 当然,过程很复杂,而且世界各地的手写书法风格差异很大。 即使它们都属于拉丁语系,但相同的含义在不同的地区有不同的表达,例如拼写顺序、重音符号、书写风格等。

Jean-Louis认为,通过数字交易方式,用户进行的数字收藏变得更加准确。 数据在发送到金融机构后台之前已经过验证。 这样就减少了手动重录的工作量。 它还减少了各方之间的数据和图像传输数量,从而从根本上改进了现代交易方式。 随着金融活动的频繁,对这项技术的需求也越来越大。

中文手写识别能否攻克难关?

德语字母音标手写体 A2iA:西方笔迹的专家

截至目前,A2iA拥有英语、法语、德语、意大利语、葡萄牙语、西班牙语和阿拉伯语等7种语言的手写识别技术。 现在的问题是汉语,尤其是笔画较多的古汉语。

让-路易斯的中国同事所熟悉的是机器阅读汉字。 一旦遇到手写体,别说机器看不懂,就是人眼都困难。

手写汉字很难被机器识别。 困难不是技术,而是文化。 识别非标准汉字需要大量的中文上下文信息的背景知识以及一定文化习惯和语言环境的积累,这对于机器来说是困难的。 “困难在于,汉字的数量远高于西文字符的数量,这需要我们修改原有的识别架构。”让-路易斯苦笑着说道。

但A2iA多年来一直在克服这样的困难。 西方语言和汉语虽然语言文字不同、结构不同,但探索语言规则的原理是相同的,很多应用发明也可以应用到汉字上。 不仅如此,Jean-Louis还聘请了一批擅长汉字机器阅读研究的中国工程师。

A2iA中文版文档识别(A2iA)计划于2016年12月推出。为了提供中文识别引擎,该公司计划首先与中国代理商合作,从中国现实生活中收集样本文档。 此次,借助中法创新加速器项目(中国2015)的便利,让-路易斯一行来到中国考察。 如果未来能够成功与阿里巴巴、联想等公司建立合作,A2iA将把50%的业务放在中国。

说到这里,这位可爱的老者脸上竟然露出了渴望之色。

每一种文字和文明都值得尊重

“我自己的经历很复杂。我的父母不是在法国出生和长大的。他们有西班牙和意大利血统。我出生在非洲,吃着阿拉伯和犹太食物长大。我一生的三分之一时间是在美国度过的状态... …”

在中国人眼中,法国是浪漫的象征,但Jean-Louis认为中国人同样浪漫——街上色彩缤纷的皮包和服装、人们多样化的生活方式、现代化的城市建筑。以前,他只去过香港和上海,这是我第一次来北京。

或许是因为长年与各种文本打交道,让-路易斯对任何国家的文化都充满了尊重。 “这是一个有趣的比较。美国是一个新国家,但现代化速度不是很快。中国很古老,但现代化速度比美国快——这令人难以置信。”

本站涵盖的内容、图片、视频等数据,部分未能与原作者取得联系。若涉及版权问题,请及时通知我们并提供相关证明材料,我们将及时予以删除!谢谢大家的理解与支持!

Copyright © 2023