上海合合信息科技股份公司(以下简称:合合信息)联合华南理工大学、联想研究院共同组队,在国际模式识别大会(ICPR2020),图表信息提取(ICPR 2020-CHART-Infographics)国际竞赛中,斩获了所有七个赛道14个子任务中的11个冠军,科技底色再得印证。
ICPR 大会是模式识别领域的优异国际会议,涵盖了计算机视觉、图标、声音、机器智能等多个领域。大会吸引了来自全球56个国家和地区的科研人员和机构参与。
其中,图表信息提取竞赛在本次大会中倍受瞩目。据了解,复杂图表信息提取是人工智能领域内一个很新的研究领域,其目标是将各式各样的图表(见图1)自动的提取转化成原始的表格数据(见图2),以利于做进一步的深入分析和挖掘。由于整个任务场景复杂难度大,因此举办方将整个任务划分为6个子任务以及1个端到端任务,涵盖图表分类、图表文本识别、文本功能分类、轴分析、图例分析、图元素提取等。最终,合合信息获得了11项冠军,并完成了端到端任务。
图1 各种类型的图表数据举例
图2 图表信息提取任务最终结果可视化
合合信息相关负责人表示:“端到端任务需要整合所有的技术,是最难,但也是最有实用价值的任务,是综合实力的体现。我们所在的队伍是唯一一支完成端到端任务的团队。”
此前,合合信息已多次在国际顶尖AI竞赛中获得世界冠军,如ICDAR票据识别竞赛冠军、ICDAR表格识别竞赛冠军、ICFHR签名识别与鉴别竞赛等。以票据检测和识别技术为例,合合信息票据机器人从采集票据、智能分类、票据切分、票面信息精准识别到增值税发票一键验真,覆盖全流程,整合图像增强、OCR识别、NLP语义分析等技术,让票据识别更智能,更便捷,赋予机器人文字阅读与思考能力,实现业务流程提速,赋能企业完成自动化智能升级转型。数据显示,使用合合信息票股机器人进行票据采集,全流程可以从原先的3天减少至2小时之内完成,节约95%的时间成本。
作为一家全球领先的人工智能及大数据科技企业,合合信息致力于通过智能文字识别及商业大数据领域的核心技术、C端和B端产品以及行业解决方案为全球企业和个人用户提供创新的数字化、智能化服务。