中安在线、中安新闻客户端讯近日,科大讯飞A.I.研究院联合中科大语音及语言信息处理国家工程实验室,以显著优势获得ICFHR 2020 数学公式识别挑战赛冠军。
此次数学公式识别挑战赛由ICFHR 2020举办,除科大讯飞外,韩国三星、东京农工大学、华南理工大学、中山大学等多家常年深耕文档分析理解领域的研究机构都参与其中。
本次识别挑战赛难在哪里?据介绍,首先难在公式结构复杂,尤其是各种结构的嵌套,例如:
其次,形近字难识别,如X和x,Z和2,γ和r,例如:
再次,本次比赛添加了很多非常规符号的组合,这些容易和公式混淆,例如:
科大讯飞是如何获得冠军的?据了解,讯飞公司在数学公式识别中创造性地提出了-识别算法。针对有复杂嵌套结构关系的数学公式识别,他们提出了基于树形结构信息建模的-识别算法,通过使用树形结构信息对数学公式的符号和符号间结构关系分别进行建模,来进行数学公式识别。针对难以辨别的形近字符和非常规符号的组合,他们使用了基于LaTeX语言模型的数据增强策略,对官方提供的数据进行合理的拆分分解训练公式语言模型,并使用语言模型合成出更加合理的符合上下文关联性的数据,很大程度上缓解形近符号识别困难的问题。通过多项技术能力的综合运用,在“能看会认”上,他们不仅能识别更复杂的数学公式,还能做到“中文+数学公式”混合搭配的内容识别。
此外,他们还在ICDAR ReCTS评测任务中刷新了单字识别、文本行识别、文本行检测和端到端识别全部四项榜单世界纪录,使得产品系统在解决复杂场景下文字检测和识别的难题中更为游刃有余。数学公式识别领域的突破,对实际学生作业试卷文档的版面结构复杂、书写风格差异显著等难点问题,提供更为丰富有效的解决方案。
据科大讯飞有关负责人表示,坚守人工智能道路21年,公司不断攀越技术高峰,在智能语音、计算机视觉、自然语言理解等技术领域摘得一项又一项桂冠,但这并不是终点。下一步,还将始终秉承“顶天立地”的技术信仰,打造一件件“能听会说”“能看会认”“能理解会思考”的人工智能产品,用人工智能点亮人间烟火。(记者 顾继月)