人工智能

阿凡题科研成果入选全球计算机视觉顶级会议CVPR2019

阿凡题研究院关于拍搜文本图像识别的论文被CVPR2019录用,在国内教育行业处于领先地位。

2019年06月17日
  • 人工智能

全球计算机视觉与模式识别顶级会议IEEE CVPR 2019(IEEE Conference on Computer Vision and Pattern Recognition) 即将于6月16日-20日在美国长滩召开。阿凡题研究院关于拍搜文本图像识别的论文被CVPR2019录用,在国内教育行业处于领先地位。CVPR是中国计算机学会推荐的人工智能领域A类会议。根据 Google Scholar 给出的刊物影响力统计,CVPR以H指数188,在所有计算机类刊物中排第1位。

CVPR作为行业最顶级的研究型会议,每年被收录的论文均来自计算机视觉领域顶级团队,代表着国际最前沿的科研技术,并指引着计算机视觉领域未来的研究方向。本届CVPR总共录取来自全球顶级学术论文1299篇,录取率仅为25%。这些录取的最新科研成果,涵盖了计算机视觉领域各项前沿工作。阿凡题论文继2018年、2019年连续两年入选国际顶级人工智能会议AAAI以后,今年又入选CVPR,可见其在人工智能方面成绩斐然。

(论文题目: Sequence-to-Sequence Domain Apdatation Network for Robust Text Image Recognition, 面向鲁棒文字图像识别的序列到序列领域自适应网络,

团队:中国科学院自动化研究所、阿凡题研究院、电子科技大学

作者:张亚萍、聂帅、刘文举、徐行、张东祥、申恒涛)

作为智能教育领域的引领者,阿凡题研究院和其合作高校中科院自动化所以及电子科技大学,聚焦拍照搜题中文字图像识别的核心技术,首次提出了多领域文字图像自适应识别的问题,并提出了一种基于序列到序列的领域自适应的鲁棒文字图像识别算法,已集成到拍搜产品中,能够保证多种拍搜场景文字识别的精度。全球领先的科研成果,展现了阿凡题在文字图像识别这一基础视觉研究领域雄厚的科技实力、人才储备和创新能力。

时至今日,拍照搜题所涵盖的以上功能已经成为中小学生日常学习中必不可少的提高学习效率的帮手。不会的题目随手拍照上传就能立刻呈现答案和解题思路,同时还能提示相关考点、提供同类题型练习,如果孩子依旧不能理解,可以连线在线老师,进行1对1在线讲解。实现拍照搜题的关键——文字图像识别技术,作为经典的计算机视觉问题,随着大数据、深度学习、人工智能的快速发展,该技术也有长足的发展。但拍照搜题中的文字图像识别则有更高的要求,不同拍搜场景的差异性,如不同拍照效果、学科内容、不同风格的印刷体或手写体、中英文混合等,对文字图像识别算法的适应性和鲁棒性提出了极高的要求。

阿凡题此次被收录的论文涵盖拍照搜题场景下的文字图像识别、首次引入基于序列的领域自适应深度神经网络来实现鲁棒文字图像识别、刷新标准评测集记录等热门及前沿技术。这些新颖的计算机视觉算法不仅有着丰富的应用场景,使得更多的计算机视觉算法能应用于教学场景之中,还为后续研究提供了可贵的经验和方向。

目前,阿凡题研究院CVPR2019录取论文在文字图像识别领域取得的创新性突破,已被应用于阿凡题现有AI教学产品中,同时对未来产品研发提供有力的技术支撑。

关于阿凡题研究院:

阿凡题研究院由国家“千人计划”专家申恒涛担任院长,新加坡国立大学高级研究员张东祥担任副院长。研究院成员多来自耶鲁大学、新加坡国立大学、北京大学、日本九州大学等国际知名学府,且80%以上拥有博士学位,他们将人工智能赋能教育,在拍照搜题、学情诊断、个性化学习、教育信息化和自动阅卷等核心教育场景均取得瞩目的成绩。

经过多年的探索与研究,阿凡题研究院已经完成包含1亿道题目的智能题库的构建工作,并在此基础上构建AI-as-a-Service服务平台,向诸如金太阳书业、全品学堂、华东师范大学出版社、曲一线等行业众多龙头教辅企业提供题目OCR、智能知识点标签和自动批改等功能模块。