清华大学电子系彭课题组荣获“2017国际文献分析与识别大会清华大学新闻网”阿拉伯文视频文本检测与识别大赛

清华大学电子系彭课题组荣获2017年国际文档分析与识别大会阿拉伯语视频文本检测与识别竞赛

清华大学电子系彭课题组荣获“2017国际文献分析与识别大会清华大学新闻网”阿拉伯文视频文本检测与识别大赛

清华新闻网11月20日电最近,在日本京都举行的第14届国际文档分析与识别大会上,首届阿拉伯语视频文本检测与识别竞赛的结果揭晓。清华大学电子工程系媒体大数据认知计算研究中心彭副教授在文本检测的7个子任务中均获得冠军,在文本识别的7个子任务中有3个子任务获得第一名。

清华大学电子系彭课题组荣获“2017国际文献分析与识别大会清华大学新闻网”阿拉伯文视频文本检测与识别大赛

竞赛组织者向获胜者颁奖。右二位是彭副教授,右三位是彭课题组的博士生严瑞琪。

清华大学电子系彭课题组荣获“2017国际文献分析与识别大会清华大学新闻网”阿拉伯文视频文本检测与识别大赛

国际文档分析与识别会议是自1993年以来由国际模式识别学会主办的字符识别领域最重要的国际学术会议。近年来,由于阿拉伯视频文本识别逐渐成为文本识别领域的研究热点之一,2017年国际文档分析与识别会议首次举办了“多分辨率视频帧中的阿拉伯文本检测与识别”竞赛。比赛由瑞士弗莱堡大学主办,包括两项任务:文本检测和文本识别。比赛中使用的视频样本涵盖了不同字体、文本大小、前景色和背景复杂度的变化。参与者包括清华大学、自动化研究所、中国科学院和旧金山大学大学和学术机构。

阿拉伯视频文本检测获奖证书。

阿拉伯视频文本识别获奖证书。

彭课题组提交的词条算法是一种新开发的基于深度学习的视频文本检测与识别方法。其中,视频文本检测算法基于卷积神经网络,视频文本识别算法基于循环神经网络。参与算法研究的学生有闫瑞帅、向东来、王雅琪、王学成、陈立人和郭家明。相关研究工作得到了973项目“面向三元空间的网络中文信息处理理论与方法”的支持。2014CB340506)和国家自然科学基金项目“多语言摄影文档中图像识别的理论和方法”(项目编号U1636124)。

彭课题组所属的电子工程系智能图形信息处理实验室,在多语言字符识别、人脸识别和视频监控等领域有着长期而深厚的研究基础。 德甲足球联赛网