任意弯曲文本OCR数据集(ArT 2019)免费

JSAI 16 2021-08-24 机器视觉

资源介绍

任意弯曲文本OCR数据集(ArT 2019) (http://ds.jsai.org.cn/) 机器视觉 第1张

ArT是Total Text、SCUT-CTW1500和Baidu Curve Scene Text的组合,收集这些文本的目的是将任意形状的文本问题引入Scene Text社区。

在现有3055张图像的基础之上,将超过7111张图像添加到两个数据集的混合中,这使ArT成为当今规模更大的场景文本数据集之一。ArT数据集中共有10,166张图像。它分为带有5603个图像的训练集和包含4563个新收集的图像的测试集。考虑到ArT数据集的收集时考虑到了文字形状的多样性,因此所有现有的文字形状(即水平,多向和弯曲)在数据集中都存在很多,这使其成为唯一的数据集,因为大多数现有数据集仅由水平和多向文本实例主导。

ArT数据集中的文本实例带有(a)四边形边界框,8、10和12顶点多边形边界框(在Tasks选项卡中有更多详细信息)和(b)转录注释。这两个注释均满足(a)文本检测,(b)识别和(c)此挑战提出的文本发现任务。

数据下载需要进行注册。 https://rrc.cvc.uab.es/?ch=14&com=downloads

END

发表评论