Caltech 加州理工学院行人数据集免费

jsaijsq 29 2021-08-24 自动驾驶

资源介绍

Caltech 加州理工学院行人数据集 (http://ds.jsai.org.cn/) 自动驾驶 第1张

加州理工学院行人数据集包括大约10小时的640x480 30Hz视频,这些视频来自在城市环境中通过常规交通的车辆。大约250,000个框架(137个近似分钟的长段)共有350,000个边界框和2300个独特的行人被注释。注释包括边界框和详细遮挡标签之间的时间对应。更多信息可以在我们的PAMI 2012和CVPR 2009基准测试文件中找到。

数据结构

  • 加州理工学院行人数据集。训练数据(set00-set05)由六个训练集(每个约1GB)组成,每个训练集有6-13个一分钟长的seq文件,以及所有注释信息(详见论文)。测试数据(set06-set10)由五组组成,每组约1GB。新增:现在还提供了整个数据集的注释。还提供包含所有评估算法的检测结果的输出文件。
  • Seq视频格式。seq文件是一系列具有固定大小标题的连接图像帧。用于读/写/操作seq文件的matlab例程可以在 Piotr的Matlab工具箱中找到(需要3.20或更高版本)。这些例程还可用于将seq文件提取到图像目录。
  • Matlab评估/标签代码(3.2.1)。注释使用自定义的“视频边界框”(vbb)文件格式。该代码还包含用于查看覆盖注释的seq文件的实用程序,用于生成本文中所有ROC图的评估例程,以及用于创建数据集的vbb标记工具(另请参见此有点过时的视频教程)。
  • 标准格式的其他数据集。为方便起见,我们发布了seq / vbb格式的完整图像/注释以及许多其他数据集上所有评估算法的检测结果。这有助于对这些附加数据集的训练/测试以及所有ROC曲线的精确再现。原作者仍享有完整版权,请参阅相应网站以获取更多信息,包括如何引用这些数据集的评估结果。INRIA行人数据集[已转换 ], ETH行人数据集 [已转换 ], TUD-布鲁塞尔行人数据集 [已转换 ],戴姆勒行人数据集 [转换 ]。

基准测试结果

算法细节和参考 | 算法运行时与性能

有关评估方案的详细信息,请参阅我们的PAMI 2012论文。
注意:自我们的CVPR 2009论文以来,评估方案已经发展。
注意:我们每个绘图最多渲染15个最佳结果(但始终包括VJ和HOG基线)。

  1. 加州理工学院行人测试数据集:我们提供两组结果:50像素或更高,未被遮挡或部分遮挡的行人(合理),以及更详细的性能细分,如文中所述(详细)。
  2. 加州理工学院行人培训数据集:加州理工学院培训数据的结果:合理,详细。
  3. 加州理工学院行人日本数据集:类似于加州理工学院行人数据集(无论是幅度还是注释),视频都是在日本收集的。我们无法发布这些数据,但是,我们将对结果进行基准测试,以对各种检测器进行二次评估。结果:合理,详细。
  4. INRIA行人测试数据集:INRIA Pedestrian数据集的全图像结果(评估详情)。
  5. ETH行人数据集:ETH行人数据集的结果(评估详情)。
  6. TUD-Brussels Pedestrian Dataset:TUD-Brussels Pedestrian数据集的结果(评估详情)。
  7. 戴姆勒行人数据集:戴姆勒行人数据集的结果(评估详情)。

提交结果

请联系我们,将您的探测器结果包含在本网站上。我们从第30帧开始每隔30帧进行一次评估。对于每个视频,每个帧的结果应该是一个文本文件,命名如下:“I00029.txt,I00059.txt,...”。每个文本文件应包含每个检测到的边界框1行,格式为“[left,top,width,height,score]”。如果未找到任何检测项,则文本文件应为空(但必须仍然存在)。目录结构应该模仿包含视频的目录结构:“set00 / V000,set00 / V001 ......”。如果上面的描述不清楚,请参阅评估算法的输出文件(可从下载部分获得)。请注意,在评估期间,给定视频的所有检测都连接成一个文本文件,

相关数据集

下面我们列出其他行人数据集,大致按照与Caltech Pedestrian数据集的相关性和相似性的顺序。可以在本文中找到数据集(前两个除外)的更详细比较。

  • GM-ATCI:从鱼眼镜头相机拍摄的后视行人数据集。
  • 戴姆勒:还在城市环境中捕获,更新旧的戴姆勒克莱斯勒数据集。包含跟踪信息和大量标记的边界框。
  • NICTA:在多个城市/国家收集的大规模城市数据集。没有运动/跟踪信息,但有大量独特的行人。
  • ETH:从安装在婴儿车上的立体装置捕获的城市数据集。
  • TUD-Brussels:在拥挤的城市环境中使用车载摄像头记录图像对的数据集。
  • INRIA:目前最受欢迎的静态行人检测数据集之一。
  • PASCAL:具有不同对象视图和姿势的静态对象数据集。
  • CVC-ADAS:行人数据集的集合,包括在船上获得的行人视频,虚拟世界的行人(带有部分注释)和被遮挡的行人。
  • 南加州大学:一些相当小的行人数据集主要来自监控视频。
  • 麻省理工学院:第一个行人数据集之一,相当小,相对较好地解决了这一点。

END

发表评论