链接:https://msropendata.com/datasets/170e4141-d77d-44db-966b-4cb96c00bd47
GeNeVA 任务包括一个叙述者,为绘画者提供一系列语言指令,以达到图像生成的最终目标。
这是用于人类动作检测实验的数据集。它由我们录制的许多视频序列组成
我们介绍了一种机器学习的方法去上色,从不完整的彩色滤光片阵列样本重建彩色图像。
这个新的数据集提供了前所未有的传感器记录数量(总共405个),包括部署在24个单独的身体部位上的多个IMU和红外(IR)传感器。
在剑桥的微软研究院,我们正在开发新的机器视觉算法,用于自动识别和分割许多不同的对象类别。我们对有监督和无监 ...
MIT-IBM Watson AI Lab 就推出了一个全新的百万规模视频理解数据集Moments-in-Time虽然没有之前的YouTube-8M数据集大,但应 ...
Paper Title: "End-to-End Chinese Landscape Painting Creation Using Generative Adversarial Networks" ArXiv: https://a ...
教机器理解视频中的人的行为是计算机视觉中的一个基本研究问题,谷歌blog发布了一个堪比“视频版”ImageNet的数据集-AVA(A Fi ...
视频来源于YouTube,一共有600个类别,每个类别至少600个视频以上,每段视频持续10秒左右。类别主要分为三大类:人与物互动 ...
Description CUHK Face Sketch FERET Database (CUFSF) is for research on face sketch synthesis and face sketch recogn ...
CUHK Face Sketch database (CUFS) is for research on face sketch synthesis and face sketch recognition. It includes 1 ...
CoPhIR Dataset 是由 Flickr 中采集的约 1.06 亿个图像构成的数据集,主要用于图像分类,其中图像不仅包含位置、标题、标签 ...
此数据集提供了一个基准传输学习算法的平台,特别是属性基础分类和**零镜头学习[1]。它可以作为原始动物的属性*(AwA)*数据 ...
JAAD is a dataset for studying joint attention in the context of autonomous driving. The focus is on pedestrian and ...
Sayanan Sivaraman and Mohan M. Trivedi, "A General Active Learning Framework for On-road Vehicle Recognition and Tra ...
MERL 购物数据集由 106 个视频组成,每个视频的序列大约为 2 分钟。这些视频来自一个固定的头顶摄像头,向下看人们在杂货店 ...
英文原文介绍 Pushing by big data and deep convolutional neural network (CNN), the performance of face recognition ...
当前的视频数据库包含六种类型的人类动作(步行,慢跑,奔跑,拳击,挥手和拍手),由25个对象在四种不同情况下执行了几次: ...
包含 60个 动物玩偶的 5000张 不同角度图像,每个玩偶约 72个 角度连续拍摄的照片图像,可用于物体3D、图像识别等任务。