Condensed Movies 基于情境嵌入的基于故事的检索免费

jsaifc 23 2021-08-24 语音识别

资源介绍

Condensed Movies 基于情境嵌入的基于故事的检索 (http://ds.jsai.org.cn/) 语音识别 第1张

牛津大学 VGG 组学者创建了 Condensed Movies 数据集(CMD),由 3K 多部电影中的关键场景组成:每个关键场景都附有场景的高级语义描述、人物脸部轨迹和电影的元数据。该数据集是可扩展的,从 YouTube 自动获取,任何人都可以免费下载使用。

它在电影数量上也比现有的电影数据集大一个数量级;在该数据集上提供了一个文本到视频检索的深度网络基线,将字符、语音和视觉线索结合到一个单一的视频嵌入中;同时该文还展示了如何从其他视频剪辑中添加上下文来提高检索性能。

Condensed Movies 基于情境嵌入的基于故事的检索 (http://ds.jsai.org.cn/) 语音识别 第2张

END

发表评论