Condensed Movies 基于情境嵌入的基于故事的检索免费

jsaifc 159 2021-08-24 语音识别

资源介绍

Condensed Movies 基于情境嵌入的基于故事的检索 (http://ds.jsai.org.cn/) 语音识别第1张

牛津大学 VGG 组学者创建了 Condensed Movies 数据集（CMD），由 3K 多部电影中的关键场景组成：每个关键场景都附有场景的高级语义描述、人物脸部轨迹和电影的元数据。该数据集是可扩展的，从 YouTube 自动获取，任何人都可以免费下载使用。

它在电影数量上也比现有的电影数据集大一个数量级；在该数据集上提供了一个文本到视频检索的深度网络基线，将字符、语音和视觉线索结合到一个单一的视频嵌入中；同时该文还展示了如何从其他视频剪辑中添加上下文来提高检索性能。

Condensed Movies 基于情境嵌入的基于故事的检索 (http://ds.jsai.org.cn/) 语音识别第2张

END

上一篇 VOCA 捕捉，学习和综合3D语音样式数据集

下一篇基于3601投影和环形伪影的叠片密集去噪分割FBP合成重建

发表评论取消回复

请先登录账户再评论哦

猜你喜欢