人类语音的大规模视听数据集 (VoxCeleb)免费

jsaifc 14 2021-08-24 语音识别

资源介绍

人类语音的大规模视听数据集 (VoxCeleb) (http://ds.jsai.org.cn/) 语音识别 第1张

VoxCeleb, 是一个大型人声识别数据集。它包含来自 YouTube 视频的 1251 位名人的约 10 万段语音。数据基本上是性别平衡的(男性占 55%)。这些名人有不同的口音、职业和年龄。开发集和测试集之间没有重叠。对大明星所说的话进行分类并识别——这是一项有趣的工作。

该数据集有2个子集: VoxCeleb1 和 VoxCeleb2

END

发表评论