TIMIT 语料库 - 数据集市

资源介绍

TIMIT 语料库 (http://ds.jsai.org.cn/) 语音识别第1张

TIMIT（英语：The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus），是由德州仪器、麻省理工学院和SRI International合作构建的声学－音素连续语音语料库。TIMIT数据集的语音采样频率为16kHz，一共包含6300个句子，由来自美国八个主要方言地区的630个人每人说出给定的10个句子，所有的句子都在音素级别（phone level）上进行了手动分割，标记。

70%的说话人是男性；大多数说话者是成年白人。

TIMIT语料库多年来已经成为语音识别社区的一个标准数据库，在今天仍被广为使用。其原因主要有两个方面：数据集中的每一个句子都在音素级别上进行了手动标记，同时提供了说话人的编号，性别，方言种类等多种信息；数据集相对来说比较小，可以在较短的时间内完成整个实验；同时又足以展现系统的性能。

END

TIMIT 语料库免费

资源介绍

发表评论取消回复

最新文章

热门文章

THUYG-20 维吾尔语语音数据

VGG-Sound

ESC环境噪音分类数据集

LibriTTS语料库

CN-Celeb

标签云

猜你喜欢

TIMIT 语料库免费

资源介绍

发表评论 取消回复

最新文章

热门文章

THUYG-20 维吾尔语语音数据

VGG-Sound

ESC环境噪音分类数据集

LibriTTS语料库

CN-Celeb

标签云

猜你喜欢

THUYG-20 维吾尔语语音数据

VGG-Sound

ESC环境噪音分类数据集

LibriTTS语料库

CN-Celeb

叠置密集去噪-分割合成标注

AISHELL-1 开源中文语音数据库

呼吸声音数据集，用于检测呼吸系统疾病

THCHS30 中文语音数据集

Google Audioset 音频数据集

发表评论取消回复