LibriTTS语料库

资源介绍

LibriTTS语料库 (http://ds.jsai.org.cn/) 语音识别第1张

LibriTTS是一个多语种英语语料库，由Heiga Zen在Google Speech和Google Brain团队的协助下编写，以24kHz采样率大约585小时阅读英语语音。 LibriTTS语料库旨在用于TTS研究。它源自LibriSpeech语料库的原始资料（来自LibriVox的MP3音频文件和来自Gutenberg项目的文本文件）。下面列出了与LibriSpeech语料库的主要区别：

1、音频文件的采样率为24kHz。

2、演讲在休息时分裂。

3、原始文本和标准化文本都包括在内。

4、可以提取上下文信息（例如，相邻句子）。

排除具有明显背景噪音的讲话。有关更多信息，请参见论文“ LibriTTS：从LibriSpeech派生的语料转换为语音”，Heiga Zen，Viet Dang，Rob Clark，Yu Zhang，Ron J.Weiss，叶佳，陈志峰和Wu Yonghui ，arXiv，2019年。如果您在工作中使用LibriTTS语料库，请引用本文的开头。

The MD5 checksums of the downloads are as follows (note: not everyone will want to know this).

0c3076c1e5245bb3f0af7d82087ee207  dev-clean.tar.gz
815555d8d75995782ac3ccd7f047213d  dev-other.tar.gz
7bed3bdb047c4c197f1ad3bc412db59f  test-clean.tar.gz
ae3258249472a13b5abef2a816f733e4  test-other.tar.gz
4a8c202b78fe1bc0c47916a98f3a2ea8  train-clean-100.tar.gz
a84ef10ddade5fd25df69596a2767b2d  train-clean-360.tar.gz
7b181dd5ace343a5f38427999684aa6f  train-other-500.tar.gz

END

LibriTTS语料库免费

资源介绍

发表评论取消回复

最新文章

热门文章

THUYG-20 维吾尔语语音数据

VGG-Sound

爱数智慧中文手机录音音频语料库（Mandarin Chinese Read Speech ）

ESC环境噪音分类数据集

标签云

猜你喜欢

LibriTTS语料库免费

资源介绍

发表评论 取消回复

最新文章

热门文章

THUYG-20 维吾尔语语音数据

LibriTTS语料库

VGG-Sound

爱数智慧中文手机录音音频语料库（Mandarin Chinese Read Speech ）

ESC环境噪音分类数据集

标签云

猜你喜欢

THUYG-20 维吾尔语语音数据

VGG-Sound

爱数智慧中文手机录音音频语料库（Mandarin Chinese Read Speech ）

ESC环境噪音分类数据集

CN-Celeb

固有唤醒词数据库 HI-MIA

LibriSpeech ASR corpus 语音数据

VoxForge 语音库

呼吸声音数据集，用于检测呼吸系统疾病

THCHS-30 汉语语音识别数据

发表评论取消回复