LibriTTS语料库免费

jsaifc 30 2021-08-24 语音识别

资源介绍

LibriTTS语料库 (http://ds.jsai.org.cn/) 语音识别 第1张

LibriTTS是一个多语种英语语料库,由Heiga Zen在Google Speech和Google Brain团队的协助下编写,以24kHz采样率大约585小时阅读英语语音。 LibriTTS语料库旨在用于TTS研究。它源自LibriSpeech语料库的原始资料(来自LibriVox的MP3音频文件和来自Gutenberg项目的文本文件)。下面列出了与LibriSpeech语料库的主要区别:

1、音频文件的采样率为24kHz。

2、 演讲在休息时分裂。

3、原始文本和标准化文本都包括在内。

4、可以提取上下文信息(例如,相邻句子)。

排除具有明显背景噪音的讲话。 有关更多信息,请参见论文“ LibriTTS:从LibriSpeech派生的语料转换为语音”,Heiga Zen,Viet Dang,Rob Clark,Yu Zhang,Ron J.Weiss,叶佳,陈志峰和Wu Yonghui ,arXiv,2019年。如果您在工作中使用LibriTTS语料库,请引用本文的开头。

The MD5 checksums of the downloads are as follows (note: not everyone will want to know this).

0c3076c1e5245bb3f0af7d82087ee207  dev-clean.tar.gz
815555d8d75995782ac3ccd7f047213d  dev-other.tar.gz
7bed3bdb047c4c197f1ad3bc412db59f  test-clean.tar.gz
ae3258249472a13b5abef2a816f733e4  test-other.tar.gz
4a8c202b78fe1bc0c47916a98f3a2ea8  train-clean-100.tar.gz
a84ef10ddade5fd25df69596a2767b2d  train-clean-360.tar.gz
7b181dd5ace343a5f38427999684aa6f  train-other-500.tar.gz

END

发表评论