THCHS30是一个开放的中文语音数据库,由清华大学语音与语言技术中心(CSLT)发布。原始记录是2002年由王冬在清华大学计算机 ...
使用手机在室内静音环境下记录了该语料库。它有10个扬声器。每个说话者大约有350种话语。所有话语都经过仔细记录,并由人工 ...
LibriTTS是一个多语种英语语料库,由Heiga Zen在Google Speech和Google Brain团队的协助下编写,以24kHz采样率大约585小时阅 ...
使用手机在室内静音环境下记录了该语料库。它具有855个扬声器。每个扬声器有120声。所有话语都经过仔细记录,并由人工检查。 ...
TIMIT阅读语音语料库旨在为语音研究以及自动语音识别系统的开发和评估提供语音数据。 TIMIT包含宽带录音,其中包括630位来自 ...
该数据集最初是针对机器学习挑战来对心跳声音进行分类的。数据是从两个来源收集的:(A)通过iStethoscope Pro iPhone应用程 ...
呼吸声音数据库,使用录音来检测呼吸系统疾病。呼吸音是呼吸健康和呼吸系统疾病的重要指标。人呼吸时发出的声音与空气流动, ...
僧伽罗语TTS 标识符: SLR30 摘要:僧伽罗语多音箱TTS语料库 类别:演讲 许可:署名 - ShareAlike 4.0国际(CC BY ...
THCHS-30 标识符:SLR18 摘要:CSLT @清华大学发布免费汉语语音语料库 类别:演讲 许可证:Apache License v.2.0 THC ...
收集撒哈拉以南非洲语言资源进行自动语音识别:Wolof案例研究。Elodie Gauthier,Laurent Besacier,Sylvie Voisin,Michael ...
摘要:免费的维吾尔语言数据库由CSLT @清华大学和新疆大学发布
TIMIT语音读取语料库旨在为声学语音研究以及自动语音识别系统的开发和评估提供语音数据。TIMIT包含由八种主要美国英语方言组 ...
AudioSet 包含了 632 类的音频类别以及 2084320 条人工标记的每段 10 秒长度的声音剪辑片段(片段来自 YouTube 视频)。音频 ...
LibriSpeech ASR corpus 是一个语音数据,包括 1000小时 的英文发音和对应文字。