济州岛数据集用于机器翻译和语音合成免费

Khan 73 2021-08-24 NLP

资源介绍

济州岛于2010年被联合国教科文组织列为极度濒危物种。虽然为振兴它作出了各种努力,但几乎没有计算方法。受此激励,我们构建了两个新的济州数据集:济州采访记录 (JIT) 和济州单身演讲者演讲 (JSS)。JIT数据集是包含 17 万以上济州韩语句的平行语料库,JSS数据集由 10k 由土生土长的济州语者录制的高质量音频文件和成绩单文件组成。随后,我们使用它们构建机器翻译和语音合成的神经系统。所有资源均可通过我们的 GitHub 存储库公开提供。我们希望这些数据集将吸引语言和机器学习社区的兴趣。

END

发表评论

猜你喜欢