为欧洲官方语言提供网络规模并行语料库(ParaCrawl)免费

Khan 34 2021-08-24 NLP

资源介绍

ParaCrawl 是一套大型平行公司,通过广泛的网络爬行工作,为所有欧盟官方语言提供往返英语的辅助。从识别带有翻译文本的网站,到收集、清洁和交付作为 CEF 培训数据的并行公司,整个处理链都采用了最先进的方法。DG 翻译的 AT 和翻译记忆。

END

发表评论

猜你喜欢