logo
  • 首页
  • 公共数据集
    • 机器学习
    • 图像识别
    • 人脸识别
    • 语音识别
    • 文本语料
    • NLP
    • 标准训练集
  • 行业数据集
    • 机器视觉
    • 医疗图像
    • 自动驾驶
    • 智能交通
    • 能源电力
    • 无人机
  • 框架与工具
    • 国产框架
    • 国外框架
    • 标注工具
    • 其他软件
  • 开放平台
    • 技术开放平台
    • 数据开放平台
    • 测试验证平台
  • 算法教程
  • 关于JSAI
登录 注册
全部 NLP 人脸识别 医疗图像 图像识别 智能交通 机器学习 机器视觉 自动驾驶 语音识别
    当前位置:
  • 首页
  • TAG:机器翻译
Yahoo!英语维基百科的语义注释快照
NLP
85

Yahoo!英语维基百科的语义注释快照

英文维基百科从2006年11月4日开始使用一些公开的NLP工具进行处理,共1,490,688个条目(6 GB)

KhanKhan
2021-08-24
一周全球新闻馈送[Kaggle]
NLP
38

一周全球新闻馈送[Kaggle]

一周内(2017年8月24日至2017年8月30日)全球在线发布的大多新闻内容的快照,包括大约140万篇文章、20,000个新闻来源和20多 ...

KhanKhan
2021-08-24
NEGRA
NLP
47

NEGRA

德语报刊文本的句法注释语料库,适用于所有大学和非营利组织,需要签署并发送表格才能获得

KhanKhan
2021-08-24
欧洲语言机器翻译
NLP
44

欧洲语言机器翻译

欧洲语言机器翻译

KhanKhan
2021-08-24
ClueWeb11 FACC
NLP
37

ClueWeb11 FACC

带有Freebase标识符注释的ClueWeb11(92 GB)

KhanKhan
2021-08-24
ClueWeb09 FACC
NLP
44

ClueWeb09 FACC

带有Freebase注释的ClueWeb09和ClueWeb12语料库(72 GB)

KhanKhan
2021-08-24
大规模多语种图像数据集 (MMID)
NLP
55

大规模多语种图像数据集 (MMID)

MMID是一个大规模,大规模多语种的图像数据集,与它们所代表的单词在宾夕法尼亚大学收集。数据集是双重平行的:对于每种语言 ...

KhanKhan
2021-08-24
为欧洲官方语言提供网络规模并行语料库(ParaCrawl)
NLP
59

为欧洲官方语言提供网络规模并行语料库(ParaCrawl)

ParaCrawl 是一套大型平行公司,通过广泛的网络爬行工作,为所有欧盟官方语言提供往返英语的辅助。从识别带有翻译文本的网站 ...

KhanKhan
2021-08-24
圣经科珀斯
NLP
47

圣经科珀斯

由包含 102 种语言的圣经翻译创建的平行语料库file_type。

KhanKhan
2021-08-24
NCLS-科波拉
NLP
45

NCLS-科波拉

包含两个用于跨语言摘要的数据集:ZH2ensum 和 EN2ZHSUM。有370,759对英语到中文的跨语言总结(CLS)对从ENSUM和1,699,71 ...

KhanKhan
2021-08-24
12
Copyright 2019-2021 www.jsai.org.cn ©All Rights Reserved.版权所有。 苏ICP备20008440号-1