logo
  • 首页
  • 公共数据集
    • 机器学习
    • 图像识别
    • 人脸识别
    • 语音识别
    • 文本语料
    • NLP
    • 标准训练集
  • 行业数据集
    • 机器视觉
    • 医疗图像
    • 自动驾驶
    • 智能交通
    • 能源电力
    • 无人机
  • 框架与工具
    • 国产框架
    • 国外框架
    • 标注工具
    • 其他软件
  • 开放平台
    • 技术开放平台
    • 数据开放平台
    • 测试验证平台
  • 算法教程
  • 关于JSAI
登录 注册
全部 NLP 人脸识别 医疗图像 图像识别 智能交通 机器学习 机器视觉 自动驾驶 语音识别
    当前位置:
  • 首页
  • TAG:大规模
为欧洲官方语言提供网络规模并行语料库(ParaCrawl)
NLP
60

为欧洲官方语言提供网络规模并行语料库(ParaCrawl)

ParaCrawl 是一套大型平行公司,通过广泛的网络爬行工作,为所有欧盟官方语言提供往返英语的辅助。从识别带有翻译文本的网站 ...

KhanKhan
2021-08-24
NLP - fast.ai datasets
NLP
39

NLP - fast.ai datasets

Some of the most important datasets for NLP, with a focus on classification, including IMDb, AG-News, Amazon Reviews ...

KhanKhan
2021-08-24
Aristo Tuple KB
NLP
45

Aristo Tuple KB

294,000 science-relevant tuples

KhanKhan
2021-08-24
维基简历:高效人评价的连贯总结数据集
NLP
40

维基简历:高效人评价的连贯总结数据集

此数据集提供wikihow.com及其摘要中如何处理文章,这些文章以连贯的段落书写。数据集本身可在维基.zip,并包含文章,摘要, ...

KhanKhan
2021-08-24
The Multilingual Amazon Reviews Corpus
NLP
48

The Multilingual Amazon Reviews Corpus

我们介绍了一系列亚马逊评论,专门旨在帮助多语种文本分类的研究。该数据集包含 2015 年 11 月 1 日至 2019 年 11 月 1 日之 ...

KhanKhan
2021-08-24
NIH NCBI PMC 文章数据集
NLP
76

NIH NCBI PMC 文章数据集

PMC 开放访问 (OA) 子集,其中包含 PMC 中包含具有机器可读知识

KhanKhan
2021-08-24
多语种名称实体识别 (NER) 数据集与公报
NLP
38

多语种名称实体识别 (NER) 数据集与公报

名称实体识别数据集包含短句和低上下文查询,包括 LOWNER、MSQ-NER、ORCAS-NER 和公报(167 万实体)。此版本包含低上下文名 ...

KhanKhan
2021-08-24
低上下文名称实体识别 (NER) 数据集与公报
其他软件
70

低上下文名称实体识别 (NER) 数据集与公报

我们创建包含短句子和低上下文查询的 NER 数据集。其中包括从维基百科句子中提取的训练/开发/测试集(即低级)。我们还创建 ...

KhanKhan
2021-08-24
产品问题答题系统中幽默检测
NLP
37

产品问题答题系统中幽默检测

此数据集提供产品问题答题系统中标记的幽默检测。数据集包含 3 csv 文件:幽默.csv包含幽默产品问题、非幽默无偏见问题.csv ...

KhanKhan
2021-08-24
知识基础对话系统的丰富主题聊天数据集
NLP
78

知识基础对话系统的丰富主题聊天数据集

此数据集在公开发布的专题聊天数据集(https://github.com/alexa/Topical-Chat)的基础上提供额外的注释,这将有助于重现我 ...

KhanKhan
2021-08-24
1234567
Copyright 2019-2021 www.jsai.org.cn ©All Rights Reserved.版权所有。 苏ICP备20008440号-1