logo
  • 首页
  • 公共数据集
    • 机器学习
    • 图像识别
    • 人脸识别
    • 语音识别
    • 文本语料
    • NLP
    • 标准训练集
  • 行业数据集
    • 机器视觉
    • 医疗图像
    • 自动驾驶
    • 智能交通
    • 能源电力
    • 无人机
  • 框架与工具
    • 国产框架
    • 国外框架
    • 标注工具
    • 其他软件
  • 开放平台
    • 技术开放平台
    • 数据开放平台
    • 测试验证平台
  • 算法教程
  • 关于JSAI
登录 注册
全部 NLP 人脸识别 医疗图像 图像识别 智能交通 机器学习 机器视觉 自动驾驶 语音识别
    当前位置:
  • 首页
  • TAG:NLG
Event Registry
NLP
45

Event Registry

可以实时访问全球100,000个新闻源的新闻文章

KhanKhan
2021-08-24
Enron电子邮件集
NLP
50

Enron电子邮件集

包含1,227,255封电子邮件,其中493,384份附件覆盖了151名托管人。该电子邮件的格式为Microsoft PST、IETF MIME和EDRM XML(2 ...

KhanKhan
2021-08-24
Death Row
NLP
52

Death Row

包含美国德州自1984年以来每个执行死刑罪犯的遗言(HTML表格)

KhanKhan
2021-08-24
DBpedia
NLP
51

DBpedia

包含从维基百科中提取出的结构化信息,包括312,000个人、413,000个地点、94,000张音乐专辑、49,000部电影、15,000种电子游戏 ...

KhanKhan
2021-08-24
crosswikis
NLP
47

crosswikis

英语短语相关的维基百科文章数据库、论文(11 GB)

KhanKhan
2021-08-24
ASAP自动短文评分[Kaggle]
NLP
41

ASAP自动短文评分[Kaggle]

共八个作文集,每一集作文都围绕一个主题展开。短文的平均长度为150到550个字。一些文章依赖于主题信息,另一些则是自由发挥 ...

KhanKhan
2021-08-24
博客作者身份语料库
NLP
75

博客作者身份语料库

由2004年8月从blogger.com收集的19,320位博主的文章组成,共计681,288篇,字数超过1.4亿——平均每人35篇、7250字(298 MB)

KhanKhan
2021-08-24
AI2 Tablestore (November 2015 Snapshot)
NLP
32

AI2 Tablestore (November 2015 Snapshot)

68 tables of curated facts

KhanKhan
2021-08-24
维基简历:高效人评价的连贯总结数据集
NLP
40

维基简历:高效人评价的连贯总结数据集

此数据集提供wikihow.com及其摘要中如何处理文章,这些文章以连贯的段落书写。数据集本身可在维基.zip,并包含文章,摘要, ...

KhanKhan
2021-08-24
The Multilingual Amazon Reviews Corpus
NLP
48

The Multilingual Amazon Reviews Corpus

我们介绍了一系列亚马逊评论,专门旨在帮助多语种文本分类的研究。该数据集包含 2015 年 11 月 1 日至 2019 年 11 月 1 日之 ...

KhanKhan
2021-08-24
123
Copyright 2019-2021 www.jsai.org.cn ©All Rights Reserved.版权所有。 苏ICP备20008440号-1