logo
  • 首页
  • 公共数据集
    • 机器学习
    • 图像识别
    • 人脸识别
    • 语音识别
    • 文本语料
    • NLP
    • 标准训练集
  • 行业数据集
    • 机器视觉
    • 医疗图像
    • 自动驾驶
    • 智能交通
    • 能源电力
    • 无人机
  • 框架与工具
    • 国产框架
    • 国外框架
    • 标注工具
    • 其他软件
  • 开放平台
    • 技术开放平台
    • 数据开放平台
    • 测试验证平台
  • 算法教程
  • 关于JSAI
登录 注册
全部 NLP 人脸识别 医疗图像 图像识别 智能交通 机器学习 机器视觉 自动驾驶 语音识别
    当前位置:
  • 首页
  • TAG:大规模
Enron电子邮件集
NLP
50

Enron电子邮件集

包含1,227,255封电子邮件,其中493,384份附件覆盖了151名托管人。该电子邮件的格式为Microsoft PST、IETF MIME和EDRM XML(2 ...

KhanKhan
2021-08-24
Death Row
NLP
52

Death Row

包含美国德州自1984年以来每个执行死刑罪犯的遗言(HTML表格)

KhanKhan
2021-08-24
DBpedia
NLP
51

DBpedia

包含从维基百科中提取出的结构化信息,包括312,000个人、413,000个地点、94,000张音乐专辑、49,000部电影、15,000种电子游戏 ...

KhanKhan
2021-08-24
crosswikis
NLP
47

crosswikis

英语短语相关的维基百科文章数据库、论文(11 GB)

KhanKhan
2021-08-24
康奈尔电影对话语料库(Cornell Movie Dialog Corpus)
NLP
55

康奈尔电影对话语料库(Cornell Movie Dialog Corpus)

包含从原始电影脚本中提取的虚构对话集:10,292对电影角色之间的220,579次会话交流、涉及617部电影中的9,035个字符,共304,7 ...

KhanKhan
2021-08-24
ClueWeb11 FACC
NLP
38

ClueWeb11 FACC

带有Freebase标识符注释的ClueWeb11(92 GB)

KhanKhan
2021-08-24
ClueWeb09 FACC
NLP
45

ClueWeb09 FACC

带有Freebase注释的ClueWeb09和ClueWeb12语料库(72 GB)

KhanKhan
2021-08-24
亚马逊食品评论[Kaggle]
NLP
100

亚马逊食品评论[Kaggle]

数据跨越10年以上,包括截至2012年10月的568,454条评论。内容包括产品、用户信息、评分以及纯文本评论(240 MB)

KhanKhan
2021-08-24
博客作者身份语料库
NLP
75

博客作者身份语料库

由2004年8月从blogger.com收集的19,320位博主的文章组成,共计681,288篇,字数超过1.4亿——平均每人35篇、7250字(298 MB)

KhanKhan
2021-08-24
大规模多语种图像数据集 (MMID)
NLP
56

大规模多语种图像数据集 (MMID)

MMID是一个大规模,大规模多语种的图像数据集,与它们所代表的单词在宾夕法尼亚大学收集。数据集是双重平行的:对于每种语言 ...

KhanKhan
2021-08-24
12345...7
Copyright 2019-2021 www.jsai.org.cn ©All Rights Reserved.版权所有。 苏ICP备20008440号-1