logo
  • 首页
  • 公共数据集
    • 机器学习
    • 图像识别
    • 人脸识别
    • 语音识别
    • 文本语料
    • NLP
    • 标准训练集
  • 行业数据集
    • 机器视觉
    • 医疗图像
    • 自动驾驶
    • 智能交通
    • 能源电力
    • 无人机
  • 框架与工具
    • 国产框架
    • 国外框架
    • 标注工具
    • 其他软件
  • 开放平台
    • 技术开放平台
    • 数据开放平台
    • 测试验证平台
  • 算法教程
  • 关于JSAI
登录 注册
全部 NLP 人脸识别 医疗图像 图像识别 智能交通 机器学习 机器视觉 自动驾驶 语音识别
    当前位置:
  • 首页
  • TAG:大规模
Reddit评论 [Kaggle]
NLP
49

Reddit评论 [Kaggle]

[Kaggle]数据集的子集(8 GB)

KhanKhan
2021-08-24
材料安全数据表
NLP
46

材料安全数据表

230,000份材料安全数据表,包含化学成分、急救措施、储存和处理等信息(3 GB)

KhanKhan
2021-08-24
欧洲语言机器翻译
NLP
45

欧洲语言机器翻译

欧洲语言机器翻译

KhanKhan
2021-08-24
20万英语笑话文本
NLP
57

20万英语笑话文本

来源于各个地方的208,000个纯文本笑话

KhanKhan
2021-08-24
Jeopardy
NLP
62

Jeopardy

包含216,930个危险问题

KhanKhan
2021-08-24
哈佛图书馆
NLP
38

哈佛图书馆

哈佛图书馆藏书记录已超过1,200万册,包括书籍、期刊、电子资料、手稿、档案资料、乐谱、音频、视频和其他资料(4GB)

KhanKhan
2021-08-24
Freebase Quad Dump
NLP
36

Freebase Quad Dump

Freebase中所有当前事实和主张的数据转储(35 GB)

KhanKhan
2021-08-24
Freebase数据转储
NLP
31

Freebase数据转储

是一个开放的世界信息数据库,包含电影、音乐、人物、地域在内的数百个类别的数百万个主题(26GB)

KhanKhan
2021-08-24
联邦采购数据中心的联邦合同
NLP
40

联邦采购数据中心的联邦合同

来自管理联邦采购数据系统(FPDS-NG)的联邦采购数据中心(FPDC)的转储,真实性和准确性已受承诺(180 GB)

KhanKhan
2021-08-24
Event Registry
NLP
45

Event Registry

可以实时访问全球100,000个新闻源的新闻文章

KhanKhan
2021-08-24
1234...7
Copyright 2019-2021 www.jsai.org.cn ©All Rights Reserved.版权所有。 苏ICP备20008440号-1