logo
  • 首页
  • 公共数据集
    • 机器学习
    • 图像识别
    • 人脸识别
    • 语音识别
    • 文本语料
    • NLP
    • 标准训练集
  • 行业数据集
    • 机器视觉
    • 医疗图像
    • 自动驾驶
    • 智能交通
    • 能源电力
    • 无人机
  • 框架与工具
    • 国产框架
    • 国外框架
    • 标注工具
    • 其他软件
  • 开放平台
    • 技术开放平台
    • 数据开放平台
    • 测试验证平台
  • 算法教程
  • 关于JSAI
登录 注册
全部 NLP 人脸识别 医疗图像 图像识别 智能交通 机器学习 机器视觉 自动驾驶 语音识别
    当前位置:
  • 首页
  • TAG:中等规模
GigaOM WordPress Challenge [Kaggle]
NLP
45

GigaOM WordPress Challenge [Kaggle]

预测有人会喜欢哪些博客文章。包含博客文章、元数据、用户喜欢情况等信息(1.5 GB)

KhanKhan
2021-08-24
垃圾邮件/标题党新闻数据集[Kaggle]
NLP
80

垃圾邮件/标题党新闻数据集[Kaggle]

新闻网站The Examiner上的新闻汇编,包含超过6年的21000多位作者撰写的300万篇文章的标题(200 MB)

KhanKhan
2021-08-24
Del.icio.us
NLP
43

Del.icio.us

包含delicious.com上的125万个书签(170 MB)

KhanKhan
2021-08-24
CSI语料库
NLP
32

CSI语料库

荷兰语,该语料库包含两种类型的学生文本:作文和评论。涉及作者(性别、年龄、性取向、来源地区、性格概况)和文档(时间、 ...

KhanKhan
2021-08-24
Apache Software Foundation公共邮件存档
NLP
35

Apache Software Foundation公共邮件存档

截至2011年7月11日所有公开可用的Apache Software Foundation邮件存档(200 GB)

KhanKhan
2021-08-24
Google Books Ngrams
其他软件
73

Google Books Ngrams

N-grams are fixed size tuples of items. In this case the items are words extracted from the Google Books corpus. The ...

KhanKhan
2021-08-24
AI2 TabMCQ: Multiple Choice Questions aligned with the Aristo Tablestore
NLP
81

AI2 TabMCQ: Multiple Choice Questions aligned with the Aristo Tablestore

9092个科学问题和68个精选事实表

KhanKhan
2021-08-24
VoiSeR
NLP
66

VoiSeR

基于语音的产品搜索改进

KhanKhan
2021-08-24
Reasoning Over Paragraph Effects in Situations (ROPES)
NLP
58

Reasoning Over Paragraph Effects in Situations (ROPES)

14k QA pairs over 1.7K paragraphs, split between train (10k QAs), development (1.6k QAs) and a hidden test partition ...

KhanKhan
2021-08-24
Quoref
NLP
70

Quoref

24K Question/Answer (QA) pairs over 4.7K paragraphs, split between train (19K QAs), development (2.4K QAs) and a hid ...

KhanKhan
2021-08-24
1234...8
Copyright 2019-2021 www.jsai.org.cn ©All Rights Reserved.版权所有。 苏ICP备20008440号-1