logo
  • 首页
  • 公共数据集
    • 机器学习
    • 图像识别
    • 人脸识别
    • 语音识别
    • 文本语料
    • NLP
    • 标准训练集
  • 行业数据集
    • 机器视觉
    • 医疗图像
    • 自动驾驶
    • 智能交通
    • 能源电力
    • 无人机
  • 框架与工具
    • 国产框架
    • 国外框架
    • 标注工具
    • 其他软件
  • 开放平台
    • 技术开放平台
    • 数据开放平台
    • 测试验证平台
  • 算法教程
  • 关于JSAI
登录 注册
全部 NLP 人脸识别 医疗图像 图像识别 智能交通 机器学习 机器视觉 自动驾驶 语音识别
    当前位置:
  • 首页
  • TAG:NLP
路透社语料库
NLP
105

路透社语料库

包含大量路透社新闻报道,主要用于研究和开发自然语言处理、信息检索和机器学习系统。在2004年秋季,NIST接管了RCV1,所以现 ...

KhanKhan
2021-08-24
Yahoo! N-Grams 2.0
NLP
139

Yahoo! N-Grams 2.0

n-gram(n = 1至5),从1260多个面向新闻的站点中检索到的1460万个文档(1.26亿条独特语句,34亿个运行词)(12 GB)

KhanKhan
2021-08-24
Yahoo! N-Gram Representations
NLP
45

Yahoo! N-Gram Representations

包含n-gram表示形式,这些数据可以作为查询重写任务的测试平台,这是IR研究中的一个常见问题,也是NLP研究中常见的单词和句 ...

KhanKhan
2021-08-24
路透社语料库
NLP
122

路透社语料库

包含大量路透社新闻报道,主要用于研究和开发自然语言处理、信息检索和机器学习系统。在2004年秋季,NIST接管了RCV1,所以现 ...

KhanKhan
2021-08-24
Reddit评论 [Kaggle]
NLP
52

Reddit评论 [Kaggle]

[Kaggle]数据集的子集(8 GB)

KhanKhan
2021-08-24
Open Library数据转储
NLP
57

Open Library数据转储

包含Open Library中所有记录的最新版本的转储

KhanKhan
2021-08-24
NIPS2015 [Kaggle]
NLP
131

NIPS2015 [Kaggle]

所有NIPS2015论文全文

KhanKhan
2021-08-24
哈佛图书馆
NLP
43

哈佛图书馆

哈佛图书馆藏书记录已超过1,200万册,包括书籍、期刊、电子资料、手稿、档案资料、乐谱、音频、视频和其他资料(4GB)

KhanKhan
2021-08-24
Freebase Quad Dump
NLP
40

Freebase Quad Dump

Freebase中所有当前事实和主张的数据转储(35 GB)

KhanKhan
2021-08-24
Freebase数据转储
NLP
34

Freebase数据转储

是一个开放的世界信息数据库,包含电影、音乐、人物、地域在内的数百个类别的数百万个主题(26GB)

KhanKhan
2021-08-24
123
Copyright 2019-2021 www.jsai.org.cn ©All Rights Reserved.版权所有。 苏ICP备20008440号-1