logo
  • 首页
  • 公共数据集
    • 机器学习
    • 图像识别
    • 人脸识别
    • 语音识别
    • 文本语料
    • NLP
    • 标准训练集
  • 行业数据集
    • 机器视觉
    • 医疗图像
    • 自动驾驶
    • 智能交通
    • 能源电力
    • 无人机
  • 框架与工具
    • 国产框架
    • 国外框架
    • 标注工具
    • 其他软件
  • 开放平台
    • 技术开放平台
    • 数据开放平台
    • 测试验证平台
  • 算法教程
  • 关于JSAI
登录 注册
全部 NLP 人脸识别 医疗图像 图像识别 智能交通 机器学习 机器视觉 自动驾驶 语音识别
    当前位置:
  • 首页
  • TAG:中等规模
路透社语料库
NLP
84

路透社语料库

包含大量路透社新闻报道,主要用于研究和开发自然语言处理、信息检索和机器学习系统。在2004年秋季,NIST接管了RCV1,所以现 ...

KhanKhan
2021-08-24
Yahoo!英语维基百科的语义注释快照
NLP
85

Yahoo!英语维基百科的语义注释快照

英文维基百科从2006年11月4日开始使用一些公开的NLP工具进行处理,共1,490,688个条目(6 GB)

KhanKhan
2021-08-24
Yahoo!搜索日志与相关性判断
NLP
82

Yahoo!搜索日志与相关性判断

匿名化的Yahoo!搜索日志与相关性判断(1.3 GB)

KhanKhan
2021-08-24
Yahoo!从公开可用网页中提取元数据
NLP
117

Yahoo!从公开可用网页中提取元数据

RDF数据(2 GB)

KhanKhan
2021-08-24
Yahoo! Answers consisting of questions asked in French
NLP
83

Yahoo! Answers consisting of questions asked in French

Yahoo! Answers corpus from 2006 to 2015的子集,包含170万个法语问题以及相应的答案(3.8 GB)

KhanKhan
2021-08-24
Yahoo! Answers Comprehensive Questions and Answers
NLP
72

Yahoo! Answers Comprehensive Questions and Answers

2017年10月25日创建,包含4,483,032个问题及其答案(3.6 GB)

KhanKhan
2021-08-24
Twitter Cheng-Caverlee-Lee Scrape
NLP
38

Twitter Cheng-Caverlee-Lee Scrape

包含2009年9月至2010年1月twitter收集的基于内容的用户地理定位信息,包含115,886位Twitter用户和3,844,612个位置更新:经度 ...

KhanKhan
2021-08-24
路透社语料库
NLP
98

路透社语料库

包含大量路透社新闻报道,主要用于研究和开发自然语言处理、信息检索和机器学习系统。在2004年秋季,NIST接管了RCV1,所以现 ...

KhanKhan
2021-08-24
Open Library数据转储
NLP
45

Open Library数据转储

包含Open Library中所有记录的最新版本的转储

KhanKhan
2021-08-24
NEGRA
NLP
47

NEGRA

德语报刊文本的句法注释语料库,适用于所有大学和非营利组织,需要签署并发送表格才能获得

KhanKhan
2021-08-24
123...8
Copyright 2019-2021 www.jsai.org.cn ©All Rights Reserved.版权所有。 苏ICP备20008440号-1