logo
  • 首页
  • 公共数据集
    • 机器学习
    • 图像识别
    • 人脸识别
    • 语音识别
    • 文本语料
    • NLP
    • 标准训练集
  • 行业数据集
    • 机器视觉
    • 医疗图像
    • 自动驾驶
    • 智能交通
    • 能源电力
    • 无人机
  • 框架与工具
    • 国产框架
    • 国外框架
    • 标注工具
    • 其他软件
  • 开放平台
    • 技术开放平台
    • 数据开放平台
    • 测试验证平台
  • 算法教程
  • 关于JSAI
登录 注册
全部 NLP 人脸识别 医疗图像 图像识别 智能交通 机器学习 机器视觉 自动驾驶 语音识别
    当前位置:
  • 首页
  • TAG:NLG
YouTube视频简介
NLP
45

YouTube视频简介

170万个YouTube视频的简介

KhanKhan
2021-08-24
WestburyLab USENET语料库
NLP
74

WestburyLab USENET语料库

2005—2010年47,860篇英语新闻的匿名汇总,文章长度在500字和500,000字之间,英文单词占比高达90%(40 GB)

KhanKhan
2021-08-24
Reddit推荐帖语料库
其他软件
98

Reddit推荐帖语料库

从2006年1月至2015年8月31日所有公开可用的Reddit推荐帖(42 GB)

KhanKhan
2021-08-24
一周全球新闻馈送[Kaggle]
NLP
38

一周全球新闻馈送[Kaggle]

一周内(2017年8月24日至2017年8月30日)全球在线发布的大多新闻内容的快照,包括大约140万篇文章、20,000个新闻来源和20多 ...

KhanKhan
2021-08-24
NYTimes Facebook数据
NLP
87

NYTimes Facebook数据

所有《纽约时报》的Facebook帖子

KhanKhan
2021-08-24
材料安全数据表
NLP
45

材料安全数据表

230,000份材料安全数据表,包含化学成分、急救措施、储存和处理等信息(3 GB)

KhanKhan
2021-08-24
20万英语笑话文本
NLP
56

20万英语笑话文本

来源于各个地方的208,000个纯文本笑话

KhanKhan
2021-08-24
Google Web 5gram
NLP
50

Google Web 5gram

包含n-gram及其观察到的频率计数。n-gram的长度从unigrams(单个单词)到5-gram,主要用于统计语言建模(24 GB)

KhanKhan
2021-08-24
Google Books Ngrams
NLP
70

Google Books Ngrams

包含在整个语料库中出现超过40次的n-gram,优化了快速查询小组短语的用法

KhanKhan
2021-08-24
联邦采购数据中心的联邦合同
NLP
39

联邦采购数据中心的联邦合同

来自管理联邦采购数据系统(FPDS-NG)的联邦采购数据中心(FPDC)的转储,真实性和准确性已受承诺(180 GB)

KhanKhan
2021-08-24
123
Copyright 2019-2021 www.jsai.org.cn ©All Rights Reserved.版权所有。 苏ICP备20008440号-1