logo
  • 首页
  • 公共数据集
    • 机器学习
    • 图像识别
    • 人脸识别
    • 语音识别
    • 文本语料
    • NLP
    • 标准训练集
  • 行业数据集
    • 机器视觉
    • 医疗图像
    • 自动驾驶
    • 智能交通
    • 能源电力
    • 无人机
  • 框架与工具
    • 国产框架
    • 国外框架
    • 标注工具
    • 其他软件
  • 开放平台
    • 技术开放平台
    • 数据开放平台
    • 测试验证平台
  • 算法教程
  • 关于JSAI
登录 注册
全部 NLP 人脸识别 医疗图像 图像识别 智能交通 机器学习 机器视觉 自动驾驶 语音识别
    当前位置:
  • 首页
  • TAG:文本摘要
WestburyLab USENET语料库
NLP
74

WestburyLab USENET语料库

2005—2010年47,860篇英语新闻的匿名汇总,文章长度在500字和500,000字之间,英文单词占比高达90%(40 GB)

KhanKhan
2021-08-24
基于新闻文章判断美国经济表现
NLP
58

基于新闻文章判断美国经济表现

新闻文章的标题和摘要与美国经济相关程度的排名

KhanKhan
2021-08-24
Twitter Sentiment140
NLP
73

Twitter Sentiment140

与品牌/关键字相关的推文,网站上包括论文和研究想思路

KhanKhan
2021-08-24
一周全球新闻馈送[Kaggle]
NLP
38

一周全球新闻馈送[Kaggle]

一周内(2017年8月24日至2017年8月30日)全球在线发布的大多新闻内容的快照,包括大约140万篇文章、20,000个新闻来源和20多 ...

KhanKhan
2021-08-24
印度新闻标题[Kaggle]
NLP
44

印度新闻标题[Kaggle]

汇编了2001年至2017年印度“泰晤士报”发表的270万条新闻的标题

KhanKhan
2021-08-24
澳大利亚新闻标题[Kaggle]
NLP
43

澳大利亚新闻标题[Kaggle]

包含15年内(2003年初至2017年)澳大利亚广播公司发布的130万条新闻的标题,深入研究关键词,可以看到所有塑造了过去十年的 ...

KhanKhan
2021-08-24
Polish Summaries Corpus (PSC)
NLP
52

Polish Summaries Corpus (PSC)

Dataset contains news articles and their summaries., lang: Polish, iterations: 723, file_type: TSV, tasks: Summarization

KhanKhan
2021-08-24
BillSum: A Corpus for Automatic Summarization of US Legislation
NLP
40

BillSum: A Corpus for Automatic Summarization of US Legislation

Automatic summarization methods have been studied on a variety of domains, including news and scientific articles. Y ...

KhanKhan
2021-08-24
NCLS-科波拉
NLP
45

NCLS-科波拉

包含两个用于跨语言摘要的数据集:ZH2ensum 和 EN2ZHSUM。有370,759对英语到中文的跨语言总结(CLS)对从ENSUM和1,699,71 ...

KhanKhan
2021-08-24
Copyright 2019-2021 www.jsai.org.cn ©All Rights Reserved.版权所有。 苏ICP备20008440号-1