新闻文章的标题和摘要与美国经济相关程度的排名
收集了twitter用户对于一些美国主要航空公司的评价情况。数据始于从2015年2月,评论者需选择正面、负面和中性中的一类,如有 ...
自驾车:阅读推文,将其分为非常积极的、轻微积极的、中性的、轻微消极的或非常消极的,并标记其是否与自驾车相关
与品牌/关键字相关的推文,网站上包括论文和研究想思路
关于诸如堕胎合法化、女权主义、希拉里·克林顿等各种左倾问题的推文,如果所述推文对该问题赞成、反对或保持中立,则将其分类
新英格兰爱国者队在美国橄榄球联合会(AFC)决赛中击败印第安纳波利斯小马队,将在2月1号的超级碗大赛中迎战西雅图海鹰队。 ...
包含2009年9月至2010年1月twitter收集的基于内容的用户地理定位信息,包含115,886位Twitter用户和3,844,612个位置更新:经度 ...
730万个stackoverflow问题+其他stackexchanges(查询工具)
带有脚本信息的.csv文件,包含《南方公园》季数、剧集、角色等信息
是一个包含5,574英文单词,真实的、未附带附件的短信内容集,已合法进行标记
包含从各种在线沙特报纸中摘录的31,030份阿拉伯文报纸文章及其元数据
包含大量路透社新闻报道,主要用于研究和开发自然语言处理、信息检索和机器学习系统。在2004年秋季,NIST接管了RCV1,所以现 ...
从2006年1月至2015年8月31日所有公开可用的Reddit推荐帖(42 GB)
[Kaggle]数据集的子集(8 GB)
截至2015年7月的每个公开可用的书签评论,共计17亿条评论(250 GB)
包含Open Library中所有记录的最新版本的转储
用两个概念来读一个句子,例如“一只狗是一种动物”或“船长可以与主人具有相同的含义”,判断这句话是否属实,然后将结果排列为 ...
一周内(2017年8月24日至2017年8月30日)全球在线发布的大多新闻内容的快照,包括大约140万篇文章、20,000个新闻来源和20多 ...
所有《纽约时报》的Facebook帖子
所有NIPS2015论文全文