[Kaggle]数据集的子集(8 GB)
230,000份材料安全数据表,包含化学成分、急救措施、储存和处理等信息(3 GB)
欧洲语言机器翻译
来源于各个地方的208,000个纯文本笑话
包含216,930个危险问题
哈佛图书馆藏书记录已超过1,200万册,包括书籍、期刊、电子资料、手稿、档案资料、乐谱、音频、视频和其他资料(4GB)
Freebase中所有当前事实和主张的数据转储(35 GB)
是一个开放的世界信息数据库,包含电影、音乐、人物、地域在内的数百个类别的数百万个主题(26GB)
来自管理联邦采购数据系统(FPDS-NG)的联邦采购数据中心(FPDC)的转储,真实性和准确性已受承诺(180 GB)
可以实时访问全球100,000个新闻源的新闻文章