ImageNet 数据集 最后这个数据集是计算机视觉数据集中的王者——ImageNet。该数据集是用来衡量所有新的深度学习和计算机视觉 ...
假新闻数据集 我们生活在一个狂野的时代。假新闻、深度造假和其他类型的欺骗技术都成了我们日常生活的一部分,无论我们喜欢 ...
鲍鱼数据集 从本质上讲这是一个多分类问题,然而,这个数据集也可以被视为一个回归问题。它的目标是使用提供的指标来预测鲍 ...
Jeopardy! 问题数据集 这个数据集很不错,包含 216,930 个 Jeopardy 问题、答案和其他数据。它是可用于你 NLP 项目的绝佳数 ...
小麦种子数据集 这个数据集非常有趣和简单。它特别适合初学者,可以代替 Iris 数据集。该数据集包含属于三种不同小麦品种的 ...
18. 皮马印第安人糖尿病数据集 这是另一个用于分类练习的医疗保健数据集。它来自美国国家糖尿病、消化和肾脏疾病研究所,其 ...
17. 声纳数据集 如果你对地质学感兴趣,会发现这个数据集非常有趣。它是利用声纳信号制成的,由两部分组成。第一部分名为“s ...
16.LabelMe 数据集 LabelMe 是另一个计算机视觉数据集。LabelMe 是一个带有真实标签的大型图像数据库,用于物体检测和识别 ...
纸币验证数据集 这是一个有趣的数据集。你可以使用它来创建可以检测真钞和伪造钞票的解决方案。该数据集包含了从数字化图像 ...
亚马逊评论数据集 情绪分析是最常见的文本分类工具。这个过程会分析文本片段以确定情绪倾向是积极的、消极的还是中性的。在 ...
13.YouTube-8M 数据集 这是最大的多标签视频分类数据集。它来自谷歌,拥有 800 万个带有注释和 ID 的 YouTube 分类视频。这 ...
CelebA 数据集 如果你想研究人脸检测解决方案、构建自己的人脸生成器或创建深度人脸伪造模型,那么这个数据集就是你的最佳 ...
垃圾短信分类器数据集 垃圾消息检测是互联网中最早投入实践的机器学习任务之一。这种任务也属于 NLP 和文本分类工作。所以 ...
BBC 新闻数据集 我们再来看这个类别中另一个有趣的文本数据集。该数据集来自 BBC 新闻。它由 2225 篇文章组成,每篇文章都 ...
Twitter 情绪分析和Sentiment140 数据集 在过去几年中,情绪分析成为了一种监控和了解客户反馈的重要工具。这种对消息和响 ...
威斯康星州乳腺癌(诊断)数据集 机器学习和深度学习技术在医疗保健领域中的应用正在稳步增长。如果你想练习并了解使用此类 ...
猫与狗数据集 这是一个包含猫狗图像的数据集。这个数据集包含 23,262 张猫和狗的图像,用于二值图像分类。在主文件夹中, ...
6.Fashion MNIST 数据集 MNIST 数据集是用于练习图像分类和图像识别的著名数据集,然而它有点被滥用了。如果你想要一个简单 ...
电离层数据集 这也是一个经典数据集。它实际上起源于 1989 年,但它确实很有趣。该数据集包含由拉布拉多鹅湾的雷达系统收集 ...
波士顿住房数据集 虽然我说过会尽量不推荐其他人都推荐的那种数据集,但这个数据集实在太经典了。许多教程、示例和书籍都使 ...