假新闻数据集

43次
2023-03-11

假新闻数据集

我们生活在一个狂野的时代。假新闻、深度造假和其他类型的欺骗技术都成了我们日常生活的一部分,无论我们喜欢与否。这个数据集提供了另一个非常适合练习的 NLP 任务。它包含标记过的真实和虚假新闻,以及它们的文本和作者。

1 数据集样本

我们加载数据,看看它是什么样的:

<span class="n">data</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">read_csv</span><span class="p">(</span><span class="n">f</span><span class="s2">".</span><span class="se">\\</span><span class="s2">Datasets</span><span class="se">\\</span><span class="s2">fake_news</span><span class="se">\\</span><span class="s2">train.csv"</span><span class="p">)</span>
<span class="n">data</span><span class="o">.</span><span class="n">head</span><span class="p">()</span>
假新闻数据集 (http://ds.jsai.org.cn/) 机器学习 第1张

2 这个公共数据集适合解决什么问题?

这是另一个 NLP 文本分类任务。

3 有用的链接

从以下链接中可以找到关于这个数据集的更多信息:

  • Kaggle(kaggle.com/c/fake-news/)
END
上一篇
下一篇

发表评论