Jeopardy! 问题数据集

155次
2023-03-11

Jeopardy! 问题数据集

这个数据集很不错,包含 216,930 个 Jeopardy 问题、答案和其他数据。它是可用于你 NLP 项目的绝佳数据集。除了问题和答案,该数据集还包含有关问题类别和价值的信息。

1 数据集样本

我们加载数据,看看它是什么样的:

<span class="n">data</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">read_csv</span><span class="p">(</span><span class="n">f</span><span class="s2">".</span><span class="se">\\</span><span class="s2">Datasets</span><span class="se">\\</span><span class="s2">joepardy.csv"</span><span class="p">)</span>
<span class="n">data</span><span class="o">.</span><span class="n">head</span><span class="p">()</span>
Jeopardy! 问题数据集 (http://ds.jsai.org.cn/) 机器学习 第1张

2 这个公共数据集适合解决什么问题?

这是一个丰富的数据集,可用于多种用途。你可以运行分类算法并预测问题的类别或问题的价值。不过你可以用它做的最酷的事情可能是用它来训练 BERT 模型。

3 有用的链接

从以下链接中可以找到关于这个数据集的更多信息:

  • Kaggle(kaggle.com/tunguz/20000)
END

发表评论