鉴于一小套种子实体(例如,"美国","俄罗斯"),基于语料库的集扩展是诱导一组广泛的实体,这些实体共享相同的语义类(本例 ...
在 SWAG 的句子完成样式中的常识 QA 。与其他自动生成的 NLI数据集相反,CODAH 是由人类对抗性构建的,他们可以查看预先训练 ...
用网络论坛帖子. 语言: 英语, 迭代: 7b, file_type: 文本, 任务: 对话
数据集根据帖子的功能预测帖子将收到的评论数量 file_type。
ClueWeb09 和ClueWeb12corpora 的注释网页, 朗: 英语, 迭代: 340,451,982, file_type: 文本, 任务: 分类
数据集用于理解描述过程的简单段落,例如光合作用。理解任务依赖于预测、跟踪和回答有关实体在这个过程中如何变化的问题。 ...
Dataset包含 13,679 个关于物理、化学和生物学等众包科学考试题。问题以多种选择形式出现,每个答案选项为 4 个,朗:英语 ...
数据集是从多选科学考试和 Web 句子创建的需要数据集。每个问题和正确的答案选择都转换成一个自信的陈述来形成假说。 朗: ...
提取英语(英语词汇借用)既与词汇目的相关,也与 NLP 下游任务相关。我们介绍了一个欧洲西班牙报纸头条的语料库,注释了心 ...
数据集包含数学问答对,从大致学校级难度的一系列问题类型中。, 朗: 英语, 迭代: --, file_type: 文本, 任务: 数学推理