在 SWAG 的句子完成样式中的常识 QA 。与其他自动生成的 NLI数据集相反,CODAH 是由人类对抗性构建的,他们可以查看预先训练 ...
用网络论坛帖子. 语言: 英语, 迭代: 7b, file_type: 文本, 任务: 对话
数据集包含阿拉伯语推文 file_type。
收集用于作者归因和人格预测的实验。由 145 篇荷兰语文章组成, 朗: 荷兰语, 迭代: 145, file_type: 文本, 任务: 分 ...
数据集根据帖子的功能预测帖子将收到的评论数量 file_type。
ClueWeb09 和ClueWeb12corpora 的注释网页, 朗: 英语, 迭代: 340,451,982, file_type: 文本, 任务: 分类
给出的任务是,从给出的功能中确定哪些文章是关于公司收购的。 朗:英语,迭代:2,600,file_type:文本,任务:分类
数据集包含 3,864 个有关开放域定性关系的问题。每个问题都与 405 个不同的背景句子之一 (有时是短段落) 配对。, 朗: ...
数据集包含 2,771 个关于定性关系的故事问题 file_type。
数据集用于理解描述过程的简单段落,例如光合作用。理解任务依赖于预测、跟踪和回答有关实体在这个过程中如何变化的问题。 ...
Dataset包含 13,679 个关于物理、化学和生物学等众包科学考试题。问题以多种选择形式出现,每个答案选项为 4 个,朗:英语 ...
数据集仅包含电影对话数据集的 QA 部分,但使用三种不同的知识设置:使用传统知识库 (KB)、使用维基百科作为知识来源,或 ...
数据集用于回答与人类生成的问题配对的相应事实,格式为(主题、关系、对象),提供答案,但也提供完整的解释 file_type。
数据集是从多选科学考试和 Web 句子创建的需要数据集。每个问题和正确的答案选择都转换成一个自信的陈述来形成假说。 朗: ...
视觉问题解答数据集包含100,000个图像和999,968个问题。100,000 张图片,file_type:JSON,任务:问题解答,视觉
由包含 102 种语言的圣经翻译创建的平行语料库file_type。
提取英语(英语词汇借用)既与词汇目的相关,也与 NLP 下游任务相关。我们介绍了一个欧洲西班牙报纸头条的语料库,注释了心 ...
包含来自 MEDLINE(在线医疗信息数据库)的参考数据集,包括五年期间(1987-1991 年)内 270 份医学期刊的标题和/或摘要 --, ...
Dataset包含 12.8K 在 POLITIFACT.COM 的各种上下文中手动标记的简短语句,其中提供了详细的分析报告和每个案例源文档的链接 ...
数据集包含数学问答对,从大致学校级难度的一系列问题类型中。, 朗: 英语, 迭代: --, file_type: 文本, 任务: 数学推理