我们引入了一个新的数据集,用于培训和评估基础语言模型。我们的数据是在虚拟现实环境中收集的,旨在模拟语言前儿童可能获得 ...
基于Corpus的集扩展(即根据给定语料库和一小组种子查找属于同一语义类的"完整"实体)是知识发现中的一项关键任务。它可以促 ...
理解故事对于机器来说是一个具有挑战性的阅读理解问题,因为它需要阅读大量的文本和遵循长期依赖。在本文中,我们介绍了 Shm ...
癌症仍然是全世界主要的死因之一,对医疗保健产生了相当大的影响。临床和分子肿瘤学科学界最近的研究努力能够大大提高某些癌 ...
我们介绍ASDiv(学术界西尼卡多样化MWP数据集),一个多样化的(在语言模式和问题类型方面)英语数学单词问题(MWP)语料库 ...
Dataset是评估对话系统 / 聊天机器人在存在范围外查询的情况下的意图分类系统的基准 file_type。
回答与艺术作品(绘画)有关的问题是一项艰巨的任务,因为它不仅意味着对图片中显示的视觉信息的理解,而且意味着对通过研究 ...
用于生成面向目标的聊天机器人的培训数据集的演示。具体来说,对话来自 dstc2 培训数据集,模型:框架、任务:数据集生成
本文调查了维基阅读信息提取和机器阅读理解数据集上的各种变形金刚架构。提议的双源模型大大优于目前的先进水平。接下来,我 ...
学术研究论文的读者经常阅读,目的是回答具体问题。能够回答这些问题的问题的回答系统可以使内容的消耗更加高效。但是,构建 ...