面向任务的对话系统需要知道查询何时超出其支持意图的范围,但目前的文本分类公司只定义涵盖每个示例的标签集。我们引入了一 ...
讲座翻译是口语翻译的一个案例,因此缺乏为此目的公开的平行公司。为了解决这个问题,我们研究了一个语言独立的平行语料库挖 ...
理解故事对于机器来说是一个具有挑战性的阅读理解问题,因为它需要阅读大量的文本和遵循长期依赖。在本文中,我们介绍了 Shm ...
济州岛于2010年被联合国教科文组织列为极度濒危物种。虽然为振兴它作出了各种努力,但几乎没有计算方法。受此激励,我们构建 ...
癌症仍然是全世界主要的死因之一,对医疗保健产生了相当大的影响。临床和分子肿瘤学科学界最近的研究努力能够大大提高某些癌 ...
数据集包括8 种语言(56 种语言对)的 8,130 个并行口语。语言:巴斯克语、英语、芬兰语、法语。匈牙利语,罗马尼亚语,俄 ...
惯用表达一直是语言理解和自然语言理解的瓶颈,特别是机器翻译(MT)等任务。MT 系统主要产生惯用表达的字面翻译,因为它们 ...
数据集包含在 Go、Java、JavaScript、PHP、Python 和 Ruby 中编写的相关文档的功能,这些文档来自 GitHub 上的开源项目,朗 ...
我们介绍ASDiv(学术界西尼卡多样化MWP数据集),一个多样化的(在语言模式和问题类型方面)英语数学单词问题(MWP)语料库 ...
现有的关于作者归因(AA)的研究侧重于大量可用数据的文本(例如小说),主要是英文文本。我们通过作者验证在两个新颖的数据 ...
测试文本理解的故事和相关问题。 朗: 英语, 迭代: 660, file_type: 文本, 任务: 问题回答, 阅读理解
数据集包含 50 个空白故事,其风格与疯狂 Libs 相似。这些故事中的空白包括原始单词和提示类型(例如动物、食物、名词、副词 ...
Dataset是评估对话系统 / 聊天机器人在存在范围外查询的情况下的意图分类系统的基准 file_type。
我们描述了德国联邦法院判决中为指定实体识别而开发的数据集。它包括大约67,000句子和超过200万个代币。该资源包含 54,000 ...
了解视频或图像中的评论情绪是许多应用程序中必不可少的任务。对文本的情绪分析可用于各种决策过程。其中一个应用是根据观看 ...
回答与艺术作品(绘画)有关的问题是一项艰巨的任务,因为它不仅意味着对图片中显示的视觉信息的理解,而且意味着对通过研究 ...
大型数据集在 NLP 研究中已司空见惯。然而,对数据量的日益重视使得评估数据质量变得困难。我们引入数据地图---基于模型的工 ...
用于生成面向目标的聊天机器人的培训数据集的演示。具体来说,对话来自 dstc2 培训数据集,模型:框架、任务:数据集生成
在本文中,我们提出了一种新的注释方法,在学生撰写的关于德语商业模式的有说服力的同行评论中捕捉论点及其关系的主张和前提 ...
本文调查了维基阅读信息提取和机器阅读理解数据集上的各种变形金刚架构。提议的双源模型大大优于目前的先进水平。接下来,我 ...