14k QA pairs over 1.7K paragraphs, split between train (10k QAs), development (1.6k QAs) and a hidden test partition ...
亚马逊产品问题及其答案,以及公共产品信息。
Dataset包含类似语言和方言新闻文本的简短摘录 file_type。
细粒度实体打字是一项具有挑战性的任务,具有广泛的应用。但是,此任务的大多数现有数据集都是英文的。本文介绍了中国细粒度 ...
基于Corpus的集扩展(即根据给定语料库和一小组种子查找属于同一语义类的"完整"实体)是知识发现中的一项关键任务。它可以促 ...
现有的关于作者归因(AA)的研究侧重于大量可用数据的文本(例如小说),主要是英文文本。我们通过作者验证在两个新颖的数据 ...
数据集包含 50 个空白故事,其风格与疯狂 Libs 相似。这些故事中的空白包括原始单词和提示类型(例如动物、食物、名词、副词 ...
在本文中,我们提出了一种新的注释方法,在学生撰写的关于德语商业模式的有说服力的同行评论中捕捉论点及其关系的主张和前提 ...