包含来自 MEDLINE(在线医疗信息数据库)的参考数据集,包括五年期间(1987-1991 年)内 270 份医学期刊的标题和/或摘要 --, ...
与医学或生物科学相关的生物医学实体类型之一是化合物和药物。正确检测这些实体对于基于这些实体的其他文本挖掘应用至关重要 ...
细粒度实体打字是一项具有挑战性的任务,具有广泛的应用。但是,此任务的大多数现有数据集都是英文的。本文介绍了中国细粒度 ...
面向任务的对话系统需要知道查询何时超出其支持意图的范围,但目前的文本分类公司只定义涵盖每个示例的标签集。我们引入了一 ...
数据集包含在 Go、Java、JavaScript、PHP、Python 和 Ruby 中编写的相关文档的功能,这些文档来自 GitHub 上的开源项目,朗 ...
现有的关于作者归因(AA)的研究侧重于大量可用数据的文本(例如小说),主要是英文文本。我们通过作者验证在两个新颖的数据 ...
测试文本理解的故事和相关问题。 朗: 英语, 迭代: 660, file_type: 文本, 任务: 问题回答, 阅读理解
数据集包含 50 个空白故事,其风格与疯狂 Libs 相似。这些故事中的空白包括原始单词和提示类型(例如动物、食物、名词、副词 ...
在本文中,我们提出了一种新的注释方法,在学生撰写的关于德语商业模式的有说服力的同行评论中捕捉论点及其关系的主张和前提 ...
数据集用于将句子分类为语法或非语法 file_type。