名称实体识别数据集包含短句和低上下文查询,包括 LOWNER、MSQ-NER、ORCAS-NER 和公报(167 万实体)。此版本包含低上下文名 ...
我们创建包含短句子和低上下文查询的 NER 数据集。其中包括从维基百科句子中提取的训练/开发/测试集(即低级)。我们还创建 ...
This paper presents a new challenging information extraction task in the domain of materials science. We develop an ...
Dataset contains 6,892 disease mentions, which are mapped to 790 unique disease concepts. Of these, 88% link to a Me ...
不同领域的带注释数据集对于许多基于监督的基于学习的相关问题的解决方案以及对建议的解决方案的评估至关重要。自然语言处理 ...
我们描述了德国联邦法院判决中为指定实体识别而开发的数据集。它包括大约67,000句子和超过200万个代币。该资源包含 54,000 ...