低上下文名称实体识别（NER）数据集与公报

点击图片放大查看

资源介绍

我们创建包含短句子和低上下文查询的 NER 数据集。其中包括从维基百科句子中提取的训练/开发/测试集（即低级）。我们还创建两个测试集从MS-MARCO（自然语言问题）和ORCAS（搜索查询），称为MSQ-NER和ORCAS-NER提取。所有已发布的集都包含文本及其在 CoNLL 格式中对齐的实体注释。此次发布的数据还包含宪报数据，该数据由来自英语维基数据知识库的 167 万个实体组成。

END

标签

命名实体识别大规模

上一篇 COCO 图像识别的数据集

下一篇 Google Books Ngrams

发表评论取消回复

请先登录账户再评论哦

低上下文名称实体识别（NER）数据集与公报免费

资源介绍

发表评论取消回复

最新文章

热门文章

COCO 图像识别的数据集

苗圃数据集

老年精神状态

siim acr气胸-分段.zip数据集

维基卡公司

标签云

猜你喜欢

低上下文名称实体识别 （NER） 数据集与公报免费

资源介绍

发表评论 取消回复

最新文章

热门文章

COCO 图像识别的数据集

苗圃数据集

老年精神状态

siim acr气胸-分段.zip数据集

维基卡公司

标签云

猜你喜欢

COCO 图像识别的数据集

苗圃数据集

老年精神状态

siim acr气胸-分段.zip数据集

维基卡公司

细粒体打字的中国语料库

Reddit推荐帖语料库

印度进口石油产品的数量

世界银行：GHNP数据

调查数据集第2部分-在需求工程中，将视频作为交流的文档选项

低上下文名称实体识别（NER）数据集与公报免费

发表评论取消回复