英国文学核心的注释数据集免费

Khan 91 2021-08-24 NLP

资源介绍

我们在这部作品中介绍了英语文学作品核心注释的新数据集,涵盖了 100 部小说作品中的 210,532 个令牌中的 29,103 个提及。此数据集不同于之前包含平均长度(2,105.3 字)比其他基准数据集(463.7 代表 OfNotes)长的文件,并包含文献中常见的困难核心问题示例。 此数据集允许对核心决策任务的跨域性能进行评估,并分析到文档内远程核心的特征。

END

发表评论

猜你喜欢