我们在这部作品中介绍了英语文学作品核心注释的新数据集,涵盖了 100 部小说作品中的 210,532 个令牌中的 29,103 个提及。此数据集不同于之前包含平均长度(2,105.3 字)比其他基准数据集(463.7 代表 OfNotes)长的文件,并包含文献中常见的困难核心问题示例。 此数据集允许对核心决策任务的跨域性能进行评估,并分析到文档内远程核心的特征。
×
微信扫一扫分享到朋友圈