理解故事对于机器来说是一个具有挑战性的阅读理解问题,因为它需要阅读大量的文本和遵循长期依赖。在本文中,我们介绍了 Shmoop Corpus:一个由 231 个故事组成的数据集,其中与每个章节(7,234 章)的详细多段摘要配对,其中摘要按时间顺序与故事章节一致。从语料库出发,我们构建了一套常见的 NLP 任务,包括 Cloze 形式的问题回答和抽象总结的简化形式,作为阅读故事理解的基准。然后,我们表明,按时间顺序排列提供了一个强烈的监督信号,即基于学习的方法可以利用这些任务,从而显著改进这些任务。我们认为,这种语料库的独特结构为使机器故事理解更加平易近人提供了重要立足点。