我们介绍ASDiv(学术界西尼卡多样化MWP数据集),一个多样化的(在语言模式和问题类型方面)英语数学单词问题(MWP)语料库,用于评估各种MWP解算器的能力。用于研究人工智能进展的现有 MWP公司在语言使用模式或问题类型方面仍然有限。因此,我们提出了一个新的英语MWP语料库与2,305兆瓦,涵盖更多的文本模式和大多数问题类型在小学教。每个 MWP 都附有问题类型和等级级别(用于指示难度级别)。此外,我们提出了一个指标,以衡量给定的MWP语料库的词典使用多样性,并证明ASDiv比现有的公司更多样化。实验表明,我们提出的语料库更真实地反映了MWP解算器的真实能力。