我们引入了一个新的数据集,用于培训和评估基础语言模型。我们的数据是在虚拟现实环境中收集的,旨在模拟语言前儿童可能获得的语言数据的质量:即自然主义、自发的语音与基础丰富的维苏空间背景配对。我们使用收集的数据比较几个用于动词学习的分布语义模型。我们评估基于 2D(像素)功能的神经模型以及基于 3D(符号、空间)功能的功能工程模型,并表明两种建模方法均未达到令人满意的性能。我们的结果与儿童语言获取的证据一致,该证据强调了从天真的分布数据中学习动词的难度。我们讨论未来认知启发的基于语言学习的途径,并发布我们的语料库,以促进对该主题的研究。