MMID是一个大规模,大规模多语种的图像数据集,与它们所代表的单词在宾夕法尼亚大学收集。数据集是双重平行的:对于每种语言 ...
我们引入了一个新的数据集,用于培训和评估基础语言模型。我们的数据是在虚拟现实环境中收集的,旨在模拟语言前儿童可能获得 ...