NIH NCBI PMC 文章数据集免费

Khan 22 2021-08-24 NLP

资源介绍

PMC 开放访问 (OA) 子集,其中包含 PMC 中包含具有机器可读知识

共享许可证的作者手稿数据集的所有文章,其中包括所有文章收集根据 PMC 的资助者政策,这些数据集总共涵盖 PMC 全文

文章集合的一半以上。这些数据集以机器可读格式提供,用于文本挖掘。PMC 能够访问这些数据集,以扩大开放访问和公共资助研究的影响;使更多的机器学习跨越科学研究的范围:接触新的受众;并打开新的发现之门。此注册表中的存储桶包含 NISO Z39.96-2015 JATS XML 格式以及从 XML 中提取的纯文本中的个别文章。存储桶每天更新新的和更新的文章。还包括文件列表,其中包含每个数据集中文章的元数据。

END

发表评论

猜你喜欢