logo
  • 首页
  • 公共数据集
    • 机器学习
    • 图像识别
    • 人脸识别
    • 语音识别
    • 文本语料
    • NLP
    • 标准训练集
  • 行业数据集
    • 机器视觉
    • 医疗图像
    • 自动驾驶
    • 智能交通
    • 能源电力
    • 无人机
  • 框架与工具
    • 国产框架
    • 国外框架
    • 标注工具
    • 其他软件
  • 开放平台
    • 技术开放平台
    • 数据开放平台
    • 测试验证平台
  • 算法教程
  • 关于JSAI
登录 注册
全部 NLP 人脸识别 医疗图像 图像识别 智能交通 机器学习 机器视觉 自动驾驶 语音识别
    当前位置:
  • 首页
  • TAG:结构化数据
Yahoo!从公开可用网页中提取元数据
NLP
117

Yahoo!从公开可用网页中提取元数据

RDF数据(2 GB)

KhanKhan
2021-08-24
Yahoo!从公开可用网页中提取的HTML表单
NLP
36

Yahoo!从公开可用网页中提取的HTML表单

包含一小部分含有复杂HTML表单的页面,共计267万个复杂表单(50+ GB)

KhanKhan
2021-08-24
维基百科XML数据
NLP
39

维基百科XML数据

维基媒体基金会提供的完整副本,以wikitext源代码和嵌入XML的元数据形式提供(500 GB)

KhanKhan
2021-08-24
WEX
其他软件
40

WEX

英文维基百科的处理转储(66 GB)

KhanKhan
2021-08-24
WestburyLab维基百科语料库
NLP
103

WestburyLab维基百科语料库

包含2010年4月以前维基百科英文部分中的所有文章的快照,已经去除了所有链接和不相关的材料(导航文本等),但未经标记,是 ...

KhanKhan
2021-08-24
材料安全数据表
NLP
45

材料安全数据表

230,000份材料安全数据表,包含化学成分、急救措施、储存和处理等信息(3 GB)

KhanKhan
2021-08-24
DBpedia
NLP
50

DBpedia

包含从维基百科中提取出的结构化信息,包括312,000个人、413,000个地点、94,000张音乐专辑、49,000部电影、15,000种电子游戏 ...

KhanKhan
2021-08-24
MIMIC-III(
NLP
253

MIMIC-III("重症监护医疗信息市场")

MIMIC-III("重症监护医疗信息市场")是一个大型的单中心数据库,包含与大型三级护理医院重症监护室的病人有关的信息。数据 ...

KhanKhan
2021-08-24
Copyright 2019-2021 www.jsai.org.cn ©All Rights Reserved.版权所有。 苏ICP备20008440号-1