logo
  • 首页
  • 公共数据集
    • 机器学习
    • 图像识别
    • 人脸识别
    • 语音识别
    • 文本语料
    • NLP
    • 标准训练集
  • 行业数据集
    • 机器视觉
    • 医疗图像
    • 自动驾驶
    • 智能交通
    • 能源电力
    • 无人机
  • 框架与工具
    • 国产框架
    • 国外框架
    • 标注工具
    • 其他软件
  • 开放平台
    • 技术开放平台
    • 数据开放平台
    • 测试验证平台
  • 算法教程
  • 关于JSAI
登录 注册
全部 NLP 人脸识别 医疗图像 图像识别 智能交通 机器学习 机器视觉 自动驾驶 语音识别
    当前位置:
  • 首页
  • TAG:文本分类
仇恨言语识别
NLP
86

仇恨言语识别

ICWSM 2017论文“自动仇恨语音检测和无礼语言问题”的作者贡献。包含3类短文本:a)包含仇恨言论;b)是冒犯性的,但没有仇恨 ...

KhanKhan
2021-08-24
GigaOM WordPress Challenge [Kaggle]
NLP
45

GigaOM WordPress Challenge [Kaggle]

预测有人会喜欢哪些博客文章。包含博客文章、元数据、用户喜欢情况等信息(1.5 GB)

KhanKhan
2021-08-24
Freebase Quad Dump
NLP
36

Freebase Quad Dump

Freebase中所有当前事实和主张的数据转储(35 GB)

KhanKhan
2021-08-24
Freebase数据转储
NLP
31

Freebase数据转储

是一个开放的世界信息数据库,包含电影、音乐、人物、地域在内的数百个类别的数百万个主题(26GB)

KhanKhan
2021-08-24
Flickr Personal Taxonomies
NLP
84

Flickr Personal Taxonomies

社交媒体上用户按个人喜好分类内容的树形数据集,包含7,121位Flickr的树

KhanKhan
2021-08-24
垃圾邮件/标题党新闻数据集[Kaggle]
NLP
80

垃圾邮件/标题党新闻数据集[Kaggle]

新闻网站The Examiner上的新闻汇编,包含超过6年的21000多位作者撰写的300万篇文章的标题(200 MB)

KhanKhan
2021-08-24
经济新闻报道的基调和相关性
NLP
94

经济新闻报道的基调和相关性

包含从1951年到2014年的经济新闻,可根据新闻报道判断该文章是否与美国经济情况相关,如果是,报道的基调是什么

KhanKhan
2021-08-24
Del.icio.us
NLP
43

Del.icio.us

包含delicious.com上的125万个书签(170 MB)

KhanKhan
2021-08-24
美国政客的社交媒体消息分类
NLP
36

美国政客的社交媒体消息分类

收集了来自美国参议员和其他美国政客的数千条社交媒体消息,可按内容分类为目标群众(国家或选民)、政治主张(中立/两党或 ...

KhanKhan
2021-08-24
亚马逊评论
NLP
85

亚马逊评论

斯坦福收集的3500万条亚马逊评论,跨度18年

KhanKhan
2021-08-24
123456
Copyright 2019-2021 www.jsai.org.cn ©All Rights Reserved.版权所有。 苏ICP备20008440号-1