As AI systems become an increasing part of people's everyday lives, it becomes ever more important that they underst ...
Dataset has been extracted from social media for an amount of 43,313 tokens. The classification task consists in cat ...
Condescending language use is caustic; it can bring dialogues to an end and bifurcate communities. Thus, systems for ...
数据集包含 60,000 本电子书, 朗: 多语言, 迭代: 60 0, file_type: 文本, 任务: 文本Corpora
随着在线社交网络的普及,监控所有用户生成的内容变得越来越困难。因此,自动化互联网上不当交换内容的适度过程已成为一项优 ...
Dataset包含来自客户的负面反馈,其中他们陈述了对给定公司不满意的原因。数据集有英文和意大利文版本,朗:意大利语、英语 ...
数据集包含阿拉伯语推文 file_type。
收集用于作者归因和人格预测的实验。由 145 篇荷兰语文章组成, 朗: 荷兰语, 迭代: 145, file_type: 文本, 任务: 分 ...
数据集根据帖子的功能预测帖子将收到的评论数量 file_type。
ClueWeb09 和ClueWeb12corpora 的注释网页, 朗: 英语, 迭代: 340,451,982, file_type: 文本, 任务: 分类