logo
  • 首页
  • 公共数据集
    • 机器学习
    • 图像识别
    • 人脸识别
    • 语音识别
    • 文本语料
    • NLP
    • 标准训练集
  • 行业数据集
    • 机器视觉
    • 医疗图像
    • 自动驾驶
    • 智能交通
    • 能源电力
    • 无人机
  • 框架与工具
    • 国产框架
    • 国外框架
    • 标注工具
    • 其他软件
  • 开放平台
    • 技术开放平台
    • 数据开放平台
    • 测试验证平台
  • 算法教程
  • 关于JSAI
登录 注册
全部 NLP 人脸识别 医疗图像 图像识别 智能交通 机器学习 机器视觉 自动驾驶 语音识别
    当前位置:
  • 首页
  • TAG:NLP
CSI语料库
NLP
35

CSI语料库

荷兰语,该语料库包含两种类型的学生文本:作文和评论。涉及作者(性别、年龄、性取向、来源地区、性格概况)和文档(时间、 ...

KhanKhan
2021-08-24
ZEST: ZEroShot learning from Task descriptions
NLP
116

ZEST: ZEroShot learning from Task descriptions

ZEST is a benchmark for zero-shot generalization to unseen NLP tasks, with 25K labeled instances across 1,251 differ ...

KhanKhan
2021-08-24
为欧洲官方语言提供网络规模并行语料库(ParaCrawl)
NLP
61

为欧洲官方语言提供网络规模并行语料库(ParaCrawl)

ParaCrawl 是一套大型平行公司,通过广泛的网络爬行工作,为所有欧盟官方语言提供往返英语的辅助。从识别带有翻译文本的网站 ...

KhanKhan
2021-08-24
NLP - fast.ai datasets
NLP
42

NLP - fast.ai datasets

Some of the most important datasets for NLP, with a focus on classification, including IMDb, AG-News, Amazon Reviews ...

KhanKhan
2021-08-24
Google Books Ngrams
其他软件
95

Google Books Ngrams

N-grams are fixed size tuples of items. In this case the items are words extracted from the Google Books corpus. The ...

KhanKhan
2021-08-24
Aristo Tuple KB
NLP
67

Aristo Tuple KB

294,000 science-relevant tuples

KhanKhan
2021-08-24
NIH NCBI PMC 文章数据集
NLP
93

NIH NCBI PMC 文章数据集

PMC 开放访问 (OA) 子集,其中包含 PMC 中包含具有机器可读知识

KhanKhan
2021-08-24
日本令牌词典
NLP
112

日本令牌词典

日本令牌词典,用于与MeCab。

KhanKhan
2021-08-24
苏达奇语言资源
NLP
119

苏达奇语言资源

日语词典和文字嵌入用于自然语言处理。苏达奇迪克是日本令牌(形态分析仪)苏达奇的词典。chiVe是日本预训单词嵌入(单词载 ...

KhanKhan
2021-08-24
Common Crawl
NLP
118

Common Crawl

A corpus of web crawl data composed of over 50 billion web pages.

KhanKhan
2021-08-24
123
Copyright 2019-2021 www.jsai.org.cn ©All Rights Reserved.版权所有。 苏ICP备20008440号-1