HMDB数据集是当前识别动作研究领域最为重要的几个数据集之一。
随着每天近10亿个在线视频的观看,计算机视觉研究的一个新兴前沿领域是视频识别和搜索。尽管人们在收集和注释包含数千种图像类别的大型可伸缩静态图像数据集方面付出了大量努力,但人类行为数据集却远远落后于此。
为此,Brown university大学于2011年发布HMDB51数据集,该数据集视频多数来源于电影,还有一部分来自公共数据库以及YouTube等网络视频库。数据库包含有6849段样本,分为51类,每类至少包含有101段样本。
动作主要分为五类:
1)一般面部动作:微笑,大笑,咀嚼,交谈。
2)面部操作与对象操作:吸烟,吃,喝。
3)一般的身体动作:侧手翻,拍手,爬,爬楼梯,跳,落在地板上,反手翻转、倒立、跳、拉、推、跑,坐下来,坐起来,翻跟头,站起来,转身,走,波。
4)与对象交互动作:梳头,抓,抽出宝剑,运球、高尔夫、打东西,球、挑、倒、推东西,骑自行车,骑马,射球,射弓、枪、摆棒球棍、剑锻炼,扔。
5)人体动作:击剑,拥抱,踢某人,亲吻,拳打,握手,剑战。
51个动作的图示: