通过对图像区域的文字描述和互相之间的关联,进行视觉问答(Visual Question Answering)任务,数据集中不仅包含图像本身,还包括图像内容的区域内容的问答。
官网已经打不开。
https://pan.baidu.com/s/1kVNUTrL 网盘密码:6wge
×
微信扫一扫分享到朋友圈