ImageNet:是市场上最大、最受欢迎的开源数据集之一。拥有超过 1400 万张已手动标注的图像,数据库按 WordNet 层次结构予以组织,对象级标注通过边界框完成,广泛用于图像分类、目标检测等任务。
项目地址:http://www.image-net.org/
COCO(Common Objects in Context):大规模对象检测、分割和字幕数据集。包含 91 种易于识别的对象类型的照片,在 328k 图像中共有 250 万个标记实例,还为多对象标记、分割掩码注释、图像字幕和关键点检测等更复杂的 CV 任务提供资源,有直观的 API 支持多种注释格式。
项目地址:http://cocodataset.org/
PASCAL VOC(Visual Object Classes):早期广泛用于目标检测、图像分类和分割等任务的数据集,包含 20 个类别。
项目地址:http://host.robots.ox.ac.uk/pascal/VOC/
KITTI:由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集,用于评测立体图像、光流、视觉测距、3D 物体检测和 3D 跟踪、语义分割等计算机视觉技术在车载环境下的性能,包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中最多达 15 辆车和 30 个行人,还有各种程度的遮挡与截断。
项目地址:www.cvlibs.net/datasets/kitti/
ityscapes:包含 50 个不同城市的街道场景中记录的各种立体视频序列,除了一组较大的 20,000 弱注释帧外,还具有 5,000 帧的高质量像素级注释,主要用于训练深度神经网络和评估视觉算法对语义城市场景理解的性能,涵盖城市场景下双目图像及像素级语义分割标注。
项目地址:www.cityscapes-dataset.com/
BDD100K:主要包括视频数据、道路目标检测、实例分割、可驾驶区域等相关数据,如在不同时间、天气条件和驾驶场景中的 100,000 高清视频序列,以及各种目标的标注等。
项目地址:bdd-data.berkeley.edu/
Waymo Open Dataset:包含 3000 段驾驶记录,时长共 16.7 小时,平均每段长度约为 20 秒,整个数据集一共包含 60 万帧,有大量的 3D 和 2D 边界框标注,且涵盖不同的天气条件、时间段、地点和道路对象等多样性。
项目地址:github.com/waymo-research/waymo-open-dataset
NuScenes:自动驾驶公司 nutonomy 建立的大规模自动驾驶数据集,不仅包含了 camera 和 lidar,还记录了雷达数据,由 1000 个场景组成,每个场景长度为 20 秒,包含了各种各样的情景,关键帧经过手工标注,有丰富的标注信息。
项目地址:www.nuscenes.org/download
Caltech 101 / Caltech 256:加利福尼亚理工学院图像数据库,分别包含 101 类和 256 类的图像数据。
项目地址:http://www.vision.caltech.edu/Image_Datasets/Caltech101/
MNIST:由手写数字的图像组成,用于数字识别任务,是机器学习领域的经典数据集。
项目地址:http://yann.lecun.com/exdb/mnist/
CIFAR-10 / CIFAR-100:CIFAR-10 包含 10 个不同类别的 60,000 张 32×32 彩色图像,CIFAR-100 则有 100 个类别,常用于图像分类研究的基准数据集。
项目地址:http://www.cs.toronto.edu/~kriz/cifar.html
Open Images:由大约 900 万幅图像组成,带有图像级标签、对象边界框、对象分割蒙版和视觉关系,包含 190 万幅图像上 600 个对象类别的 1600 万个边界框,是现有的最大的带有对象位置注释的数据集之一。
项目地址:https://storage.googleapis.com/openimages/web/index.html
Kinetics:提供一个开源数据集,其中包含 650,000 个视频剪辑,涵盖 700 个人类动作类型,包括人与物互动、人与人互动,数据集可以细分为 700 个视频剪辑的部分,且每个视频剪辑均有标注,持续大约 10 秒,可用于许多不同的计算机视觉应用场景,如行为识别等。
项目地址:https://deepmind.com/research/open-source/kinetics
UCF101:来自 YouTube 的 101 类人类动作视频数据集,广泛应用于动作识别研究。
项目地址:https://www.crcv.ucf.edu/data/UCF101.php