天天看点

Cityscapes数据集与COCO数据集Cityscapes数据集与COCO数据集Cityscapes数据集COCO数据集总结

Cityscapes数据集与COCO数据集

对两个公开数据集的简要概述。

文章目录

  • Cityscapes数据集与COCO数据集
  • Cityscapes数据集
  • COCO数据集
    • info字段
    • images字段
    • license字段
    • categories字段
    • annotation字段
  • 总结

Cityscapes数据集

Cityscapes是关于城市街道场景的语义理解图片数据集,它主要包含来自50个不同城市的街道场景,拥有5000张在城市环境中驾驶场景的高质量像素级注释图像(其中2975 用来训练,500用来验证,1525用来测试,共有19个类别)。样本数据都在gtFine文件夹和leftlmg8bit文件夹内。leftImg8bit文件夹有三个子目录:test,train以及val。这三个子目录的图片又以城市为单元来存放。gtFine下面也是分为train,test以及val,不同的是,在城市子目录下面,每张样本图片对应有6个标注文件,如下所示:

Cityscapes数据集与COCO数据集Cityscapes数据集与COCO数据集Cityscapes数据集COCO数据集总结

xxx_instanceIds.png是用来做实例分割训练用的,而xxx_labelsIds.png是语义分割训练需要的。它们的像素值就是class值。而最后一个文件xxx_polygons.json是用labelme工具标注后所生成的文件,里面主要记录了每个多边形标注框上的点集坐标。xxx_gtFine_instanceTrainIds.png和xxx_gtFine_labelTrainIds.png是生成的实际上这5000张精细标注的图片有34类,但训练时可能只想关心其中19类(0~18)。所以需要做一个映射来将34类中感兴趣的类别映射到19类中,其它不感兴趣的类别(ignore_label)就直接设成255。

COCO数据集

  • 以目标检测为例:其注释文件中的内容就是一个字典数据结构,包括以下5个key-value对。
    Cityscapes数据集与COCO数据集Cityscapes数据集与COCO数据集Cityscapes数据集COCO数据集总结

info字段

如上图所示包含description,url,version, year, contribution,date_created等基本信息。

images字段

包括下图中的内容,对应了每张图片的详细信息,其中的id号是被分配的唯一id。

Cityscapes数据集与COCO数据集Cityscapes数据集与COCO数据集Cityscapes数据集COCO数据集总结

license字段

包括下图中的内容,里面集合了不同类型的licenses,并在images中按照id号被引用,基本不参与到数据解析过程中。

Cityscapes数据集与COCO数据集Cityscapes数据集与COCO数据集Cityscapes数据集COCO数据集总结

categories字段

包括下图中的内容。其中supercategory是父类,name是子类,id是类别id(按照子类统计)。比如下图中所示的。COCO数据集共计有80个类别(按照name计算的)。

Cityscapes数据集与COCO数据集Cityscapes数据集与COCO数据集Cityscapes数据集COCO数据集总结

annotation字段

包括下面内容,每个序号对应一个注释,一张图片上可能有多个注释。

  • category_id:该注释的类别id;
  • id:当前注释的id号;
  • image_id:该注释所在的图片id号;
  • area:区域面积;
  • bbox:目标的矩形标注框;
  • iscrowd:0或1。0表示标注的单个对象,此时segmentation使用polygon表示;1表示标注的是一组对象,此时segmentation使用RLE格式。
  • segmentation:若使用polygon标注时,则记录的是多边形的坐标点,连续两个数值表示一个点的坐标位置,因此此时点的数量为偶数若使用RLE格式(Run Length Encoding(行程长度压缩算法))

总结

本文对两个常用的公开数据集进行了简单总结。Cityscapes和COCO均广泛应用于语义分割,实例分割以及全景分割的框架实验中。

继续阅读