Cityscapes数据集与COCO数据集Cityscapes数据集与COCO数据集Cityscapes数据集COCO数据集总结

2023-07-15 16:38:04

Cityscapes数据集与COCO数据集

对两个公开数据集的简要概述。

文章目录

Cityscapes数据集与COCO数据集
Cityscapes数据集
COCO数据集
- info字段
- images字段
- license字段
- categories字段
- annotation字段
总结

Cityscapes数据集

Cityscapes是关于城市街道场景的语义理解图片数据集，它主要包含来自50个不同城市的街道场景，拥有5000张在城市环境中驾驶场景的高质量像素级注释图像（其中2975 用来训练，500用来验证，1525用来测试，共有19个类别）。样本数据都在gtFine文件夹和leftlmg8bit文件夹内。leftImg8bit文件夹有三个子目录：test，train以及val。这三个子目录的图片又以城市为单元来存放。gtFine下面也是分为train，test以及val，不同的是，在城市子目录下面，每张样本图片对应有6个标注文件，如下所示：

Cityscapes数据集与COCO数据集Cityscapes数据集与COCO数据集Cityscapes数据集COCO数据集总结

xxx_instanceIds.png是用来做实例分割训练用的，而xxx_labelsIds.png是语义分割训练需要的。它们的像素值就是class值。而最后一个文件xxx_polygons.json是用labelme工具标注后所生成的文件，里面主要记录了每个多边形标注框上的点集坐标。xxx_gtFine_instanceTrainIds.png和xxx_gtFine_labelTrainIds.png是生成的实际上这5000张精细标注的图片有34类，但训练时可能只想关心其中19类(0~18)。所以需要做一个映射来将34类中感兴趣的类别映射到19类中，其它不感兴趣的类别（ignore_label）就直接设成255。

COCO数据集

以目标检测为例：其注释文件中的内容就是一个字典数据结构，包括以下5个key-value对。

Cityscapes数据集与COCO数据集Cityscapes数据集与COCO数据集Cityscapes数据集COCO数据集总结

info字段

如上图所示包含description，url，version， year， contribution，date_created等基本信息。

images字段

包括下图中的内容，对应了每张图片的详细信息，其中的id号是被分配的唯一id。

Cityscapes数据集与COCO数据集Cityscapes数据集与COCO数据集Cityscapes数据集COCO数据集总结

license字段

包括下图中的内容，里面集合了不同类型的licenses，并在images中按照id号被引用，基本不参与到数据解析过程中。

Cityscapes数据集与COCO数据集Cityscapes数据集与COCO数据集Cityscapes数据集COCO数据集总结

categories字段

包括下图中的内容。其中supercategory是父类，name是子类，id是类别id（按照子类统计）。比如下图中所示的。COCO数据集共计有80个类别（按照name计算的）。

Cityscapes数据集与COCO数据集Cityscapes数据集与COCO数据集Cityscapes数据集COCO数据集总结

annotation字段

包括下面内容，每个序号对应一个注释，一张图片上可能有多个注释。

category_id：该注释的类别id；
id：当前注释的id号；
image_id：该注释所在的图片id号；
area：区域面积；
bbox：目标的矩形标注框；
iscrowd：0或1。0表示标注的单个对象，此时segmentation使用polygon表示；1表示标注的是一组对象，此时segmentation使用RLE格式。
segmentation：若使用polygon标注时，则记录的是多边形的坐标点，连续两个数值表示一个点的坐标位置，因此此时点的数量为偶数若使用RLE格式(Run Length Encoding(行程长度压缩算法))

总结

本文对两个常用的公开数据集进行了简单总结。Cityscapes和COCO均广泛应用于语义分割，实例分割以及全景分割的框架实验中。

Cityscapes数据集与COCO数据集Cityscapes数据集与COCO数据集Cityscapes数据集COCO数据集总结

Cityscapes数据集与COCO数据集

文章目录

Cityscapes数据集

COCO数据集

info字段

images字段

license字段

categories字段

annotation字段

总结

继续阅读

2021年银行从业考试考情介绍,果断收藏!

证券从业合格证书什么时候打印？有哪些注意事项？

【干货满满】初级银行从业考试《个人理财》重点梳理

2020年经济师考试，难吗？

初级银行从业资格证有什么用？

MBA提前面试纯干货分享

MBA值得学么

通俗理解查准率(precision)和查全率(recall)

吴恩达logistic回归实现

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

深度学习模型分析人类复杂疾病的准确性

人工智能如何有效地运用于自然语言处理

【趋高机器视觉】机器视觉技术原理解析及解决方案

吴恩达 coursera ML 第七课总结+作业答案前言目录正文模型表示作业答案

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

cs231n斯坦福基于卷积神经网络的CV学习笔记（一）KNN和线性分类器/分类器损失/反向传播一，KNN图像分类算法二，线性分类器三，线性分类器损失四，反向传播五，神经网络