Muyun99's wiki Muyun99's wiki
首页
学术搬砖
学习笔记
生活杂谈
wiki搬运
资源收藏
关于
  • 分类
  • 标签
  • 归档
GitHub (opens new window)

Muyun99

努力成为一个善良的人
首页
学术搬砖
学习笔记
生活杂谈
wiki搬运
资源收藏
关于
  • 分类
  • 标签
  • 归档
GitHub (opens new window)
  • 代码实践-目标检测

  • 代码实践-图像分割

    • 基于深度学习的图像分割技术
    • 领域自适应
    • 如何计算一个模型的FPS,Params,GFLOPs
    • 常见数据集的相关知识
      • 如何加载数据集
      • 半监督与弱监督图像分割
      • PASCAL VOC 2012调色板 color map生成源代码分析
      • 语义分割数据集灰度分割图转彩色分割图代码
      • 复现PSA
      • 转换cityscapes 到对应的类别
      • 上采样函数
      • DeepLab系列代码
      • mIoU的计算
      • Multi-label 分类中如何计算 mAP
    • 代码实践-自监督学习

    • 竞赛笔记-视觉竞赛

    • 框架解析-mmlab系列

    • 讲座记录-有意思的文章集合

    • 体会感悟-产品沉思录观后有感

    • 体会感悟-摄影

    • 系列笔记-

    • 系列笔记-乐理和五线谱

    • 系列笔记-爬虫实践

    • 系列笔记-Django学习笔记

    • 系列笔记-Git 使用笔记

    • 系列笔记-网站搭建

    • 系列笔记-图卷积网络

    • 课程笔记-MIT-NULL

    • 系列笔记-OpenCV-Python

    • 系列笔记-使用 Beancount 记账

    • 系列笔记-Python设计模式

    • 系列笔记-MLOps

    • 系列笔记-Apollo自动驾驶

    • 系列笔记-PaddlePaddle

    • 系列笔记-视频操作

    • Vue+Django前后端分离开发

    • 深度学习及机器学习理论知识学习笔记

    • PyTorch Tricks

    • 学习笔记
    • 代码实践-图像分割
    Muyun99
    2021-05-07

    常见数据集的相关知识

    # 1、Cityscapes 数据集

    Cityscapes 是从五十个不同城市的街景视频序列中记录的数据集,拥有5000帧精细标注的图像,以及20000帧弱标注的图像。官方介绍中该数据集旨在用于:

    • 评估计算机视觉算法在城市场景理解主要任务上的性能,包含语义级、实例级和全景语义级别
    • 支持旨在利用大量弱标记数据的算法研究
    • 在CVPR 2020 的论文中,Cityscapes 数据集也拓展了 3D 边界框的标记
    • Cityscapes 数据集官网:https://www.cityscapes-dataset.com/
    • Cityscapes 数据集下载地址:https://www.cityscapes-dataset.com/downloads/

    以下是 Fine annotations 和 Coarse annotations 的示例,在Fine annotations 中有 2975 张用于训练和,500 张用于验证,以及 1525 张用于测试。在Coarse annotations 中,有额外的 19998 张带噪标记的图像。此外还有带GPS、温度等元数据的数据集,此处不再介绍。

    image-20210415171250335

    image-20210415171524951

    img

    # 2、VOC 数据集

    PASCAL VOC 挑战赛全称是 “Pattern Analysis, Statical Modeling and Computational Learning Visual Object Classes",PASCAL 是欧盟赞助的组织。这个竞赛从 2005 年办到了 2012 年,比较常用的数据集有 VOC 2007 以及VOC 2012

    • PASCAL VOC 官网:http://host.robots.ox.ac.uk:8080/pascal/VOC/
    • PASCAL VOC 2007:http://host.robots.ox.ac.uk:8080/pascal/VOC/voc2007/index.html
    • PASCAL VOC 2012:http://host.robots.ox.ac.uk:8080/pascal/VOC/voc2012/index.html

    下面简要介绍以下两个数据集的区别:

    年份 数据统计 新内容 备注
    2007 共有二十个类别:
    Person: person
    Animal: bird, cat, cow, dog, horse, sheep
    Vehicle: aeroplane, bicycle, boat, bus, car, motorbike, train
    Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor
    共有9963张图像,包含了 24640 个带注释的目标
    类别从10增加到20;支持分割任务;在注释中加入截断标志;分类任务的评估方法改为Average Precision,以前是 ROC-AUC 设立了20个类别,该数量将固定下来,并且这是为测试数据发布注释的最后一年
    2012 共有二十个类别,训练集和验证集共包含11530张图像,包含27450个ROI 注释,以及6929个分割标签 分割数据集的规模显著增加;动作分类数据集中的人像带有身体关键点的标注 分类,检测以及person layout的数据集和 VOC2011 一样

    根据官网的分割 Examples (opens new window) 中所介绍的,类别索引是根据字典序来的:

    (1=aeroplane, 2=bicycle, 3=bird, 4=boat, 5=bottle, 6=bus, 7=car , 8=cat, 9=chair, 10=cow, 11=diningtable, 12=dog, 13=horse, 14=motorbike, 15=person, 16=potted plant, 17=sheep, 18=sofa, 19=train, 20=tv/monitor)
    
    1

    在这篇 知乎文章 (opens new window) 中有PASCAL VOC 数据集类别到调色板的映射

    img

    4、PASCAL VOC 2012 Aug

    额外的数据来自论文《Semantic Contours from Inverse Detectors》

    • https://people.cs.umass.edu/~smaji/papers/contours-iccv11.pdf
    • http://home.bharathh.info/pubs/codes/SBD/download.html

    下面讲述以下如何将原始的PASCAL VOC 2012数据集和增强版的数据集合并到一起

    VOCdevkit/VOC2012为原始PASCAL VOC 2012数据集

    • images数据集的文件名为:JPEGImages,共17125张图片(其中2913张用于分割)
    • labels数据集文件名为:SegmentationClass,共2913张图片
    • 其中官方划分的train.txt 有1464张,val.txt有1449,测试集有1456张

    benchmark_RELEASE为增强数据集

    • images数据集的文件名为:img,共11355张图片
    • labels数据集文件名为:inst,共11355张图片,为mat格式的(matlab格式)
    • 其中官方划分的train.txt 有8498张,val.txt有2857张

    voc数据集标签:voc_trainval:2913 ,voc_train:1464,voc_val:1449

    sbd数据集标签:sbd_train:8498,sbd_val:2857

    sbd_train(8498)`=`和voc_train重复的图片(1133)`+`和voc_val重复的图片(545)`+`sbd_train真正补充的图片(6820)
    
    1
    sbd_val(2857)`=`和voc_train重复的图片(1)`+`和voc_val重复的图片(558)`+`sbd_val真正补充的图片(2298)
    
    1

    所以可以得到的最大的扩充数据集应为:

    voc_train(1464)+voc_val(1449)+sbd_train真正补充的图片(6820)+sbd_val真正补充的图片(2298)=12031张标注图

    用原来的voc_val(1449)作为验证集,剩下的12031-voc_val(1449)=10582都可以用作训练,就是trainaug(10582)

    合并之后的trainaug.txt 一共有10582张训练数据

    • https://gist.githubusercontent.com/sun11/2dbda6b31acc7c6292d14a872d0c90b7/raw/5f5a5270089239ef2f6b65b1cc55208355b5acca/trainaug.txt

    参考资料:

    • https://blog.csdn.net/lscelory/article/details/98180917
    • https://www.sun11.me/blog/2018/how-to-use-10582-trainaug-images-on-DeeplabV3-code/

    # 4、ADE20k 数据集

    # 5、COCO数据集

    上次更新: 2021/08/02, 21:04:52
    如何计算一个模型的FPS,Params,GFLOPs
    如何加载数据集

    ← 如何计算一个模型的FPS,Params,GFLOPs 如何加载数据集→

    最近更新
    01
    Structured Knowledge Distillation for Semantic Segmentation
    06-03
    02
    README 美化
    05-20
    03
    常见 Tricks 代码片段
    05-12
    更多文章>
    Theme by Vdoing | Copyright © 2021-2023 Muyun99 | MIT License
    • 跟随系统
    • 浅色模式
    • 深色模式
    • 阅读模式
    ×