Muyun99's wiki Muyun99's wiki
首页
学术搬砖
学习笔记
生活杂谈
wiki搬运
资源收藏
关于
  • 分类
  • 标签
  • 归档
GitHub (opens new window)

Muyun99

努力成为一个善良的人
首页
学术搬砖
学习笔记
生活杂谈
wiki搬运
资源收藏
关于
  • 分类
  • 标签
  • 归档
GitHub (opens new window)
  • 代码实践-目标检测

  • 代码实践-图像分割

  • 代码实践-自监督学习

  • 竞赛笔记-视觉竞赛

  • 框架解析-mmlab系列

  • 讲座记录-有意思的文章集合

  • 体会感悟-产品沉思录观后有感

  • 体会感悟-摄影

  • 系列笔记-

  • 系列笔记-乐理和五线谱

  • 系列笔记-爬虫实践

  • 系列笔记-Django学习笔记

  • 系列笔记-Git 使用笔记

  • 系列笔记-网站搭建

  • 系列笔记-图卷积网络

  • 课程笔记-MIT-NULL

  • 系列笔记-OpenCV-Python

  • 系列笔记-使用 Beancount 记账

  • 系列笔记-Python设计模式

  • 系列笔记-MLOps

    • 关于MLOps
    • (Notes) A Chat with Andrew on MLOps From Model-centric to Data-centric AI
    • 常用的数据治理手段
      • 深度学习中常用的数据治理手段
  • 系列笔记-Apollo自动驾驶

  • 系列笔记-PaddlePaddle

  • 系列笔记-视频操作

  • Vue+Django前后端分离开发

  • 深度学习及机器学习理论知识学习笔记

  • PyTorch Tricks

  • 学习笔记
  • 系列笔记-MLOps
Muyun99
2021-09-02

常用的数据治理手段

# 深度学习中常用的数据治理手段

维护一个数据版本

# 工程方面:

1、统一的数据读取接口

# 特性方面:

1、数据离线增强

  • 数据增广

  • 亮度调整

  • 图像去噪

  • 以及从数据中挖掘到的应当用的增强方式

2、标注是否存在噪声

  • NLKD
  • Label Smooth
  • O2U-Net

3、是否存在类别不平衡的现象

  • 过采样/降采样
  • 平均采样(例如 ReID 中在一个 batch 中需要按照 id 来训练,效果会好一些)

4、是否存在类别之间难易程度不均衡的问题

  • Focal loss

  • OHEM

  • S-OHEM

  • GHM

上次更新: 2021/09/05, 19:05:19
(Notes) A Chat with Andrew on MLOps From Model-centric to Data-centric AI
Apollo 核心模块

← (Notes) A Chat with Andrew on MLOps From Model-centric to Data-centric AI Apollo 核心模块→

最近更新
01
Structured Knowledge Distillation for Semantic Segmentation
06-03
02
README 美化
05-20
03
常见 Tricks 代码片段
05-12
更多文章>
Theme by Vdoing | Copyright © 2021-2023 Muyun99 | MIT License
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式
×