当我们在谈论图像竞赛EDA时在谈论些什么
# 常用的EDA(Exploratory Data Analysis)
1、是否存在类别不平衡现象
2、在划分多折训练测试集时,要针对不同任务做细致考量
- 目标检测:要考虑目标检测框的数量分布,种类分布,甚至面积大小分布
- 图像分类:需要考虑类别不平衡(或长尾数据)的现象
3、在做目标检测任务时,通常需要先统计目标检测框的数量分布,类别分布,框面积分布,框长宽比分布
4、查找重复图像
- https://www.kaggle.com/stehai/duplicate-images
- https://www.kaggle.com/martinpiotte/whale-recognition-model-with-score-0-78563
5、图片的文字信息、图片的 EXIF 时间信息
- https://www.kaggle.com/toshik/older-images-tend-to-be-new-whale
上次更新: 2021/09/12, 20:42:58
- 02
- README 美化05-20
- 03
- 常见 Tricks 代码片段05-12