An Image is Worth 16x16 Words Transformers for Image Recognition at Scale
# An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale.
# 单位:Google Research, Brain Team
# 作者:Alexey Dosovitskiy, Neil Houlsby
# 发表:ICLR 2020
# 摘要
# 阅读
# 论文的目的及结论
# 论文的实验
# 论文的方法
# 总结
# 论文的贡献
论文主要是针对弱监督语义分割提出了 Puzzle 模块,将原始图像分块后再算一个CAMs,并与原始的 CAMs 做一个重建损失,三项损失联合优化分类网络,提升 CAMs 的精度。
# 论文的不足
# 论文如何讲故事
# 参考资料
上次更新: 2023/03/25, 19:58:09
- 02
- README 美化05-20
- 03
- 常见 Tricks 代码片段05-12