残差网络(ResNet)详解
残差网络(Residual Network,ResNet)是一种深度神经网络架构,由何恺明等人于2015年提出,旨在解决深度网络训练中的退化问题(即随着网络加深,训练误差反而增大)。以下是其核心内容:
核心思想
- 退化问题的根源
- 传统深度网络(如VGG)在层数增加时,训练误差不降反升。这并非过拟合,而是由于梯度消失/爆炸导致优化困难。
-
更深的网络理论上应能拟合更简单的函数(如恒等映射),但实际训练中难以学习到这种映射。
-
残差学习(Residual Learning)
- 核心公式:
[ H(x) = F(x) + x ]
其...
(注:此处可插入典型AutoML系统架构图)