冲量法(Momentum Method)也称为动量法,是一种在机器学习优化算法中常用的技术,尤其在随机梯度下降(SGD)及其变体的优化过程中被广泛应用。以下是对其的详细介绍:
基本原理
- 借鉴物理概念:冲量法借鉴了物理学中的动量概念,它考虑了之前梯度更新的历史信息,就像物体在运动中具有惯性一样,在优化过程中引入了一个动量项来加速收敛并减少震荡。
- 更新规则:在每次迭代中,不仅根据当前的梯度来更新参数,还会考虑上一次更新的方向和大小,即动量。具体来说,它会将当前梯度与之前积累的动量进行加权求和,然后再根据这个和来更新参数。
数学表达式
- 设参数为(\theta),学习率为(\alpha),...