（2020李宏毅）机器学习- Gradient Descent-CFANZ编程社区

（2020李宏毅）机器学习- Gradient Descent_缩放

Review: Gradient Descent

（2020李宏毅）机器学习- Gradient Descent_缩放_02

Randomly start at （2020李宏毅）机器学习- Gradient Descent_微积分_03

（2020李宏毅）机器学习- Gradient Descent_微积分_04

（2020李宏毅）机器学习- Gradient Descent_微积分_05

Adagrad
（2020李宏毅）机器学习- Gradient Descent_机器学习_06

（2020李宏毅）机器学习- Gradient Descent_深度学习_12

（2020李宏毅）机器学习- Gradient Descent_微积分_13

（2020李宏毅）机器学习- Gradient Descent_机器学习_14

面对特征数量较多的时候，保证这些特征具有相近的尺度（无量纲化），可以使梯度下降法更快的收敛。这两张图代表数据是否均一化的最优解寻解过程（左边是未归一化的），

从这两张图可以看出，数据归一化后，最优解的寻优过程明显会变得平缓，更容易正确的收敛到最优解

（2020李宏毅）机器学习- Gradient Descent_机器学习_15

（2020李宏毅）机器学习- Gradient Descent_深度学习_16

对红色框里面的（2020李宏毅）机器学习- Gradient Descent_深度学习_17 进行特征缩放，就要先求出绿框里面元素的平均值,再求出绿框里面元素的标准差,最后代入

求解（2020李宏毅）机器学习- Gradient Descent_机器学习_21
梯度下降的理论推导过程：

数学基础：
Taylor Series