机器学习和深度学习--李宏毅（笔记与个人理解）Day11-12-CFANZ编程社区

机器学习和深度学习--李宏毅（笔记与个人理解）Day11-12

using Math

图2024-4-11

前面有讲到这里, 前倾回归

shuffle ：有可能batch结束后，就会重新分一次batch

未考虑平行运算（并行 --gpu）

Aspect	Small Batch Size（100个样本）	Large Batch Size（10000个样本）
Speed for one update (no parallel)	Faster	Slower
Speed for one update (with parallel)	Same	Same (not too large)
Time for one epoch	Slower	Faster
Gradient	Noisy	Stable
Optimization	Better	Worse
Generalization	Better	Worse