theta0 初始点优化器从同一个起点出发。起点离低谷越远,轨迹越长,也更容易看出不同优化器的路径差异。
learningRate 学习率控制每一步移动距离。过小会收敛慢,过大可能越过低谷并震荡。
steps 迭代步数步数越多,轨迹越完整;步数太少只能看到优化早期行为。
optimizer 优化器SGD 只看当前梯度,Momentum 会积累速度,Adam 会根据梯度历史自适应调整步幅。
页面读取 fixture.json,pytest 也读取同一份文件校验梯度;动画和测试共用同一组初始点、步数与检查点。