梯度下降优化器轨迹对比

页面读取 fixture.json，pytest 也读取同一份文件校验梯度；动画和测试共用同一组初始点、步数与检查点。

theta0 初始点优化器从同一个起点出发。起点离低谷越远，轨迹越长，也更容易看出不同优化器的路径差异。

learningRate 学习率控制每一步移动距离。过小会收敛慢，过大可能越过低谷并震荡。

steps 迭代步数步数越多，轨迹越完整；步数太少只能看到优化早期行为。

optimizer 优化器SGD 只看当前梯度，Momentum 会积累速度，Adam 会根据梯度历史自适应调整步幅。

返回可视化入口

step: 0 Space 播放/暂停 · R 重置