项目
v9j
v9j-3
人眼看到的差别
训练起点
resume from model_1998.pt
from scratch, resume=false
v9j-3 不是“接着 v9j 变强”,而是重练。
训练地形
低楼梯 + 反向低楼梯,50% / 50%
gap / hurdle / flat / step / stairs / parkour 混合
v9j-3 画面更乱,因为训练任务本来就更分散。
高度范围
stair step height 0.00-0.12 m
step 0.10-0.45 m; stairs 0.05-0.25 m
v9j-3 直接面对更高障碍,但不等于学会了。
训练规模
4096 envs, resume extension to model_7997
2048 envs, 10000 iter, model_9999
v9j-3 训练更久,但并行样本少,任务更难。
最终信号
terrain level 5.3216; bad orientation 0.0197
terrain level 2.7352; bad orientation 0.2550
v9j-3 更容易姿态崩,没过自己 >3 的成功线。