TRAIN
训练主力
AutoDL 4090
IsaacLab / RSL-RL 训练,承载机器狗长迭代任务。
GPU RTX 4090
用途 训练 / checkpoint
状态 等待主机证据
先看哪些机器能用、能支撑哪些研究项目,再进入具体训练现场看曲线、视频和证据。
IsaacLab / RSL-RL 训练,承载机器狗长迭代任务。
通过受控中转接入的新训练服务器,准备承载后续机器狗训练任务。
实时推理、WebRTC 画面与模型回放,适合看策略表现。
控制 API、视频服务与页面入口的受控访问节点。
四足机器人运动控制,IsaacLab + RSL-RL。展示训练曲线、checkpoint、日志尾部、训练画面和推理回放。
森林导航实验与 trial 结果展示,后续可接路径、地图、baseline 对比和一次性 trial 证据。
深度 Q 网络训练与论文实验归档,可做 run 对比、指标曲线和产物索引。
全局路径规划任务,适合后续接入地图、轨迹、搜索代价和规划结果对比。
GPU、主机、进程是否可用
迭代、曲线、失败信号
checkpoint、日志、source manifest
仿真画面和推理回放
—
—
等待日志尾部。
网站健康状态未知
控制 API 未连接
真机后端未连接
画面流未连接
训练诊断等待中
| 服务器 | GPU | 用途 | 连接方式 | 状态 |
|---|---|---|---|---|
| AutoDL 4090 | RTX 4090 | IsaacLab 训练 (machine-dog) | ssh -p 20230 root@connect.nmb1... |
训练资源 |
| gpufree | RTX 4090 | 新增训练资源 (machine-dog) | ssh gpufree |
受控中转 / SSH 可用 |
| 5070Ti 主机 | RTX 5070Ti | 实时推理 / WebRTC 画面推流 | 受控中转 |
视频资源 |
| 公网入口 | 中继 | Nginx 反代 + 中继 API + MediaMTX | 本地 SSH alias |
公网入口 |
| 端点 | 功能 | 方法 |
|---|---|---|
/api/status | 系统状态 + 运行时信息 | GET |
/api/training-diagnostics | 训练诊断、曲线、日志尾部、checkpoint | GET |
/api/host-status | 主机 GPU/进程状态 | GET |
/api/command | 发送控制指令 | POST |
/api/command-ws | WebSocket 实时控制 | WS |
/api/video.mjpg | MJPEG 视频流 | GET |
/healthz | 健康检查 | GET |