🤖 roboto_origin_03 Wiki
首页 / 训练

🏋️ 训练

Isaac Lab / RL 策略训练 · 共 24 篇

快速开始

  1. 项目概览与核心价值Beginner
  2. 环境搭建与快速运行Beginner
  3. 项目结构导读Beginner
  4. 训练你的第一个策略Beginner
  5. 策略测试与 Sim2Sim 部署Intermediate

深入解析

足式机器人环境设计
  1. Direct RL 环境架构Intermediate
  2. Manager-based 环境架构Advanced
  3. 地形生成与场景配置Intermediate
  4. 奖励函数与 MDP 设计Intermediate
  5. 事件管理与指令系统Intermediate
机器人资产与运动数据
  1. ATOM01 机器人模型配置Intermediate
  2. 运动数据重定向与数据集准备Advanced
RSL-RL 算法库
  1. PPO 核心算法与超参数Intermediate
  2. Actor-Critic 网络架构详解Advanced
  3. 注意力编码器感知机制Advanced
  4. AMP 对抗运动先验算法Advanced
  5. RND 好奇心探索与对称性增强Advanced
  6. 学生-教师蒸馏框架Advanced
训练与部署管线
  1. On-Policy Runner 训练循环Intermediate
  2. AMP Runner 与模仿学习训练Advanced
  3. 分布式多卡训练配置Advanced
  4. MuJoCo Sim2Sim 部署与真机迁移Advanced
扩展开发
  1. 自定义任务与环境扩展指南Advanced
  2. 工具脚本与调试技巧Intermediate