📚 RSL-RL
RSL-RL 训练库 (PPO) · 共 21 篇
快速上手
深入原理
核心算法
- PPO 算法实现与训练流程Intermediate
- AMP 对抗动作先验算法Advanced
- 策略蒸馏与师生框架Intermediate
策略网络架构
- Actor-Critic 基础架构设计Intermediate
- 循环与注意力策略变体Advanced
- CNN 观测编码与特征提取Intermediate
数据与存储
- Rollout 数据存储与 TransitionIntermediate
- 经验采样与小批量生成Intermediate
训练基础设施
- 训练运行器生命周期管理Intermediate
- 向量化环境抽象接口Intermediate
- 多 GPU 分布式训练机制Advanced
高级训练特性
- 对称性增强与镜像损失Advanced
- RND 随机网络蒸馏探索Advanced
- 自适应学习率与 KL 调度Intermediate
工具与监控
- 日志系统与可视化集成Beginner
- 模型保存、加载与推理部署Intermediate
- 观测归一化与网络工具函数Intermediate