仿真稳定性优化指南

人形机器人在 MuJoCo 中的仿真稳定性并非单一参数决定，而是时间积分器、约束求解器、接触动力学与关节被动阻尼四者耦合的结果。本页面向已掌握 MJCF 基础结构与关节动力学参数含义的高级开发者，系统阐述 Atom01 仿真模型在系统层面的稳定性设计原理、参数间的阻抗匹配关系，以及面对发散、穿透、高频抖动等典型故障时的诊断与调优策略。若你尚未熟悉 damping、frictionloss、armature 等关节级参数的物理意义，建议先阅读关节动力学参数调优。

Sources: atom01.xml

稳定性架构的四大支柱

MuJoCo 的隐式积分-约束耦合框架决定了稳定性问题通常呈现非局部特征：一个关节的速度爆炸可能源于地面接触 solref 过软，而足端穿透则可能由积分步长与关节阻尼不匹配引起。理解以下四个子系统之间的能量流与信息依赖关系，是进行定向优化的前提。

graph TB
    subgraph 时间域["时间域: Integrator"]
        T[timestep=0.001<br/>implicitfast]
    end
    subgraph 约束域["约束域: Solver"]
        S[PGS solver<br/>iterations=100]
    end
    subgraph 接触域["接触域: Contact"]
        C[solref=0.001 2<br/>condim=4 / 1<br/>friction=0.9 0.2 0.2]
    end
    subgraph 关节域["关节域: Joint"]
        J[damping=0.01<br/>frictionloss=0.01~0.05<br/>armature=0.01]
    end
    T -->|"稳定性上限"| S
    S -->|"残差收敛"| C
    C -->|"接触力反馈"| J
    J -->|"加速度响应"| T

上述闭环中，任意一个节点的参数失配都会通过反馈链路放大为全局不稳定。下文将按从全局到局部、从理论到实践的次序展开。

Sources: atom01.xml, atom01.xml

全局求解器配置与积分稳定性

option 元素定义了仿真世界的时间演进规则与约束求解预算。Atom01 采用 timestep="0.001"（1 kHz 仿真频率）与 solver="PGS"（Projected Gauss-Seidel）的组合，配合 iterations="100" 的每步迭代上限。这一配置在双足仿真的计算精度与实时性之间取得了工程平衡，但其稳定性边界有明确的数学约束。

PGS 作为一种迭代式线性互补问题（LCP）求解器，其收敛速度受接触问题规模与摩擦锥非线性度的双重影响。iterations="100" 意味着在典型单足支撑阶段（约 10~20 个活跃接触点），约束残差可以被充分压低至稳定阈值以下；但在双足同时触地且伴随地形高度场不规则接触时，活跃接触点可能激增，此时 100 次迭代可能逼近收敛临界点。若观察到足端在触地瞬间出现位置级抖动（非控制指令引起的高频振荡），首要诊断指标应为 mjData.solver_niter 或等效的迭代统计——若其持续逼近 100，则应优先提升 iterations 至 150~200，而非盲目减小 timestep。

timestep="0.001" 与当前刚体质量分布（总质量约 26 kg，躯干集中 7.58 kg）构成了一个关键的无量纲判据：最高频模态的周期应至少是步长的 10 倍以上。对于人形机器人，踝关节与足端的小质量连杆在触地时会激发局部高频振动，其有效惯量极低（如 left_ankle_pitch_link 质量仅 0.084 kg），对应的局部模态频率可达数百赫兹。1 kHz 的采样率恰好处于该模态的稳定捕获边界，这也是 ankle 关节被额外赋予 frictionloss="0.05" 的工程动因——通过增加关节级库仑摩擦耗散，将高频模态能量在关节域内衰减，避免其进入时间积分器的奈奎斯特不稳定区。

Sources: atom01.xml, atom01.xml, atom01.xml

size 元素中的 njmax="5000" 与 nconmax="1000" 定义了 MuJoCo 内部内存池的预分配规模。对于 23 个主动关节加 1 个浮动基座的模型，njmax=5000 为约束雅可比矩阵提供了充足冗余；nconmax=1000 则允许在极端情况下（如机器人倒地后多个连杆同时触地）维持最多约 1000 个接触点的并发计算。需要强调的是，这些数值是硬性上限而非性能目标——一旦活跃约束或接触点超过阈值，仿真将直接报错终止，而非降质运行。在地形场景中，由于 hfield 表面由大量微观三角面构成，足端可能产生比平地更多的亚稳接触点，因此当前 nconmax=1000 的配置不宜下调。

Sources: atom01.xml

接触动力学与约束阻抗匹配

接触稳定性是人形仿真中最易出现非物理行为的环节。Atom01 在 default 根级为所有连杆几何体配置了 solref="0.001 2"、condim="4" 与 friction="0.9 0.2 0.2"，而地面几何体则采用 condim="1"。这组差异化配置构成了一套层级化的接触阻抗体系。

接触约束的弹簧-阻尼模型

MuJoCo 中的 solref 遵循 [timeconst, dampratio] 的语义，将接触约束松弛过程建模为二阶弹簧-阻尼系统。timeconst=0.001 表示接触穿透的恢复时间常数为 1 ms，dampratio=2 则将该系统置于过阻尼状态。过阻尼设计的优势在于彻底消除接触建立阶段的振荡——当足端以非零速度触地时，接触力不会出现过冲，而是单调上升至稳态值。这对于依赖力控的步态算法至关重要，因为任何接触力振荡都会被控制器误读为外部扰动。

然而，过阻尼也意味着恢复速度较慢。若将 dampratio 降至 1.0（临界阻尼）以下以提升响应，必须同步降低 timestep 或提升 iterations，否则在 solver 迭代次数受限的情况下，接触残差无法收敛，反而导致足端"漂浮"或穿透。

Sources: atom01.xml

摩擦维度与接触点行为

condim（contact dimension）决定了摩擦锥的建模维度。机器人连杆统一使用 condim="4"，即同时建模法向接触、两个切向滑动摩擦与一个绕法向的扭转摩擦（torsional friction）。地面使用 condim="1" 则仅保留法向接触，这是因为在无限平面或高度场假设下，地面自身不发生旋转，绕法向的摩擦矩应由足端几何的 condim="4" 侧提供。

friction="0.9 0.2 0.2" 中的三个分量分别对应滑动摩擦系数、扭转摩擦系数与滚动摩擦系数。滑动摩擦 0.9 属于较高设定，确保足端在步行推离阶段不会产生非物理滑移；扭转摩擦 0.2 则用于抑制足端在触地时的自旋趋势。若在地形场景中观察到机器人在斜坡上发生足端"扭转打滑"（即足印方向与期望朝向持续偏离），可优先尝试将第二个分量提升至 0.3~0.5，而非调整地面摩擦——因为地面的 condim="1" 根本不参与摩擦矩计算。

Sources: atom01.xml, atom01.xml, atom01_terrain.xml

阻抗匹配原则：关节刚度 vs 接触刚度

稳定性故障的一个常见根因是关节域与接触域的刚度失配。当前关节的等效刚度由 armature 与 damping 间接决定，而接触刚度由 solref 的时间常数反推。若关节过于"软"（低 damping、低 armature）而接触过于"硬"（小 solref timeconst），接触冲击会激发关节的自由振动；反之，若关节过于"硬"而接触"软"，则机器人会表现出踩在海绵上的迟滞感。Atom01 的当前配置（damping=0.01、armature=0.01、solref=0.001 2）在平地场景下经过验证是匹配的，但在以下两种变体中可能需要重新平衡：

变体场景	症状	推荐调整	物理原理
强化学习训练，高增益力控	触地瞬间关节速度爆炸	提升 `armature` 至 0.02~0.05	增加电机电枢惯量，降低加速度灵敏度
地形场景，崎岖地面	足端高频抖动、接触力噪声大	放宽 `solref` 至 `0.002 2` 或提升 `iterations`	降低接触刚度，给 solver 更多收敛时间
低摩擦地面实验	持续滑移、PD 控制发散	降低 `solref` timeconst 至 0.0005，保持 dampratio=2	加快法向响应，确保法向力及时建立以支撑切向摩擦

Sources: atom01.xml, atom01.xml

传感器噪声的正则化效应

稳定性优化不仅关乎物理参数，还涉及观测通道的数值特性。Atom01 的 MJCF 为所有 23 个执行器配置了 actuatorfrc 力矩传感器，并统一注入 noise="1e-3" 的高斯白噪声；IMU 通道的噪声配置则按物理量差异化设置：gyro 为 0.005、accelerometer 为 0.005、framequat 与 framepos 为 0.001。

从控制理论视角看，这些噪声注入在仿真层面起到了隐式正则化作用。当控制器采用高增益反馈时，无噪声的精确力矩读数会导致控制律对数值误差极度敏感，进而通过执行器反向激励物理系统，形成"控制-仿真"耦合发散。noise="1e-3" 的存在强制控制器输出具备一定平滑性，其效果等价于在控制通道增加了约 0.1% 量级的信号带宽限制。对于强化学习训练，这一设计尤为重要：策略网络无法过度拟合到精确的力矩瞬态，从而学得更具鲁棒性的 motor primitive。

若开发者在调试阶段需要排除观测噪声对稳定性诊断的干扰（例如验证一次发散是由物理参数引起还是控制器噪声敏感引起），可临时将 actuatorfrc 的 noise 降为 0，但应在确认根因后恢复，避免训练策略与调试环境的行为漂移。

Sources: atom01.xml

平地与地形场景的稳定性差异

尽管 atom01.xml 与 atom01_terrain.xml 在求解器与关节参数上完全一致，地面几何的根本变化导致稳定性边界发生偏移。理解这些差异有助于避免在场景切换时产生"参数幻觉"——即误认为同一组控制参数在两个场景中应有等价表现。

graph LR
    subgraph 平地["atom01.xml 平地"]
        P1[plane 无限平面<br/>condim=1]
        P2[接触法向恒定 +Z]
        P3[基座高度 0.75m]
    end
    subgraph 地形["atom01_terrain.xml 地形"]
        H1[hfield 高度场<br/>PNG 位图驱动]
        H2[接触法向随局部曲面变化]
        H3[基座高度 2.75m]
    end
    P1 -->|"接触点规则<br/>solver 收敛快"| StableA["稳定性裕度高"]
    H1 -->|"接触点不规则<br/>多面片同时激活"| UnstableB["稳定性裕度低"]
    P2 -->|"力控分解简单"| StableA
    H2 -->|"需补偿坡度分量"| UnstableB

具体而言，地形场景中的 hfield 表面由大量微小三棱柱拼接而成。当 Atom01 的平底足端（ankle_roll_link 的网格几何）压在不规则坡面上时，同一足底可能同时激活 3~5 个不同高度的面片接触点，形成冗余约束系统。PGS 求解器在处理这种过约束问题时，收敛速度显著慢于平地单点接触。因此，在地形场景中若出现偶发的单步穿透或足端微弹跳，首先应验证是否为该帧的 solver 迭代耗尽所致，而非接触刚度或关节阻尼的问题。

此外，地形场景中 base_link 的初始高度为 2.75 m，意味着机器人从投放至触地需经历更长的自由落体阶段。落地冲击的动能与触地速度平方成正比，若保持平地场景中的接触参数不变，首次触地的冲击力峰值可能更高。对于需要从高处投放启动的训练流程，建议分阶段调优：先以 solref="0.002 2" 的较软接触参数完成落地稳定化，再逐步收紧至 0.001 2 进行精细步态训练。

Sources: atom01.xml, atom01_terrain.xml

稳定性诊断与调优工作流

面对仿真发散、穿透或抖动，高级开发者需要一套可复现的诊断逻辑，避免陷入随机调参。以下工作流基于 Atom01 的当前参数架构设计，按排查成本从低到高排列。

flowchart TD
    A[观察到不稳定现象] --> B{现象类型?}
    
    B -->|机器人整体飞散 / 关节速度 NaN| C[检查 timestep 与质量属性]
    B -->|足端穿透地面| D[检查 solref 与 iterations]
    B -->|足端高频抖动 / 嗡嗡声| E[检查 condim 与 friction 匹配]
    B -->|关节无故漂移 / 回落过慢| F[检查 damping 与 frictionloss]
    B -->|控制器输出震荡| G[检查 sensor noise 与 ctrlrange]
    
    C --> C1[质量是否为正? 惯量是否正定?<br/>确认 mesh 未生成负体积]
    C --> C2[timestep 是否 ≤ 0.001?<br/>若质量过小或刚度过高，尝试 0.0005]
    C1 --> H[修改 MJCF 后重载]
    C2 --> H
    
    D --> D1[solref timeconst 是否 ≥ timestep?<br/>当前 0.001 = timestep，处于临界]
    D --> D2[iterations 是否用尽?<br/>监控 solver_niter]
    D1 --> D3[尝试放宽至 0.002 或减小 timestep]
    D2 --> D4[尝试提升至 150~200]
    D3 --> H
    D4 --> H
    
    E --> E1[condim=4 的连杆与 condim=1 的地面<br/>摩擦锥维度是否冲突?]
    E --> E2[friction 系数是否过低导致<br/>切向约束反复激活/失效?]
    E1 --> H
    E2 --> H
    
    F --> F1[参考 关节动力学参数调优<br/>调整 damping / frictionloss / armature]
    F1 --> H
    
    G --> G1[临时关闭 actuatorfrc noise<br/>确认是否传感器噪声诱发控制震荡]
    G --> G2[ctrlrange 是否远超 URDF effort 极限?<br/>当前统一 ±200， ankle 仅 27 Nm]
    G1 --> H
    G2 --> H
    
    H --> I[使用 mjviz / render 验证<br/>单步后退观察接触力建立过程]
    I --> J{问题是否消除?}
    J -->|否| B
    J -->|是| K[记录参数变更与现象关联<br/>纳入回归测试集]

关键诊断指标速查表

现象	最直接相关参数	推荐调整方向	验证方法
整体发散 / NaN	`timestep`，惯性矩阵正定性	减小 timestep 至 0.0005；检查 STL mesh 体积	单步运行，打印 `qvel` 最大值
足端穿透	`solref[0]`，`iterations`	增大 timeconst 或 iterations	开启 MuJoCo 接触力可视化，观察力是否建立
触地高频振荡	`solref[1]`，`dampratio`	保持 ≥ 2，勿降至欠阻尼	频谱分析 `qvel` 或接触力时间序列
足端滑移	`friction[0]`（滑动摩擦）	提升至 1.0~1.2	观察足端世界坐标轨迹
足端自旋	`friction[1]`（扭转摩擦）	提升至 0.3~0.5	观察足底法向与机器人偏航角耦合
关节回弹过冲	`damping`，`armature`	同比例提升 0.01 → 0.02~0.05	撤除控制，观察关节自由衰减曲线
控制器噪声敏感	`actuatorfrc noise`	临时置 0 以隔离变量	对比有无 noise 时的控制输出方差

Sources: atom01.xml, atom01.xml, atom01.xml

参数调优的边界与禁忌

在 Atom01 的现有架构下进行稳定性优化时，以下操作属于高风险变更，除非有明确的理论依据，否则不建议在基线模型上直接实施：

将 PGS 切换为 CG / Newton 求解器：虽然后两者在理论收敛速度上优于 PGS，但 MuJoCo 的 CG 求解器对摩擦锥非线性问题的处理存在已知 corner case，对于 condim="4" 的多维摩擦可能产生伪解。若确有需求，应在平地场景下通过完整的步态回归测试后再迁移至地形场景。
将 condim="4" 降为 condim="3" 以节省计算：condim="3" 省略了扭转摩擦，会导致足端在触地时出现非物理自旋，进而使 IMU 的偏航角观测产生累积漂移。
将全局 timestep 提升至 0.002 以上：以当前质量分布与接触刚度，0.002 s 的步长将越过踝关节局部模态的稳定捕获边界，触发高频数值失稳。
统一降低所有 frictionloss 至 0：当前 option 中已显式启用 frictionloss="enable" 标志，若将关节 frictionloss 设为 0，意味着足端与地面之间仅保留几何摩擦而无关节内部耗散，这在斜坡场景中极易诱发极限环振荡。

Sources: atom01.xml, atom01.xml

下一步阅读建议

完成系统级稳定性参数的掌握后，建议根据当前开发阶段选择深入方向：若正在构建强化学习训练管线，需要理解观测噪声、控制延迟与仿真-现实迁移的完整链路，请继续阅读强化学习训练集成要点；若需将 Atom01 部署至 ROS 2 / Gazebo 生态进行硬件在环验证，涉及不同物理引擎（ODE / Bullet / DART）的稳定性参数重映射，请参阅与 ROS 2 / Gazebo 的集成使用。对于希望回溯 MJCF 与 URDF 在接触参数格式差异上的开发者，URDF 到 MJCF 的映射与差异提供了跨格式维护的校验清单。