HoST Framework

Operational Space Multi-Contact Realtime

Project Overview

HoST is a high-performance operational-space tracking framework enabling stable, responsive, and coordinated whole-body behaviors under multi-contact scenarios.


核心技术:

  • ✓ 多评论家强化学习:通过对奖励进行分组,降低复杂奖励函数带来的训练难度。
  • ✓ 课程学习:先在上拉力辅助下探索,再逐步减弱辅助,实现平滑过渡。
  • ✓ 动作约束:结合动作缩放器(rescaler)与平滑正则化,提升动作的稳定性与可控性。
  • ✓ 域随机化:在多种地形与参数扰动下训练,增强策略的泛化能力。

训练策略:

  • ✓ 三阶段奖励机制:分为翻身、直立、保持站立三个阶段,逐层引导策略学习。
  • ✓ 多环境并行训练:在地面、平台、斜坡和障碍等多样环境中同时训练,提高鲁棒性。