HoST Framework
Project Overview
HoST is a high-performance operational-space tracking framework enabling stable, responsive, and coordinated whole-body behaviors under multi-contact scenarios.
核心技术:
- ✓ 多评论家强化学习:通过对奖励进行分组,降低复杂奖励函数带来的训练难度。
- ✓ 课程学习:先在上拉力辅助下探索,再逐步减弱辅助,实现平滑过渡。
- ✓ 动作约束:结合动作缩放器(rescaler)与平滑正则化,提升动作的稳定性与可控性。
- ✓ 域随机化:在多种地形与参数扰动下训练,增强策略的泛化能力。
训练策略:
- ✓ 三阶段奖励机制:分为翻身、直立、保持站立三个阶段,逐层引导策略学习。
- ✓ 多环境并行训练:在地面、平台、斜坡和障碍等多样环境中同时训练,提高鲁棒性。
Ground get-up
Chair get-up
Platform get-up
Prone get-up
Wall get-up