Tron1A Point-Foot Biped Locomotion
Project Overview
This project develops locomotion for a point-foot biped platform (Tron1A), focusing on state estimation, gait generation, and stability under disturbances.
核心技术
- ✓ 强化学习策略训练:采用基于物理的强化学习方法,在仿真环境中训练机器人学会行走步态,重点解决了点足接触下的平衡与推进问题。
- ✓ 奖励函数设计:通过合理设置奖励项(如步态稳定性、能量效率、身体姿态控制),保证机器人不仅能走直路,还能应对地形起伏。
- ✓ 复杂地形测试:实验中,机器人能够在台阶、斜坡、非平整表面等地形上保持稳定行走,验证了策略的泛化能力。
训练策略
- ✓ 课程学习:先在平坦地形上训练基本步态,然后逐步增加地形复杂度(如斜坡、台阶、不规则地形),让机器人逐层掌握稳定性与适应性。
- ✓ 域随机化:在训练过程中引入不同的摩擦系数、地形高度差和外部扰动,以提升策略的鲁棒性和泛化能力。
- ✓ 多步预测与延迟奖励:结合短期步态奖励和长期稳定性奖励,引导机器人在保持动态平衡的同时优化能量效率。
All Terrains 1
All Terrains 2