LeCAR-Lab/BFM-Zero

机器人 ⭐⭐⭐☆☆ (3/5) 🧩 软硬件结合 已发布
LeCAR-Lab 200 Stars 未知 BOM 完整度: /5 教程完整度: /5

项目简介

BFM_Zero: A Promptable Behavioral Foundation Model for Humanoid Control Using Unsupervised Reinforcement Learning


BFM-Zero 是一个面向人形机器人控制的提示式行为基础模型,由 LeCAR Lab 团队开发。该项目通过无监督强化学习训练,使机器人能够根据文本或运动提示灵活执行多种复杂动作,无需为每个任务单独设计奖励函数。核心创新在于将行为建模为可提示的潜在空间,用户只需提供目标运动轨迹或任务描述,模型即可自动生成对应的控制策略。技术栈方面,项目基于 Python 3.10 开发,支持 Isaac Sim 和 MuJoCo 两种仿真环境,使用 Git LFS 管理运动数据,并通过 uv 工具管理依赖。训练流程采用并行环境采样和离策略学习,关键参数如环境数量、缓冲区大小、学习率等均可灵活配置。推理阶段提供三种模式:运动跟踪(复现给定轨迹)、目标到达(生成到达指定位置的动作)和奖励任务(基于奖励函数优化行为),所有模式均支持导出 ONNX 格式模型用于实际部署。BFM-Zero 主要解决了人形机器人控制中任务泛化性差、奖励工程繁琐的问题,适用于需要快速切换多种行为模式的场景,如家庭服务、工业巡检和科研实验。项目代码分阶段开源,目前已发布预训练权重、最小推理代码和完整训练流程,未来还将提供支持 RTX 4090 的轻量训练版本。

标签