待补充 - iMakething

项目简介

BFM_Zero: A Promptable Behavioral Foundation Model for Humanoid Control Using Unsupervised Reinforcement Learning

BFM-Zero 是一个面向人形机器人控制的提示式行为基础模型，由 LeCAR Lab 团队开发。该项目通过无监督强化学习训练，使机器人能够根据文本或运动提示灵活执行多种复杂动作，无需为每个任务单独设计奖励函数。核心创新在于将行为建模为可提示的潜在空间，用户只需提供目标运动轨迹或任务描述，模型即可自动生成对应的控制策略。技术栈方面，项目基于 Python 3.10 开发，支持 Isaac Sim 和 MuJoCo 两种仿真环境，使用 Git LFS 管理运动数据，并通过 uv 工具管理依赖。训练流程采用并行环境采样和离策略学习，关键参数如环境数量、缓冲区大小、学习率等均可灵活配置。推理阶段提供三种模式：运动跟踪（复现给定轨迹）、目标到达（生成到达指定位置的动作）和奖励任务（基于奖励函数优化行为），所有模式均支持导出 ONNX 格式模型用于实际部署。BFM-Zero 主要解决了人形机器人控制中任务泛化性差、奖励工程繁琐的问题，适用于需要快速切换多种行为模式的场景，如家庭服务、工业巡检和科研实验。项目代码分阶段开源，目前已发布预训练权重、最小推理代码和完整训练流程，未来还将提供支持 RTX 4090 的轻量训练版本。

项目特点

**无监督强化学习**：无需手工设计奖励函数，模型通过自探索学习多样化行为。

**提示式行为控制**：支持文本描述或运动轨迹作为提示，灵活生成对应控制策略。

**双仿真环境支持**：兼容 Isaac Sim 和 MuJoCo，方便在不同场景下测试和部署。

**并行环境采样**：训练时支持多环境并行采样，结合离策略学习提升效率。

**灵活配置**：环境数量、缓冲区大小、学习率等关键参数均可自由调整。

**运动数据管理**：使用 Git LFS 存储运动数据，确保大文件版本控制。

技术规格

开发语言
仿真环境
依赖管理工具
数据管理
训练方式
行为表示
输入类型
输出

项目资源

GitHub 仓库 LeCAR Lab 主页 Isaac Sim 官方文档 MuJoCo 官方文档 uv 工具文档 Git LFS 文档

搜索资源

百度必应搜狗 Google DuckDuckGo GitHub Gitee B站 YouTube 知乎小红书微信 CSDN Hackster Hackaday Printables Instructables OSHWHub

物料清单 (BOM)

物料名称	数量	参考价格	备注
Python 3.10	1	—	开发运行环境
Isaac Sim	1	—	可选仿真环境
MuJoCo	1	—	可选仿真环境
uv	1	—	依赖管理
Git LFS	1	—	运动数据管理
运动轨迹数据集	1	—	通过 Git LFS 管理

3D 模型

模型名称	文件名	文件
连杆 - head link	`head_link.STL`
连杆 - left ankle pitch link	`left_ankle_pitch_link.STL`
连杆 - left ankle roll link	`left_ankle_roll_link.STL`
连杆 - left elbow link	`left_elbow_link.STL`
连杆 - left elbow link merge	`left_elbow_link_merge.STL`
连杆 - left hand index 0 link	`left_hand_index_0_link.STL`
连杆 - left hand index 1 link	`left_hand_index_1_link.STL`
连杆 - left hand middle 0 link	`left_hand_middle_0_link.STL`
连杆 - left hand middle 1 link	`left_hand_middle_1_link.STL`
连杆 - left hand palm link	`left_hand_palm_link.STL`
连杆 - left hand thumb 0 link	`left_hand_thumb_0_link.STL`
连杆 - left hand thumb 1 link	`left_hand_thumb_1_link.STL`
连杆 - left hand thumb 2 link	`left_hand_thumb_2_link.STL`
连杆 - left hip pitch link	`left_hip_pitch_link.STL`
连杆 - left hip roll link	`left_hip_roll_link.STL`
连杆 - left hip yaw link	`left_hip_yaw_link.STL`
连杆 - left knee link	`left_knee_link.STL`
手 - left rubber hand	`left_rubber_hand.STL`
连杆 - left shoulder pitch link	`left_shoulder_pitch_link.STL`
连杆 - left shoulder roll link	`left_shoulder_roll_link.STL`
连杆 - left shoulder yaw link	`left_shoulder_yaw_link.STL`
连杆 - left wrist pitch link	`left_wrist_pitch_link.STL`
连杆 - left wrist roll link	`left_wrist_roll_link.STL`
手 - left wrist roll rubber hand	`left_wrist_roll_rubber_hand.STL`
连杆 - left wrist yaw link	`left_wrist_yaw_link.STL`
连杆 - logo link	`logo_link.STL`
pelvis	`pelvis.STL`
连杆 - pelvis contour link	`pelvis_contour_link.STL`
连杆 - right ankle pitch link	`right_ankle_pitch_link.STL`
连杆 - right ankle roll link	`right_ankle_roll_link.STL`
连杆 - right elbow link	`right_elbow_link.STL`
连杆 - right elbow link merge	`right_elbow_link_merge.STL`
连杆 - right hand index 0 link	`right_hand_index_0_link.STL`
连杆 - right hand index 1 link	`right_hand_index_1_link.STL`
连杆 - right hand middle 0 link	`right_hand_middle_0_link.STL`
连杆 - right hand middle 1 link	`right_hand_middle_1_link.STL`
连杆 - right hand palm link	`right_hand_palm_link.STL`
连杆 - right hand thumb 0 link	`right_hand_thumb_0_link.STL`
连杆 - right hand thumb 1 link	`right_hand_thumb_1_link.STL`
连杆 - right hand thumb 2 link	`right_hand_thumb_2_link.STL`
连杆 - right hip pitch link	`right_hip_pitch_link.STL`
连杆 - right hip roll link	`right_hip_roll_link.STL`
连杆 - right hip yaw link	`right_hip_yaw_link.STL`
连杆 - right knee link	`right_knee_link.STL`
手 - right rubber hand	`right_rubber_hand.STL`
连杆 - right shoulder pitch link	`right_shoulder_pitch_link.STL`
连杆 - right shoulder roll link	`right_shoulder_roll_link.STL`
连杆 - right shoulder yaw link	`right_shoulder_yaw_link.STL`
连杆 - right wrist pitch link	`right_wrist_pitch_link.STL`
连杆 - right wrist roll link	`right_wrist_roll_link.STL`