对象拆分
先把数据集、方法、平台和模型层拆开,避免把不同对象混成一个标签。
一条样本的生命线
从采集到训练使用的路径,用来判断它距离 robot policy 有多近。
01
G2 机器人或仿真环境执行任务
02
记录图像、状态、动作、指令和任务标注
03
真实场景与 1:1 数字孪生相互对齐
04
转换为 LeRobot v2.1 数据结构
05
在 Hugging Face 分阶段发布
06
用于具身模型训练、评测和复现
数据结构快读
字段为阅读型归纳,具体 schema 以官方文档、loader 和 dataset card 为准。
| 字段 / 概念 | 人的解释 |
|---|---|
observation.images |
机器人或环境相机图像。 |
observation.state |
机器人状态,例如关节、末端或平台状态。 |
action |
机器人执行命令,是区别于纯人类视频的关键字段。 |
task / episode metadata |
任务、场景、阶段、版本和数据来源说明。 |
示例切片
- 在商业空间中执行搬运、整理或交互任务。
- 把真实采集 episode 与对应数字孪生环境关联。
- 用 LeRobot loader 读取数据并接入 policy 训练。
- 按 release phase 跟踪数据规模和任务覆盖的变化。
谱系定位
AGIBOT WORLD 2026 处在公司化 humanoid 数据平台层:比 DROID 更偏平台和阶段化发布,比 OXE 更集中于一个机器人公司生态,比 FlowBot++ 更接近大规模模型训练。
| 层级 | 项目 / 结果 | 组织背景 | 公开规模 | 数据 / 方法形态 | 与当前项目关系 |
|---|---|---|---|---|---|
| Community robot data | DROID | UC Berkeley + collaborators | 76k trajectories | in-the-wild manipulation | 开放社区采集路线。 |
| Cross-embodiment data | Open X-Embodiment | Google DeepMind + 33 labs | 1M+ trajectories | heterogeneous robot data mix | 更强调跨机器人混合。 |
| Humanoid platform data | AGIBOT WORLD 2026 | AgiBot | phased HF release | G2 real + sim episodes in LeRobot v2.1 | 当前页核心对象。 |
| Generalist model stack | OpenPI / Physical Intelligence | Physical Intelligence | 10k+ h robot data in public checkpoints | foundation policy checkpoints and training code | 相邻模型层,强调数据到策略的闭环。 |
价值判断
这里区分官方事实、结构性解释和对相邻项目的定位。
三条结论
用于快速决定这个项目在 atlas 中应该放在哪一层。
深链来源
优先官方页面、论文、代码、数据卡和下载文档。