对象拆分
先把数据集、方法、平台和模型层拆开,避免把不同对象混成一个标签。
一条样本的生命线
从采集到训练使用的路径,用来判断它距离 robot policy 有多近。
01
采集者在真实空间设置移动机器人系统
02
通过遥操作完成 manipulation 任务
03
记录多视角图像、状态、动作和语言任务信息
04
上传并清洗轨迹数据
05
切分训练/评测数据并接入 loaders
06
训练或微调 robot policy / VLA 模型
数据结构快读
字段为阅读型归纳,具体 schema 以官方文档、loader 和 dataset card 为准。
| 字段 / 概念 | 人的解释 |
|---|---|
camera_observations |
外部或腕部相机图像,记录任务执行过程。 |
robot_state |
关节、末端位姿等机器人状态。 |
actions |
遥操作产生的机器人控制命令。 |
task_description |
人类可读任务语言,用于语言条件策略。 |
示例切片
- 在厨房台面上移动杯子或打开容器。
- 在办公室桌面上整理物体。
- 在不同采集者和家庭环境里执行相似指令。
- 用 DROID checkpoint 微调到本地机器人任务。
谱系定位
DROID 处在真实机器人轨迹层:比 Ego4D 更直接服务 policy,比 Open X-Embodiment 更集中和采集系统化,比 AGIBOT WORLD 更开放地面向学术社区复用。
| 层级 | 项目 / 结果 | 组织背景 | 公开规模 | 数据 / 方法形态 | 与当前项目关系 |
|---|---|---|---|---|---|
| Human video | Ego4D | Meta + partners | 3,600+ hours | first-person human activity video | 上游感知数据,没有机器人动作。 |
| Real robot data | DROID | UC Berkeley + collaborators | 76k trajectories / 350h | in-the-wild robot manipulation | 当前页核心对象。 |
| Cross-robot data | Open X-Embodiment | Google DeepMind + 33 labs | 1M+ trajectories | heterogeneous robot data mix | 更大更杂,DROID 可作为重要子型对照。 |
| Industrial humanoid data | AGIBOT WORLD 2026 | AgiBot | phased real + sim release | humanoid robot trajectories and annotations | 更接近公司化平台数据发布。 |
价值判断
这里区分官方事实、结构性解释和对相邻项目的定位。
三条结论
用于快速决定这个项目在 atlas 中应该放在哪一层。
深链来源
优先官方页面、论文、代码、数据卡和下载文档。