truhue.ai embodied data atlas

DROID

DROID 是真实世界 robot manipulation 数据集和采集平台,强调在多地点、多采集者、多场景中获得机器人轨迹。

它解决的是实验室小场景数据太窄的问题:把真实家庭、办公室和多样物体带入机器人策略训练。

官方项目页、论文和数据入口信息核对于 2026-05-18。

76k robot trajectories
350h interaction data
564 scenes
86 tasks

对象拆分

先把数据集、方法、平台和模型层拆开,避免把不同对象混成一个标签。

DROID 数据集 真实机器人在野外环境完成操作任务的轨迹集合。
Collection platform 采集系统 用标准化硬件、遥操作和数据管线让多人多地点采集成为可能。
Policy data 策略训练材料 图像、动作、语言和状态可用于 imitation learning / VLA 训练。
不是 纯视频库 它包含机器人动作轨迹,离策略训练比 Ego4D 更近。

一条样本的生命线

从采集到训练使用的路径,用来判断它距离 robot policy 有多近。

01 采集者在真实空间设置移动机器人系统
02 通过遥操作完成 manipulation 任务
03 记录多视角图像、状态、动作和语言任务信息
04 上传并清洗轨迹数据
05 切分训练/评测数据并接入 loaders
06 训练或微调 robot policy / VLA 模型

数据结构快读

字段为阅读型归纳,具体 schema 以官方文档、loader 和 dataset card 为准。

字段 / 概念 人的解释
camera_observations 外部或腕部相机图像,记录任务执行过程。
robot_state 关节、末端位姿等机器人状态。
actions 遥操作产生的机器人控制命令。
task_description 人类可读任务语言,用于语言条件策略。
示例切片
  • 在厨房台面上移动杯子或打开容器。
  • 在办公室桌面上整理物体。
  • 在不同采集者和家庭环境里执行相似指令。
  • 用 DROID checkpoint 微调到本地机器人任务。

谱系定位

DROID 处在真实机器人轨迹层:比 Ego4D 更直接服务 policy,比 Open X-Embodiment 更集中和采集系统化,比 AGIBOT WORLD 更开放地面向学术社区复用。

层级 项目 / 结果 组织背景 公开规模 数据 / 方法形态 与当前项目关系
Human video Ego4D Meta + partners 3,600+ hours first-person human activity video 上游感知数据,没有机器人动作。
Real robot data DROID UC Berkeley + collaborators 76k trajectories / 350h in-the-wild robot manipulation 当前页核心对象。
Cross-robot data Open X-Embodiment Google DeepMind + 33 labs 1M+ trajectories heterogeneous robot data mix 更大更杂,DROID 可作为重要子型对照。
Industrial humanoid data AGIBOT WORLD 2026 AgiBot phased real + sim release humanoid robot trajectories and annotations 更接近公司化平台数据发布。

价值判断

这里区分官方事实、结构性解释和对相邻项目的定位。

最强贡献 把真实机器人数据采集从单实验室扩展到多地点社区化。
不解决 数据多样并不自动保证策略泛化,需要模型和评测共同证明。
战略意义 它是 Pi/OpenPI 生态里很实用的真实数据参照。

三条结论

用于快速决定这个项目在 atlas 中应该放在哪一层。

01 DROID 是真实世界机器人操作数据集,不是人类视频库。
02 它的关键价值在多采集者、多场景、多任务真实轨迹。
03 评估它要看采集质量、动作接口和下游微调效果。