truhue.ai embodied data atlas

Open X-Embodiment / RT-X

Open X-Embodiment 是面向机器人策略学习的多实验室真实机器人数据集合;RT-X 是基于这批数据训练和评测的跨具身策略模型族。

它解决的是单一机器人、单一实验室数据太窄的问题:让策略训练第一次有足够大的真实机器人异构数据底座。

官方页面与论文信息核对于 2026-05-18。

1M+ real robot trajectories
22 robot embodiments
60 datasets
34 robotics labs

对象拆分

先把数据集、方法、平台和模型层拆开,避免把不同对象混成一个标签。

Open X-Embodiment 数据集合 跨实验室、跨机器人、跨任务的真实机器人轨迹集合。
RT-X 模型实验 用同一数据集合训练跨具身策略,检验跨机器人迁移。
OXE mix 训练配方 后续 OpenVLA、Octo 等模型常把它作为大规模预训练数据源。
限制 非统一硬件系统 它不是一个机器人平台,而是异构数据的聚合与标准化努力。

一条样本的生命线

从采集到训练使用的路径,用来判断它距离 robot policy 有多近。

01 各实验室采集真实机器人任务轨迹
02 清洗并转换到统一数据表示
03 记录图像、语言指令、动作和状态字段
04 按机器人、数据集和任务混合采样
05 训练 RT-X 或开源 VLA / policy 模型
06 在 seen / unseen embodiment 与任务上评测泛化

数据结构快读

字段为阅读型归纳,具体 schema 以官方文档、loader 和 dataset card 为准。

字段 / 概念 人的解释
observation.image 机器人视角或外部相机图像,是策略看世界的主要输入。
language_instruction 自然语言任务描述,把轨迹对齐到可泛化的目标语义。
action 机器人执行的控制命令,跨机器人时需要映射或标准化。
episode_metadata 数据集来源、机器人类型、任务和切分信息。
示例切片
  • 把某个桌面机械臂的 pick-and-place 轨迹并入跨具身训练混合。
  • 用语言指令把不同实验室的相似任务归到可比较任务族。
  • 在一个机器人上训练后,检验另一个机器人是否能受益于共享经验。
  • 用 OXE 子集作为 OpenVLA 或 Octo 的预训练来源。

谱系定位

它位于真实机器人轨迹层和 VLA/foundation policy 层之间:比 Ego4D 更接近机器人动作,比单实验室数据集更宽,比 OpenVLA/Octo 更偏数据底座而非最终模型。

层级 项目 / 结果 组织背景 公开规模 数据 / 方法形态 与当前项目关系
Egocentric video Ego4D / Ego-Exo4D Meta / academic consortium thousands of hours human video human video, narration, pose, multi-view context 上游人类经验层,没有直接机器人动作。
Real robot data DROID UC Berkeley / collaborators 76k trajectories / 350h in-the-wild robot manipulation episodes 比 OXE 更集中,强调社区采集和真实家庭/办公场景。
Cross-robot data Open X-Embodiment Google DeepMind + 33 labs 1M+ trajectories / 22 embodiments heterogeneous real robot trajectories 当前页核心对象。
Generalist policy OpenVLA / Octo Stanford, UC Berkeley, CMU, etc. OXE-derived pretraining mixes VLA / transformer policy checkpoints 使用 OXE 类数据训练可迁移策略。

价值判断

这里区分官方事实、结构性解释和对相邻项目的定位。

最强贡献 把分散机器人数据变成可共同训练的公共底座。
不解决 不会自动消除动作空间不一致、质量差异和机器人硬件差异。
战略意义 它让机器人学习从小数据手工配方转向跨平台数据规模化。

三条结论

用于快速决定这个项目在 atlas 中应该放在哪一层。

01 这是通用机器人策略的数据地基,不只是一个 benchmark。
02 它的关键不是单条轨迹质量,而是跨机器人混合后是否提升泛化。
03 评估它时要同时看数据开放度、机器人多样性和下游模型收益。