Open X-Embodiment / RT-X | Embodied Data Atlas

对象拆分

先把数据集、方法、平台和模型层拆开，避免把不同对象混成一个标签。

Open X-Embodiment 数据集合 跨实验室、跨机器人、跨任务的真实机器人轨迹集合。

RT-X 模型实验 用同一数据集合训练跨具身策略，检验跨机器人迁移。

OXE mix 训练配方 后续 OpenVLA、Octo 等模型常把它作为大规模预训练数据源。

限制 非统一硬件系统 它不是一个机器人平台，而是异构数据的聚合与标准化努力。

从采集到训练使用的路径，用来判断它距离 robot policy 有多近。

01 各实验室采集真实机器人任务轨迹

02 清洗并转换到统一数据表示

03 记录图像、语言指令、动作和状态字段

04 按机器人、数据集和任务混合采样

05 训练 RT-X 或开源 VLA / policy 模型

06 在 seen / unseen embodiment 与任务上评测泛化

字段为阅读型归纳，具体 schema 以官方文档、loader 和 dataset card 为准。

示例切片

它位于真实机器人轨迹层和 VLA/foundation policy 层之间：比 Ego4D 更接近机器人动作，比单实验室数据集更宽，比 OpenVLA/Octo 更偏数据底座而非最终模型。

层级	项目 / 结果	组织背景	公开规模	数据 / 方法形态	与当前项目关系
Egocentric video	Ego4D / Ego-Exo4D	Meta / academic consortium	thousands of hours human video	human video, narration, pose, multi-view context	上游人类经验层，没有直接机器人动作。
Real robot data	DROID	UC Berkeley / collaborators	76k trajectories / 350h	in-the-wild robot manipulation episodes	比 OXE 更集中，强调社区采集和真实家庭/办公场景。
Cross-robot data	Open X-Embodiment	Google DeepMind + 33 labs	1M+ trajectories / 22 embodiments	heterogeneous real robot trajectories	当前页核心对象。
Generalist policy	OpenVLA / Octo	Stanford, UC Berkeley, CMU, etc.	OXE-derived pretraining mixes	VLA / transformer policy checkpoints	使用 OXE 类数据训练可迁移策略。

这里区分官方事实、结构性解释和对相邻项目的定位。

最强贡献 把分散机器人数据变成可共同训练的公共底座。

不解决 不会自动消除动作空间不一致、质量差异和机器人硬件差异。

战略意义 它让机器人学习从小数据手工配方转向跨平台数据规模化。

用于快速决定这个项目在 atlas 中应该放在哪一层。

01 这是通用机器人策略的数据地基，不只是一个 benchmark。

02 它的关键不是单条轨迹质量，而是跨机器人混合后是否提升泛化。

03 评估它时要同时看数据开放度、机器人多样性和下游模型收益。

优先官方页面、论文、代码、数据卡和下载文档。

Official Project https://robotics-transformer-x.github.io/

Paper https://arxiv.org/abs/2310.08864

GitHub https://github.com/google-deepmind/open_x_embodiment

Dataset https://github.com/google-deepmind/open_x_embodiment/blob/main/docs/DATASET.md