RH20T | Embodied Data Atlas

对象拆分

先把数据集、方法、平台和模型层拆开，避免把不同对象混成一个标签。

RH20T 真实机器人数据集 以多模态机器人操作序列为核心。

Contact-rich 接触丰富 适合抓取、插入、旋拧等依赖力与接触的任务。

Human + robot 示范关系 把人类示范和机器人执行放在同一数据生态里。

不是 纯视觉 benchmark 它的价值恰恰在视觉之外的接触和传感信号。

从采集到训练使用的路径，用来判断它距离 robot policy 有多近。

01 人类示范或机器人执行接触丰富任务

02 多相机、力传感、音频和状态同步记录

03 整理为序列级别任务数据

04 按配置、任务和模态提供 API / 下载

05 用于模仿学习、多模态表示或策略评测

06 分析视觉之外的接触反馈是否提升泛化

字段为阅读型归纳，具体 schema 以官方文档、loader 和 dataset card 为准。

示例切片

RH20T 属于真实机器人轨迹层，但与 DROID/OXE 的差别在多模态和接触：它更适合解释为什么机器人数据不能只看视频小时数。

层级	项目 / 结果	组织背景	公开规模	数据 / 方法形态	与当前项目关系
Egocentric human data	EgoVerse	Georgia Tech / collaborators	1,362 h demonstrations	human egocentric episodes	人类视角近，机器人动作弱。
In-the-wild robot data	DROID	UC Berkeley + collaborators	76k trajectories	robot image-action trajectories	真实场景强，但接触多模态不是核心定位。
Contact-rich robot data	RH20T	research consortium	110k+ sequences	vision, force, audio, action, human/robot demos	当前页核心对象。
Cross-robot data	Open X-Embodiment	Google DeepMind + 33 labs	1M+ trajectories	heterogeneous robot data mix	更大更广，但单个模态深度不一定同 RH20T。

这里区分官方事实、结构性解释和对相邻项目的定位。

最强贡献 把接触、力和音频纳入大规模机器人操作数据讨论。

不解决 不等同于开放世界泛化，任务和硬件覆盖仍有边界。

战略意义 它提醒 generalist policy 需要多模态物理反馈，而不只是视觉语言。

用于快速决定这个项目在 atlas 中应该放在哪一层。

01 RH20T 是多模态接触丰富机器人数据集。

02 它的重点是 force/audio/action 与视觉同步，而不是最大规模。

03 在 atlas 中它补齐真实操作里最容易被忽略的接触信号层。

优先官方页面、论文、代码、数据卡和下载文档。

Official Project https://rh20t.github.io/

Paper https://arxiv.org/abs/2307.00595

GitHub https://github.com/rh20t/rh20t_api

Dataset Docs https://rh20t.github.io/download.html