3D人体姿态估计简述——数据集

CGC Lv4

Human3.6M

由高速动作捕捉系统捕获的360万个人体姿势和相应的图像组成。有 4 个高分辨率逐行扫描摄像头以 50 Hz 采集视频数据。该数据集包含11位专业演员在讨论、吸烟、拍照、打电话等17个场景中的活动,并提供准确的3D关节位置和高分辨率视频。

大小约为 200G

单人 单目摄像头 多视角(提供摄像头参数)

H3WB

从Human3.6M中的视频编译成图像,允许在图像和注释之间建立正确的对应关系

AGORA 2021

AGORA 是一个合成的人类数据集,具有高度的真实感和准确的地面真实性。它由大约 14K 训练和 3K 测试图像组成,通过使用基于图像的照明或渲染的 3D 环境渲染每张图像 5 到 15 人,注意使图像在物理上合理且逼真。AGORA 总共包含 173K 个个体作物。 AGORA 为图像中的每个主体提供 (1) SMPL/SMPL-X 参数和 (2) 分割掩码。

多人 单目摄像头 单视角

3DOH50K 2020

Object-Occluded Human Shape and Pose Estimation from a Single Color Image (yangangwang.com)

3DOH50K是第一个真正的3D人体数据集,用于遮挡场景中的人体重建和姿态估计问题。它包含 51600 张具有精确的 2D 姿态和 3D 姿态、SMPL 参数和二进制掩码的图像。

针对人体遮挡

大小约为 13G

单人 单目 单视角

3DPW 2018

3DPW系列 |真实的虚拟人 (mpg.de)

野外 3D 姿势数据集是第一个具有精确 3D 姿势进行评估的野外数据集。虽然户外存在其他数据集,但它们都仅限于较小的记录量。3DPW 是第一个包含从移动手机摄像头拍摄的视频片段的。

大小约为 5G

多人 单目 单视角

MPI-INF-3DHP 2017

Monocular 3D Human Pose Estimation In The Wild Using Improved CNN Supervision, 3DV 2017 (mpg.de)

MPI-INF-3DHP 是一个 3D 人体姿态估计数据集,由受约束的室内场景和复杂的室外场景组成。它记录了 8 名演员从 14 个摄像机视图执行 8 项活动。它由从 14 个摄像头捕获的 >1.3M 帧组成。

约30g

单人 单目 单视角

EMDB 2023

EMDB: The Electromagnetic Database of Global 3D Human Pose and Shape in the Wild (eth-ait.github.io)

EMDB 包含使用手持 iPhone 录制的人类活动的野外视频。它具有参考 SMPL 身体姿势和形状参数,以及全局身体根部和相机轨迹。参考 3D 姿势是通过将 SMPL 联合拟合到 12 个可穿戴电磁传感器和图像数据中获得的。对于后者,我们拟合了一个神经隐式头像模型,以允许一个密集的像素级拟合目标。

数据集需要申请 暂时没找到网盘资源

单人 单目 单视角

Panoptic (CMU Panoptic Studio) 2016

CMU Panoptic Dataset

大型数据集,为多人参与社交活动提供 3D 姿势注释(150 万)。它包含 65 个带有多视图注释的视频(5.5 小时),但其中只有 17 个是多人场景并具有摄像机参数。

65 个序列(5.5 小时)和 1.5 数百万个 3D 骨架

暂时没找到网盘资源

单/多人 单目 多视角

  • Title: 3D人体姿态估计简述——数据集
  • Author: CGC
  • Created at: 2024-02-28 15:25:05
  • Updated at: 2024-06-30 15:36:22
  • Link: https://redefine.ohevan.com/2024/02/28/3D人体姿态估计简述——数据集/
  • License: This work is licensed under CC BY-NC-SA 4.0.