3D人体姿态估计简述——数据集
Human3.6M
由高速动作捕捉系统捕获的360万个人体姿势和相应的图像组成。有 4 个高分辨率逐行扫描摄像头以 50 Hz 采集视频数据。该数据集包含11位专业演员在讨论、吸烟、拍照、打电话等17个场景中的活动,并提供准确的3D关节位置和高分辨率视频。
大小约为 200G
单人 单目摄像头 多视角(提供摄像头参数)
H3WB
从Human3.6M中的视频编译成图像,允许在图像和注释之间建立正确的对应关系
AGORA 2021
AGORA 是一个合成的人类数据集,具有高度的真实感和准确的地面真实性。它由大约 14K 训练和 3K 测试图像组成,通过使用基于图像的照明或渲染的 3D 环境渲染每张图像 5 到 15 人,注意使图像在物理上合理且逼真。AGORA 总共包含 173K 个个体作物。 AGORA 为图像中的每个主体提供 (1) SMPL/SMPL-X 参数和 (2) 分割掩码。
多人 单目摄像头 单视角
3DOH50K 2020
Object-Occluded Human Shape and Pose Estimation from a Single Color Image (yangangwang.com)
3DOH50K是第一个真正的3D人体数据集,用于遮挡场景中的人体重建和姿态估计问题。它包含 51600 张具有精确的 2D 姿态和 3D 姿态、SMPL 参数和二进制掩码的图像。
针对人体遮挡
大小约为 13G
单人 单目 单视角
3DPW 2018
野外 3D 姿势数据集是第一个具有精确 3D 姿势进行评估的野外数据集。虽然户外存在其他数据集,但它们都仅限于较小的记录量。3DPW 是第一个包含从移动手机摄像头拍摄的视频片段的。
大小约为 5G
多人 单目 单视角
MPI-INF-3DHP 2017
Monocular 3D Human Pose Estimation In The Wild Using Improved CNN Supervision, 3DV 2017 (mpg.de)
MPI-INF-3DHP 是一个 3D 人体姿态估计数据集,由受约束的室内场景和复杂的室外场景组成。它记录了 8 名演员从 14 个摄像机视图执行 8 项活动。它由从 14 个摄像头捕获的 >1.3M 帧组成。
约30g
单人 单目 单视角
EMDB 2023
EMDB: The Electromagnetic Database of Global 3D Human Pose and Shape in the Wild (eth-ait.github.io)
EMDB 包含使用手持 iPhone 录制的人类活动的野外视频。它具有参考 SMPL 身体姿势和形状参数,以及全局身体根部和相机轨迹。参考 3D 姿势是通过将 SMPL 联合拟合到 12 个可穿戴电磁传感器和图像数据中获得的。对于后者,我们拟合了一个神经隐式头像模型,以允许一个密集的像素级拟合目标。
数据集需要申请 暂时没找到网盘资源
单人 单目 单视角
Panoptic (CMU Panoptic Studio) 2016
大型数据集,为多人参与社交活动提供 3D 姿势注释(150 万)。它包含 65 个带有多视图注释的视频(5.5 小时),但其中只有 17 个是多人场景并具有摄像机参数。
65 个序列(5.5 小时)和 1.5 数百万个 3D 骨架
暂时没找到网盘资源
单/多人 单目 多视角
- Title: 3D人体姿态估计简述——数据集
- Author: CGC
- Created at: 2024-02-28 15:25:05
- Updated at: 2024-06-30 15:36:22
- Link: https://redefine.ohevan.com/2024/02/28/3D人体姿态估计简述——数据集/
- License: This work is licensed under CC BY-NC-SA 4.0.