Published Jun 18, 2026Updated Jun 18, 2026

SAM 3D —— 从一张照片重建人体与物体

从单张图片生成 3D 人体与物体

SAM 3D 来自 Meta,以两种专用模态从单张照片重建 3D 几何。人体模态从图像中恢复一个或多个人体(含姿态);物体模态在一段简短提示词引导下重建你指向的物体。两种模态都输出 GLB,可在本页交互预览并下载 —— 无需多视角拍摄或手工建模。

两种模态针对不同对象做了调校。人体模态为人物而生:上传一张含一个或多个人的照片,SAM 3D 即恢复其 3D 体型与姿态,并可在模型中选配 3D 关键点。物体模态为物件而生:上传一张照片,用一段简短提示词告诉它要重建什么(例如 car、chair、backpack),它便会分割并重建该物体 —— 还可用检测阈值微调主体选取的力度,并用「带纹理 GLB」选项把纹理与 UV 烘焙进输出。

由于 SAM 3D 基于 Meta 的 Segment Anything 家族,它尤其擅长在杂乱图像中先精准圈出正确主体再重建。你不需要干净的影棚照或一圈环拍照片 —— 一张日常图片就足以得到可旋转的 3D 结果。

工作流程很简单。选择人体或物体,上传图片,设置选项,然后生成并在内置交互查看器中检视模型 —— 旋转、缩放,从各个角度查看。满意后下载 GLB,放进你的引擎、渲染或 DCC 工具。每次生成都会保存到你的工作台画廊,方便日后再次取用。

如何用 SAM 3D 生成 3D 模型

选择模态并上传

为人物选择图像转人体,为物件选择图像转物体,然后上传一张主体照片。

设置选项

人体模态可选择是否包含 3D 关键点。物体模态可描述要重建的对象,并调整检测阈值或带纹理 GLB 选项。

生成并下载

点击生成,在交互查看器中旋转、缩放结果。下载 GLB —— 每个模型也会保存到你的工作台画廊。

SAM 3D 技术规格

提供方	Meta
平台	云端 API（托管）
输入模态	图像转人体与图像转物体
输入	单张图片
人体模态	恢复一个或多个人体(含姿态)
物体模态	提示词引导的物体重建
输出格式	GLB
预览	浏览器内交互式 3D 查看器
商业用途	支持

为什么选择 SAM 3D

人体与物体

一个模型,两种专用模态 —— 恢复带姿态的人体,或重建日常物体,都只需一张照片。

智能主体选取

基于 Meta 的 Segment Anything 家族,SAM 3D 能在杂乱图像中圈出正确主体 —— 物体模态下还由提示词引导 —— 再进行重建。

一张照片,无需布置

无需环拍、多视角设备或影棚灯光 —— 一张日常图片就足以得到可旋转、可预览、可下载的 GLB。

SAM 3D 与其他图像转 3D 模型对比

Feature	SAM 3D	Hyper3D Rodin v2.5	Tripo3D H3.1
输入	单张图片	最多 5 张图片,或文本	图像、多视角或文本
专长	人体 + 物体	通用物体 + 角色	通用物体
主体选取	Segment Anything(提示/掩膜)	整图	整图
输出	GLB	GLB	GLB
适用场景	人物与真实场景中的物体	细节档位与可绑定姿态	多角度忠实重建

用 SAM 3D 能创作什么

人物 Avatar

从照片恢复带姿态的 3D 人体,用于 Avatar、预演与角色参考。

真实场景中的物体

从日常照片重建物体 —— 无需干净背景或影棚照。

AR 与 VR

生成轻量 GLB 资产,直接放入 AR 体验与 VR 场景。

产品采集

把单张产品照片转成用于电商与配置器的 3D 模型。

姿态与动作参考

用带 3D 关键点的恢复人体作为动画与绑定的姿态、动作参考。

游戏资产

从参考照片重建道具与角色,经 GLB 带入你的引擎。

关于 SAM 3D 的常见问题

SAM 3D 是做什么的?

SAM 3D 以两种模态从单张图片重建 3D 几何。图像转人体恢复一个或多个带姿态的人体;图像转物体在一段简短提示词指定下重建某个物体。两者都输出可预览、可下载的 GLB。

人体模态与物体模态有什么区别?

人体模态为人物而生,从照片恢复人体体型与姿态,并可选配 3D 关键点。物体模态为物件而生 —— 你上传照片,描述要重建什么(例如 car),它便分割并重建该物体。

我怎么告诉它要重建哪个物体?

在物体模态下,你提供一段简短提示词指明物体 —— 如 chair 或 backpack。SAM 3D 用 Meta 的 Segment Anything 从图像中圈出该主体再重建。你还可以调整检测阈值来微调主体选取。

我需要多张照片或干净背景吗?

不需要。SAM 3D 从一张日常图片即可工作,并能在杂乱场景中圈出主体,所以你不需要环拍、多视角设备或影棚背景。

我会得到什么格式,能预览吗?

你会下载一个 GLB,可用于网页、游戏引擎与 AR。下载前模型会在浏览器中交互预览,可旋转、缩放,从各个角度查看。

它和 Hyper3D Rodin v2.5、Tripo3D H3.1 有何不同?

SAM 3D 专注于从一张真实场景照片中重建选定主体 —— 人体或被提示的物体 —— 并用 Meta 的 Segment Anything 做主体选取。Hyper3D Rodin v2.5 接收最多 5 张图、带质量档位与可绑定姿态;Tripo3D H3.1 增加多视角模态与标准/精细质量。按你的输入与主体选择合适的一个。