混元3D v2.5 开源权重现已发布

混元3D: 免费开源 文本转3D AI

混元3D可在数秒内从文本或图像生成高保真、PBR就绪的3D资产。腾讯开源AI模型,永久免费,无需订阅。

Apache 2.0 许可证
仅需6GB显存
100亿参数 (v2.5)
Gallery preview 1
3D
Gallery preview 2
3D
Gallery preview 3
3D
查看作品
正在加载混元3D界面...

由HuggingFace Spaces提供支持 - 混元3D实时演示

什么是混元3D?

混元3D是腾讯开创性的生成式AI系统,能够从单张图像或文本提示生成高保真3D资产。与之前产生模糊、低分辨率网格的3D AI不同,混元采用两阶段扩散变换器(DiT)架构,将几何生成与纹理合成分离。

1

第一阶段:几何生成(DiT)。

在大规模3D资产数据集上训练的扩散变换器在潜在空间中生成「裸网格」。这确保了拓扑结构的连贯性和结构细节的保留。

2

第二阶段:多视角绘制。

一旦网格确定,第二个扩散模型会同时从多个角度投射纹理。它使用「纹理烘焙」过程为反照率、法线、粗糙度和金属度通道创建无缝的UV贴图。

这种方法通过严格地在已建立的几何体上条件化纹理来解决'Janus问题'(多面物体)。

为生产而设计

混元3D不仅仅是一个玩具。它是一个基础模型,旨在适应包括Blender、Unity和虚幻引擎在内的专业管道。

文本转3D
点击查看
10s Generation

文本转3D

描述任何物体,几秒内获得网格。

图像转3D
点击查看
High Fidelity

图像转3D

将单张2D图像转换为360度资产。

PBR纹理
点击查看
4K Resolution

PBR纹理

生成反照率、法线、粗糙度和金属度贴图。

干净拓扑
点击查看
Manifold Mesh

干净拓扑

生产就绪的几何体,支持四边面流选项。

多视角一致
点击查看
360° Coherence

多视角一致

通过视角感知扩散解决'Janus问题'。

混元3D vs 替代方案

对比 TripoSR

TripoSR非常快(通常不到5秒),但牺牲了质量。它使用前馈变换器将光照烘焙到纹理中,使资产难以在动态游戏环境中使用。混元提供能正确响应光照的PBR贴图。

对比 Rodin

Rodin提供出色的拓扑,通常创建适合动画的干净四边面。然而,它是一个需要订阅和云上传的封闭SaaS平台。混元3D v2.1提供有竞争力的质量,可在您自己的硬件上本地运行(最低6GB显存),确保数据隐私和零持续成本。

不妥协的细节

几何 vs. 纹理

混元3D使用独特的两阶段管道。第一阶段(DiT)构建裸网格。第二阶段(绘制)应用一致的PBR纹理。

Hunyuan Textured Output
最终渲染
Hunyuan Geometry
几何(网格)
拖动以比较各阶段
市场分析

为什么选择混元?

混元3D占据了快速低质量前馈模型和昂贵闭源专有平台之间的最佳位置。

1
2
阅读完整基准测试报告

输出对比

相同提示词:'青瓷老虎,冰裂纹釉面'
悬停查看细节对比
Hunyuan 3D
Hunyuan 3D
TripoSR
TripoSR
干净几何
4K PBR纹理
免费且本地
顶点颜色(模糊)
低面数
非常快(5秒)
免费试用 - 无需信用卡

适用于各种工作流程

游戏资产 Example 1
游戏资产
游戏资产 Example 2
游戏资产
游戏资产 Example 3
游戏资产
游戏资产 Example 4
游戏资产

加入革命

User Output

"PBR贴图实际上是可用的。我用混元输出替换了40%的背景道具。"

A

Alex Chen

独立游戏开发者
User Output

"终于有一个开放模型不只是输出模糊的东西。拓扑出人意料地干净。"

S

Sarah Jenkins

3D艺术家
User Output

"我们将DiT管道集成到内部工具集中。它将原型制作时间缩短了70%。"

M

Marcus V.

技术负责人

常见问题

可以,但有一些注意事项。虽然PyTorch支持Apple Silicon(Metal),但像nvdiffrast这样的自定义光栅化库是针对CUDA优化的。您可能需要使用CPU回退或等待社区编译的wheels以实现完整的M1/M2/M3加速。

Hunyuan 3D generated models showcase

开始使用混元3D。
完全免费。

即时生成3D资产。无排队、更快速、手机兼容。文本转3D和图像转3D的未来。

支持所有设备 - 无需GPU - 即时出结果