Hunyuan3D-PolyGen : 腾讯混元推出的美术级3D生成大模型
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
主要介绍
2025年7月7日,腾讯混元正式推出业界首个美术级3D生成大模型Hunyuan3D-PolyGen。该模型专注于解决3D资产生成中的布线质量差、复杂物体建模难等问题,通过技术创新将3D生成从“可看”提升至“可用”标准,为游戏、影视、工业设计等领域提供专业级解决方案。目前,其能力已集成至腾讯混元3D AI创作引擎,并面向开发者开放API。

功能特点
- 高精度布线:支持生成面数达上万面的复杂几何模型,布线规整,符合美术制作规范。
- 多面片支持:同时支持三边面和四边面,满足不同专业管线需求。
- 无缝集成:生成的资产可直接应用于UGC游戏开发、影视动画制作等场景,无需额外调整。
- 多模态输入:支持文本、单图、多图生成3D模型,并兼容草图、3D人物生成等多样化创作需求。
- 强化学习优化:通过强化学习后训练框架提升生成稳定性,降低差错率。
优缺点
- 优点:
- 专业级输出:布线精度和模型复杂度达到行业顶尖水平,填补了专业级3D生成空白。
- 效率提升:腾讯内部测试显示,集成至游戏管线后,美术师建模效率提升超70%。
- 技术普惠:通过API开放能力,降低中小团队和独立创作者使用高端3D生成技术的门槛。
- 缺点:
- 硬件要求较高:生成高面数模型需较强算力支持,可能限制部分用户使用。
- 学习成本:专业功能需一定技术背景,非专业用户上手需时间适应。
如何使用
- 访问创作引擎:通过腾讯混元3D AI创作引擎在线体验,或申请API权限进行二次开发。
- 输入提示:上传文本描述、单图或多图,或直接绘制草图作为输入。
- 生成与调整:模型自动生成3D资产后,用户可进一步调整纹理、动作、场景等参数。
- 导出与应用:支持导出OBJ、GLB、FBX等格式,兼容3D打印和移动端实时交互。
框架技术原理
- 自回归网格生成框架:将顶点和面片转化为Token序列,通过空间推理生成Mesh结构。
- 高压缩率BPT技术:自研的Blocked and Patchified Tokenization技术,提升复杂mesh建模效率。
- 两阶段生成流程:
- 几何生成:基于流扩散模型生成无纹理的几何模型。
- 纹理合成:通过多视图扩散生成方案,结合几何条件生成高分辨率纹理贴图。
- 强化学习后训练:设计“稳定生成”和“美术规范”奖励机制,优化自回归生成稳定性。
创新点
- 美术级输出:首次将3D生成结果提升至专业美术制作标准,解决行业长期痛点。
- 解耦生成策略:将形状生成与纹理生成分离,降低技术复杂度,提升灵活性。
- 强化学习引导:通过奖励机制引导AI生成符合人类审美与专业规范的结果。
- 开源生态:模型权重、推理代码全开放,推动技术普惠与行业创新。
评估标准
- 几何细节:通过Chamfer Distance(CD)、F-score(FS)等指标评估模型精度。
- 纹理质量:考察纹理分辨率、真实感及与几何模型的匹配度。
- 生成效率:测试不同硬件环境下的生成速度与资源占用。
- 用户反馈:收集美术师和开发者对模型可用性、稳定性的评价。
应用领域
- 游戏开发:快速生成角色、道具、场景等3D资产,缩短UGC游戏开发周期。
- 影视动画:辅助角色建模与动画制作,提升内容生产效率。
- 虚拟现实:为VR/AR应用提供高质量3D模型,增强沉浸感。
- 工业设计:支持产品原型快速建模与可视化,降低设计成本。
- 创意教育:为非专业用户提供低门槛3D创作工具,推动内容生态多元化。
项目地址
- 官网:腾讯混元3D AI创作引擎
- GitHub:Hunyuan3D-PolyGen
- Hugging Face:Tencent/Hunyuan3D-1
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...