5月16日·阶跃星辰与光影焕像联合发布开源3D生成引擎Step1X-3D

5月16日·周五  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

阶跃星辰与光影焕像联合发布开源3D生成引擎Step1X-3D

阶跃星辰与光影焕像联合推出了超强3D生成引擎Step1X-3D,并开源其全链路训练代码。该模型参数量达48亿,采用先进的3D原生架构,能够生成高保真、可控的3D内容。Step1X-3D不仅在视觉效果上追求“好看”,更注重“好用”与“可控”,适用于游戏娱乐、影视动画制作、工业设计等多领域。团队对超过500万原始数据进行筛选处理,建立了200万高质量训练样本库,通过增强型技术提升模型的泛化能力和细节捕捉力。其几何生成采用混合VAE-DiT架构,纹理生成则基于深度定制的SD-XL模型,确保生成内容的精准性与一致性。用户还可通过2D控制技术对生成的3D资产进行精细调控。Step1X-3D的开源为3D生成社区带来了强大助力。来源:微信公众号【新智元

5月16日·阶跃星辰与光影焕像联合发布开源3D生成引擎Step1X-3D

统一多模态模型BLIP3-o发布,革新图像生成与理解

Salesforce Research联合多所高校推出开源的统一多模态模型BLIP3-o。该模型采用“先理解后生成”的策略,结合自回归与扩散架构,创新性地使用CLIP特征和Flow Matching训练方法,显著提升了图像生成的质量与多样性。BLIP3-o通过CLIP对图像进行编码,生成部分则由自回归模型生成中间视觉特征作为DiT的输入,最终实现高质量的图像重建。在多个评测中,BLIP3-o表现优异,特别是在提示对齐和图像美学方面。其开源数据集和模型代码为多模态研究提供了有力支持,也为图像编辑、视觉对话等任务带来了新的可能性。来源:微信公众号【机器之心

5月16日·阶跃星辰与光影焕像联合发布开源3D生成引擎Step1X-3D

Manus生图功能上线,一站式设计与建站免费体验

Manus推出图像生成功能,用户可全面注册并获赠1000积分体验。Manus不仅能生成图像,还能理解用户意图并规划解决方案,高效调用工具完成任务。机器之心测试显示,Manus生成的图像符合要求,细节处理出色,如设计的CoLe饮料瓶贴合品牌定位。此外,Manus还能将用户创作转化为网站并部署,尽管部署速度稍慢,但整体功能强大。用户反馈其图像生成效果良好,但部分任务运行时间较长。Manus的生图功能为设计和建站提供了一站式解决方案,值得尝试。来源:微信公众号【机器之心

5月16日·阶跃星辰与光影焕像联合发布开源3D生成引擎Step1X-3D

谷歌LightLab:用扩散模型实现电影级光影控制

谷歌推出LightLab项目,通过扩散模型实现对单张图像中光影的精准控制。用户可以调节光源强度、颜色,甚至插入虚拟光源。该技术结合真实照片和合成图像构建数据集,利用光的线性特性分离目标光源和环境光,训练模型以实现逼真的光影效果。LightLab不仅支持光强度和颜色的参数化控制,还能添加虚拟点光源和调节环境光,为图像编辑和影视制作提供了强大的工具。实验表明,该方法在跨域泛化和细粒度控制方面优于现有技术,为光影编辑带来了新的突破。来源:微信公众号【机器之心

5月16日·阶跃星辰与光影焕像联合发布开源3D生成引擎Step1X-3D

国产大模型MiniMax Speech-02拿下全球双料第一,语音生成技术突破

国产大模型MiniMax最新发布的Speech-02语音生成领域取得重大突破,一举拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评的第一名,成为榜单前十中唯一的国产玩家。Speech-02展现了极高的语音合成能力,能够实现超拟人、个性化和多样化的语音生成。它支持32种语言,具备强大的音色复刻能力,仅需几秒语音参考即可完成逼真的音色模仿,并支持情绪调整和跨语言生成。技术上,Speech-02采用基于自回归Transformer的架构和Flow-VAE模型,显著提升了语音质量和说话者相似性。此外,MiniMax在商业化落地方面也取得了显著成果,与教育、智能硬件、汽车等多个行业合作,推动AI语音技术的广泛应用。来源:微信公众号【量子位】

5月16日·阶跃星辰与光影焕像联合发布开源3D生成引擎Step1X-3D
© 版权声明

相关文章

暂无评论

暂无评论...