12月21日·OpenAI o3模型突破,AGI时代或将到来
12月21日·周六 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
OpenAI o3模型突破,AGI时代或将到来
北大等联合优化Stable-Diffusion.cpp,图像生成效率提升4.8倍
北京大学、东北大学和佐治亚大学的研究团队宣布,他们对Stable-Diffusion.cpp(Sdcpp)框架进行了重大优化,通过引入Winograd算法和多项策略,显著提升了图像生成速度和内存效率,最高提速达到4.79倍。Sdcpp是Stable Diffusion模型的C/C++实现,旨在提高CPU(及可能的GPU)上的高效推理。优化策略包括分步处理、局部优化和并行处理,有效降低了缓存交换并提高内存使用效率,同时充分利用多线程和多核心架构。优化后的Sdcpp支持多种设备和模型,包括主流Stable Diffusion模型和不同硬件平台,如Mac、Android、AMD等,进一步提升了AI图像生成的应用范围和效率。来源:微信公众号【新智元】
MetaMorph模型:统一视觉理解与生成的新突破
Meta和纽约大学的合作论文提出了MetaMorph模型,这是一个通过指令调整实现多模态理解和生成的统一模型。该模型通过视觉预测指令调整(VPiT)扩展了现有的指令调整方法,使得大型语言模型(LLM)能够输出连续视觉token和离散文本token。MetaMorph利用预训练的视觉编码器嵌入和文本token作为输入,输出文本和视觉token的组合,并通过扩散模型将视觉token映射回像素空间。研究结果表明,理解和生成视觉token的能力具有内在联系,增加理解数据可以提高视觉理解和生成性能。MetaMorph在视觉理解和视觉生成基准上都展现了竞争力的表现,证明了使用指令调整来训练统一模型的可行性,并展示了LLM在视觉功能上的强大潜力。来源:微信公众号【机器之心】
逆向思维提升LLM推理能力,DeepMind新研究
图森未来转型半年:AI大模型Ruyi发布,布局游戏生态
图森未来宣布启用新品牌CreateAI,并在AIGC领域取得多项进展。公司将基于武侠IP《金庸群侠传》开发大型开放世界RPG游戏,并与河森正治合作《三体》项目。图森未来发布首个大模型产品Ruyi,定位于开源图生视频领域,旨在打造针对游戏和动画制作的AI生成式工具。公司计划5年内将制作成本和开发周期降低70%,通过自研游戏让大模型参与游戏及动画制作,缩短开发周期并提升商业价值。图森未来在无人驾驶业务上保持轻资产运营,专注于专利和数据对外授权。公司转型的决心源于无人驾驶业务的高成本和市场挑战,以及游戏和动漫行业的蓬勃发展。图森未来董事长陈默表示,公司希望利用生成式AI技术重新定义数字化娱乐内容的制作。公司目标在2026年实现收支平衡,通过新业务给市场和投资人一个交代。
来源:微信公众号【量子位】
【今日案例】
AI合成名人直播带货的法律问题
https://yuanbao.tencent.com/bot/app/share/chat/2bbb7486f01e5edd6f89a19d45d7c652