12月21日·OpenAI o3模型突破，AGI时代或将到来

AI资讯速递1年前 (2024)发布 FuturX-Editor

464 0 0

12月21日·周六 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在[图片]这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的o g zAI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

OpenAI o3模型突破，AGI时代或将到来

OpenAI近日发布了新一代推理模型o3，其在多项基准测试中刷新了SOTA，尤其在数学、代码和软件工程领域显著超越前代o1。o3在AIME 2024数学竞赛评测中准确率高达96.7%，而在博士级科学问答基准GPQA Diamond上准确率为87.7%，显示出接近人类水平的表现。此外，o3在ARC-AGI基准测试中打破所有AI纪录，尽管成本较高，但其性能的提升标志着AI能力实现了质的飞跃。o3-mini作为o3系列的新成员，也展现出在成本效益和推理深度上的新突破。尽管o3并非真正的AGI，但其在泛化能力上的表现，为AI领域的发展提供了宝贵的数据点，预示着通用人工智能的持续探索。来源：微信公众号【新智元】

北大等联合优化Stable-Diffusion.cpp，图像生成效率提升4.8倍

北京大学、东北大学和佐治亚大学的研究团队宣布，他们对Stable-Diffusion.cpp（Sdcpp）框架进行了重大优化，通过引入Winograd算法和多项策略，显著提升了图像生成速度和内存效率，最高提速达到4.79倍。Sdcpp是Stable Diffusion模型的C/C++实现，旨在提高CPU（及可能的GPU）上的高效推理。优化策略包括分步处理、局部优化和并行处理，有效降低了缓存交换并提高内存使用效率，同时充分利用多线程和多核心架构。优化后的Sdcpp支持多种设备和模型，包括主流Stable Diffusion模型和不同硬件平台，如Mac、Android、AMD等，进一步提升了AI图像生成的应用范围和效率。来源：微信公众号【新智元】

MetaMorph模型：统一视觉理解与生成的新突破

Meta和纽约大学的合作论文提出了MetaMorph模型，这是一个通过指令调整实现多模态理解和生成的统一模型。该模型通过视觉预测指令调整（VPiT）扩展了现有的指令调整方法，使得大型语言模型（LLM）能够输出连续视觉token和离散文本token。MetaMorph利用预训练的视觉编码器嵌入和文本token作为输入，输出文本和视觉token的组合，并通过扩散模型将视觉token映射回像素空间。研究结果表明，理解和生成视觉token的能力具有内在联系，增加理解数据可以提高视觉理解和生成性能。MetaMorph在视觉理解和视觉生成基准上都展现了竞争力的表现，证明了使用指令调整来训练统一模型的可行性，并展示了LLM在视觉功能上的强大潜力。来源：微信公众号【机器之心】

逆向思维提升LLM推理能力，DeepMind新研究

北卡罗来纳大学教堂山分校与谷歌的研究表明，逆向思维不仅适用于人类，也能显著提升大型语言模型（LLM）的推理能力。研究团队提出了名为RevThink的框架，通过数据增强和新的学习目标，将逆向思维能力“灌输”给语言模型。RevThink框架包含两个阶段：首先使用更强大的教师模型对推理数据集进行增强，生成正向推理、逆向问题和逆向推理的新数据；然后通过三个关键目标训练学生模型，使其学会基于问题生成正向推理、基于原始问题生成逆向问题以及基于逆向问题生成逆向推理。实验结果表明，RevThink在多种任务上均优于基线，平均提升12.68%至14.37%，并且在常识推理、表格推理和日期理解等方面表现出更好的泛化能力。这项研究证明了逆向思维在提升LLM正向推理效果方面的潜力。来源：微信公众号【机器之心】

图森未来转型半年：AI大模型Ruyi发布，布局游戏生态

图森未来宣布启用新品牌CreateAI，并在AIGC领域取得多项进展。公司将基于武侠IP《金庸群侠传》开发大型开放世界RPG游戏，并与河森正治合作《三体》项目。图森未来发布首个大模型产品Ruyi，定位于开源图生视频领域，旨在打造针对游戏和动画制作的AI生成式工具。公司计划5年内将制作成本和开发周期降低70%，通过自研游戏让大模型参与游戏及动画制作，缩短开发周期并提升商业价值。图森未来在无人驾驶业务上保持轻资产运营，专注于专利和数据对外授权。公司转型的决心源于无人驾驶业务的高成本和市场挑战，以及游戏和动漫行业的蓬勃发展。图森未来董事长陈默表示，公司希望利用生成式AI技术重新定义数字化娱乐内容的制作。公司目标在2026年实现收支平衡，通过新业务给市场和投资人一个交代。

来源：微信公众号【量子位】