4月13日·OpenAI新动作:最强开源模型挑战DeepSeek,ChatGPT非AGI引热议
4月13日·周日 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
OpenAI新动作:最强开源模型挑战DeepSeek,ChatGPT非AGI引热议
奥特曼在TED大会上透露,OpenAI正在开发一款强大且媲美顶尖LLM的开源模型,直面DeepSeek的竞争。同时,一款名为Optimus Alpha的神秘模型在OpenRouter平台上一夜爆红,据称是o4-mini,每日处理高达260亿token,是Claude用量的4倍。该模型在多文件协同处理、设计美学感知、复杂系统理解等方面表现出色,尤其在编程和技术任务上性能卓越。此外,奥特曼还回应了ChatGPT是否为AGI的问题,明确表示ChatGPT还不能自主学习和提升,因此不属于AGI。他强调,AI的未来将带来巨大变革,但需关注其安全性。来源:微信公众号【新智元】

苹果AI发展受挫,Siri升级计划延迟至2026年
苹果在2024年全球开发者大会上展示了AI版Siri的宏伟蓝图,承诺将其打造成iPhone的“超级大脑”,但仅九个月后,这一愿景因内部技术方向的摇摆和高管间的矛盾而化为泡影。苹果原计划推出“迷你鼠”和“大力鼠”两种模型,分别处理简单和复杂任务,但后来决定构建全能大模型,导致技术方向大幅调整,团队疲惫不堪。最终,Siri新功能发布时间被推迟到2026年。此外,苹果内部AI团队与软件工程团队之间的矛盾也日益加剧,双方在管理风格、薪资待遇和项目主导权上存在分歧。苹果AI发展面临诸多挑战,未来之路充满不确定性。来源:微信公众号【新智元】

3D领域“源神”再推新项目,助力三维部件编辑与自动绑定
国内专注于3D大模型的创业公司VAST近日开源了两个新项目:HoloPart和UniRig。HoloPart是一种新型扩散模型,能够为任意三维模型生成完整、可编辑的部件,即使部件被遮挡也能推断出完整的几何结构。它通过双重注意力机制,实现局部细节与整体结构的完美融合,解锁了直观编辑、材质分配、动画资产生成等强大应用。UniRig则是一个通用自动绑定框架,基于自回归模型和创新的骨骼树Tokenization方法,能够高效预测3D骨骼结构,并精准预测蒙皮权重和骨骼属性,显著提升自动绑定的精度和通用性。这两个项目为3D内容创作带来了新的突破。来源:微信公众号【机器之心】

华为盘古Ultra发布:昇腾原生135B稠密通用大模型
华为盘古团队近日发布了昇腾原生的千亿级通用语言大模型Pangu Ultra。该模型拥有1350亿参数、94层Transformer架构,采用SwiGLU激活和GQA注意力机制。针对超深模型训练稳定性问题,Pangu Ultra提出了Depth-scaled Sandwich-Norm(DSSN)和TinyInit两项技术,确保训练全程无loss突刺。此外,该模型通过优化分词器、长序列扩展和系统优化策略,在8192张昇腾NPU集群上实现了超过50%的算力利用率。Pangu Ultra在多个领域和评测中超越Llama 405B和Mistral Large等模型,展现了强大的语言理解和推理能力。该模型的成功证明了基于国产昇腾芯片的大规模语言模型开发的可行性,为国内大模型技术发展提供了新的思路。来源:微信公众号【机器之心】

最强32B中文推理大模型Skywork-OR1开源,性能超越DeepSeek-R1
昆仑万维旗下的Skywork-OR1系列模型近日开源,其中32B版本在推理能力上超越了同规模的阿里QwQ-32B,甚至在代码生成方面媲美DeepSeek-R1,但参数量仅为DeepSeek-R1的1/20。该系列模型包括Skywork-OR1-Math-7B(数学专项)、Skywork-OR1-7B-Preview(通用与专业兼顾)和Skywork-OR1-32B-Preview(旗舰版本)。所有模型的权重、训练数据集和完整代码均已开源,可在GitHub和Huggingface平台获取。Skywork-OR1系列在数学推理和代码生成方面表现出色,尤其在AIME24/25和LiveCodeBench等基准测试中达到同规模最优性能。该系列模型还引入了avg@k评估指标,更全面地衡量模型的稳定性和推理能力。此外,Skywork-OR1通过高质量数据集、多阶段训练和优化策略,显著提升了训练效率和模型性能。预计两周后将发布正式版本,进一步提升模型能力。来源:微信公众号【量子位】
