12月21日·Claude Opus 4.5震惊全网,AI自主编码能力迈向新高度
12月21日·周日 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
Claude Opus 4.5震惊全网,AI自主编码能力迈向新高度
Anthropic的Claude Opus 4.5在AI编码智能体领域取得了重大突破,能够持续自主编码长达5小时,超越了OpenAI的GPT-5.1-Codex-Max。这一成果表明,AI编码智能体的任务时长正在从“分钟级”向“小时级”迈进,且增速还在提升。2019-2024年,任务时长每7个月翻一倍,而2024-2025年则缩短至每4个月翻一倍。这一趋势预示着,到2026年,AI智能体将能独立完成一个完整的人类工作日任务,而到2030年,AI有望承担小型企业或组织的大部分管理工作。然而,AI在长期记忆方面仍面临挑战,这成为通往AGI的关键难题。未来,记忆系统和学习能力将成为AI发展的核心议题。来源:微信公众号【机器之心】
全流程开源,国产算力预训练模型“开元-2B”发布
鹏城实验室与清华大学联合发布了“开元-2B”模型,并实现了全流程开源,涵盖训练数据、数据处理框架、训练框架、技术报告及模型权重。该模型依托鹏城脑海2计算平台,基于华为鲲鹏920和昇腾910A完成训练,引入“三明治范数”与“软裁剪”技术,解决了FP16精度下的训练稳定性问题。同时,团队开发了Kaiyuan-Spark数据处理框架,采用树状流水线设计,实现TB级数据的高效去重与质量评价。此外,通过多阶段动态比例调整、策略性数据重复和多领域混合课程学习等策略,优化了数据利用效率。这一开源项目为国内研究者在国产算力平台上开展模型预训练提供了完整的工具箱,推动了国产AI生态的共建。来源:微信公众号【机器之心】
文生图模型安全风险凸显,天津大学团队系统梳理防御体系
随着扩散模型在图像生成领域的广泛应用,其安全问题日益受到关注。天津大学团队发表的综述论文系统梳理了文生图模型的攻击方式、风险类型、威胁场景与防御体系。研究指出,攻击者可通过精心设计的输入操控模型生成有害图像,攻击方式包括非目标攻击(暴露模型鲁棒性不足)和目标攻击(诱导生成高风险内容)。现有防御策略主要分为鲁棒性防御和安全性防御,但这些方法仍存在不足,未来需要建立更体系化的防护体系,以应对日益隐蔽和自动化的对抗攻击。来源:微信公众号【机器之心】
上海AI Lab提出RePro范式,让大模型推理更高效
上海人工智能实验室的研究团队提出了一种新的后训练范式——RePro(Rectifying Process-level Reward),旨在解决大模型在复杂推理任务中的“过度思考”问题。RePro将推理过程视为模型内部状态的优化过程,通过设计代理目标函数、双重评分机制和流程级奖励整合进RL训练,引导模型生成更高效、更稳定的推理路径。实验结果表明,RePro在数学、科学和代码生成等多个任务上均显著提升了模型的推理效率和准确性,同时减少了推理过程中生成的冗余Token数量和回溯行为,为大模型的高效推理提供了新的解决方案。来源:微信公众号【量子位】
SGLang原生支持昇腾,推理系统工程化取得新进展
在12月20日举办的SGLang AI金融π对活动上,昇腾作为算力平台被多次提及。当前,昇腾已作为SGLang原生支持的后端之一进入主仓库,DeepSeek、Qwen、GLM等模型可在不调整参数的情况下直接运行。活动中展示了SGLang在昇腾平台上的最新进展,包括模型适配、性能优化及系统加速能力模块化沉淀。例如,通过HiCache体系优化KV cache管理,显著降低了显存占用;Mooncake系统则通过异步预读和pipeline并行设计,大幅压缩了权重加载和模型启动时间。此外,昇腾还针对多类主流模型进行了优化,支持稠密、稀疏、多模态等架构,并实现了多流并行和算子融合等技术,提升了推理效率。这些进展标志着昇腾与SGLang在推理系统层面的深度协同,为AI算力与开源推理框架的融合进入新阶段。来源:微信公众号【量子位】