9月18日·DeepSeek登上Nature封面:AI推理新范式

9月18日·周四  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

DeepSeek登上Nature封面:AI推理新范式

DeepSeek的R1模型登上《Nature》封面,成为首个经过同行评审的主流大模型。该模型由梁文锋团队开发,采用纯粹的强化学习(RL)训练,训练成本仅为29.4万美元,远低于其他大模型。R1在推理能力上表现出色,例如在AIME 2024竞赛中,其解题准确率从15.6%提升至77.9%,配合“自洽解码”技术后,准确率高达86.7%。此外,R1还展现了自我进化行为,如“思考时间”自主增加和高级推理策略的涌现。DeepSeek团队通过多阶段训练流程,解决了R1的可读性和通用能力问题,使其在多个基准测试中性能大幅提升。这一成果为AI推理的未来发展开辟了新路径。来源:微信公众号【新智元】

9月18日·DeepSeek登上Nature封面:AI推理新范式

OpenAI/Gemini共斩ICPC 2025金牌

在2025年国际大学生程序设计竞赛(ICPC)全球总决赛中,谷歌的GeminiOpenAI的推理模型同时斩获金牌。Gemini在5小时内成功解答了12道题目中的10道,包括难倒所有人类队伍的C题,而OpenAI更是以满分12/12的成绩碾压139支人类队伍,成为唯一全解团队。这一历史性时刻标志着AI在顶级编程比赛中的巨大突破。OpenAI团队中有多位ICPC世界冠军,包括2015年世界冠军Borys Minaiev和算法界传奇人物Tourist。此次比赛结果表明,AI在编程和推理领域的强大能力,预示着其在软件开发等领域的巨大潜力。来源:微信公众号【新智元

9月18日·DeepSeek登上Nature封面:AI推理新范式

通义DeepResearch震撼发布:性能比肩OpenAI,全面开源

阿里巴巴发布通义DeepResearch,一个性能比肩OpenAI的AI模型。该模型在多个权威Deep Research benchmark上取得SOTA效果,并实现了模型、框架和方案的全面开源。通义DeepResearch团队通过创新的数据策略和训练流程,使模型在推理和规划能力上表现出色。其训练流程包括Agentic持续预训练、监督微调和强化学习,确保模型在复杂任务中具有强大的性能。此外,该模型还具备ReAct模式和Heavy模式,分别用于处理简单和复杂的多步研究任务。通义DeepResearch的开源,为研究人员和开发者提供了强大的工具,推动AI技术的进一步发展。来源:微信公众号【机器之心

9月18日·DeepSeek登上Nature封面:AI推理新范式

OneSearch:快手电商搜索的“一步到位”秘技

快手推出业界首个工业级电商搜索端到端生成式框架OneSearch,旨在解决传统电商搜索系统的诸多问题。OneSearch通过关键词增强层次量化编码(KHQE)模块、多视角用户行为序列注入策略和偏好感知奖励系统(PARS),显著提升了搜索的精准度和用户体验。该框架能够精准提取商品核心属性,构建用户偏好模型,并通过强化学习优化搜索结果的排序。在离线和在线实验中,OneSearch均展现出显著的性能提升,订单量提升3.22%,买家数提升2.4%。这一创新技术为电商搜索带来了新的突破,推动了搜索技术的发展。来源:微信公众号【机器之心

9月18日·DeepSeek登上Nature封面:AI推理新范式

华为AI芯片计划:全球最强超节点与超级集群

华为在全联接大会上发布了全球最强算力超节点超级集群。Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点分别支持8192和15488张昇腾卡,预计在2026年第四季度上市,未来2年保持全球算力第一。同时发布的Atlas 950 SuperCluster和Atlas 960 SuperCluster超级集群,算力规模分别超过50万卡和百万卡。华为还公布了昇腾芯片和鲲鹏芯片的未来演进规划,包括昇腾950系列、昇腾960系列和昇腾970系列。通过极致的系统架构和互联技术,华为计划在集群层面实现全面超越,推动AI算力的持续发展。来源:微信公众号【量子位】

9月18日·DeepSeek登上Nature封面:AI推理新范式

© 版权声明

相关文章

暂无评论

暂无评论...