2月26日·马斯克官宣Grok 4.20 Beta上线，内置4智能体协作系统

6 0 0

2月26日·周四 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

马斯克官宣Grok 4.20 Beta上线，内置4智能体协作系统

xAI创始人马斯克在社交平台宣布Grok 4.20 Beta版本正式上线，此次更新采用”4 Agents”架构，内置4个分工明确的智能体协同工作。与此前版本不同，Grok 4.20具备快速学习能力，可通过用户真实交互每周持续迭代优化。据内测信息，4个智能体分别为：Grok（协调者，负责综合输出）、Harper（研究专家，实时事实核查）、Benjamin（逻辑/编程/数学专家）和Lucas（创意达人，探索替代方案）。用户提问时，系统内部会进行多轮讨论并达成共识，大幅降低幻觉率约65%，提升工程、预测等复杂任务的可靠性。第三方评测机构Arena AI数据显示，Grok 4.20在评估搜索实时信息能力的Search Arena中排名第一，超越GPT-5.2、Gemini 3.0 Pro等模型；在Text Arena通用文本能力评测中位列第四。值得注意的是，马斯克发布推文时将”Grok”误拼为”Gork”，且xAI尚未发布官方技术博客或详细文档，延续了其一贯的非正式风格。目前用户需在界面中手动选择该版本才能体验。来源：微信公众号【机器之心】

前苹果AI负责人庞若鸣弃Meta 2亿美元薪酬转投OpenAI

据路透社与The Information报道，前苹果AI负责人、Meta Superintelligence Labs基础设施主管庞若鸣已加入OpenAI，此前Meta为其开出的多年期薪酬包价值超过2亿美元。庞若鸣本科毕业于上海交通大学，职业生涯横跨谷歌、苹果、Meta三大科技巨头：在谷歌工作15年负责大规模AI平台和语音技术；在苹果领导基础模型开发，其离职对苹果设备端AI布局造成重创；去年加入Meta负责AI基础设施建设。尽管庞若鸣上周离职前向同事表示在Meta工作愉快，且公司基础设施状况良好，但最终还是选择接受OpenAI的积极招揽。此次人事变动是Meta AI团队近期人才流失浪潮的缩影，此前Meta超智能实验室开发者平台产品负责人Mat Velloso在职仅数月便宣布离职，首席AI科学家Yann LeCun也于去年离开公司。分析认为，在通往AGI的关键节点，顶级基础设施人才的流向预示着技术权力的转移，即便天价薪酬也难以阻挡人才向核心AGI研发机构聚集的趋势。来源：微信公众号【机器之心】

北大团队提出DistDF框架，以Wasserstein距离重构时序预测损失函数

北京大学林宙辰团队联合小红书、浙江大学等机构在ICLR 2026发表DistDF研究，提出将时间序列预测重新定义为条件分布对齐问题，以解决传统MSE损失函数在标签序列自相关性场景下的有偏性问题。现有直接预测范式（DF）普遍采用时序均方误差（TMSE）作为损失函数，但该方法默认各预测步相互独立，忽略了时间序列数据固有的自相关结构，导致似然估计存在偏差。DistDF创新性地引入联合分布Wasserstein距离作为损失函数，通过最小化预测序列与标签序列条件分布之间的Wasserstein距离来训练模型，既能保证无偏训练，又能充分考虑标签序列内的几何结构。该框架为最优传输等分布对齐技术赋能预测问题提供了全新理论框架，在保持模型并行计算优势的同时，显著提升了预测精度和可靠性。研究团队已开源代码，为时序预测领域提供了从”点估计”向”分布估计”转型的重要工具，有望推动金融、气象、能源等依赖时序预测的行业应用升级。来源：微信公众号【机器之心】

Perplexity发布Computer产品，2000美元年费挑战3万美元彭博终端

AI搜索公司Perplexity正式发布Perplexity Computer，定位为基于浏览器的全能型通用数字员工，整合推理、委派、搜索、编码、部署等AI能力，订阅Perplexity Max（2000美元/年）即可使用，价格仅为彭博终端标准年费（2.5万-3万美元）的1/12。该产品由Claude Opus 4.6作为核心调度，可同时调用Gemini、Grok、ChatGPT 5.2等19个模型，通过sub-agents分工处理复杂任务，支持持续运行数小时甚至数月。发布后5小时内，已有网友用其搭建出分析英伟达股票的平民版彭博终端。与OpenClaw强调本地系统控制不同，Perplexity Computer运行在浏览器”安全沙盒”中，不触碰用户主系统，通过隔离机制降低安全风险。其定位介于OpenClaw（主控桌面）和Claude Cowork（企业协作）之间，主打”2026年个人电脑”概念。不过业内人士质疑，若OpenAI、谷歌、Anthropic等模型提供商限制API访问，该产品将面临与OpenClaw类似的平台依赖风险。来源：微信公众号【机器之心】

扩散模型Mercury 2实现每秒1009 tokens，英伟达微软参投

初创公司Inception AI发布全球首个深度思考扩散模型Mercury 2，在英伟达GPU上实现每秒1009个tokens的生成速度，比GPT-5 mini和Claude 4.5 Haiku等传统自回归模型快5倍以上。与传统模型”打字机式”逐字生成不同，Mercury 2采用”编辑式”并行优化机制，先生成答案草稿再整体编辑，延迟不再与输出长度成正比，端到端延迟低至1.7秒。在GPQA科学问答、LCB编程、AIME数学等基准测试中，Mercury 2得分普遍高于或持平于速度更慢的小型模型，甚至在AIME数学测试中超过Gemini 3 Flash推理版，证明高速不以牺牲智能为代价。第三方测评显示，其在”智能-速度”象限中处于最吸引投资者的领先位置。该产品获英伟达、微软等科技巨头投资，英伟达官方发推祝贺其在Blackwell GPU上的极速表现。网友热议认为，这一突破对需要端到端语音流水线的OpenClaw类系统具有关键价值，标志着AI生成范式可能从自回归向扩散模型转型。来源：微信公众号【量子位】