8月20日·DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4
8月20日·周三 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4
DeepSeek官方悄然上线了全新的V3.1版本,上下文长度拓展到128k,拥有685B参数,支持多种精度格式。此次更新亮点包括编程能力突出,在Aider编程基准测试中取得71.6%高分,超越Claude 4 Opus,同时推理和响应速度更快。此外,新增了原生「search token」的支持,未来有望采用「混合架构」。成本方面,每次完整编程任务仅需1.01美元,成本仅为专有系统的六十分之一。DeepSeek V3.1的发布引发了社区的广泛关注,大家对即将发布的R2和V4充满期待。来源:微信公众号【新智元】

Meta AI大洗牌!超级智能一拆四,小扎押注硅谷华人,LeCun或已出局
Meta AI重组,超级智能实验室一分为四 Meta在半年内第四次重组AI部门,超级智能实验室拆分为四个团队:TBD Lab、FAIR、产品和应用团队、基础设施团队。TBD Lab由Alexandr Wang领衔,负责研发新版旗舰大语言模型Llama,可能放弃Llama 4并转向闭源模型。此次重组涉及财务和基建层面的「加码」,Meta选择PIMCO与Blue Owl牵头一笔约290亿美元的数据中心融资。Yann LeCun作为Meta首席AI科学家的身份未被提及,可能已被「架空」。Meta的AI战略正从「研究范式」向「工程落地」转移。来源:微信公众号【新智元】

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base
DeepSeek-V3.1-Base,这是V3系列的最新基础模型。该模型拥有128k上下文长度,采用混合专家(MoE)架构。尽管与V3差别不大,但此次更新引起了AI社区的广泛关注,短短几个小时内冲上了Hugging Face热门模型榜第4位。社区对此次更新看法不一,有人认为这是为V4和R2做铺垫,也有人认为更新不够亮眼。DeepSeek的下一步动作备受期待。来源:微信公众号【机器之心】

北大团队提出INP-CC模型,重塑开放词汇HOI检测
北京大学王选计算机研究所的团队在ICCV 2025上提出了INP-CC模型,用于开放词汇人类-物体交互(HOI)检测。该模型通过交互感知提示生成和概念校准,提升了对开放世界中交互关系的理解。INP-CC在HICO-DET和SWIG-HOI等主流数据集上取得了当前最佳性能。该模型通过动态生成交互感知提示,优化语言模型引导的概念校准,解决了传统方法在细粒度区域交互信息捕捉上的不足。相关代码与模型已全部开源,为多模态感知和生成领域带来了新的突破。来源:微信公众号【机器之心】

DiT遭质疑,作者谢赛宁回应争议
DiT(Diffusion Transformers)作为扩散模型领域的核心基石,近日遭到网友质疑,认为其在数学和形式上存在问题,甚至怀疑DiT是否真的使用了Transformer。质疑者引用了论文《TREAD: Token Routing for Efficient Architecture-agnostic Diffusion Training》中的观点,认为DiT架构存在隐含特性,且在训练过程中表现出的问题可能否定之前的方法。对此,DiT作者谢赛宁回应称,这些质疑缺乏科学依据,评价DiT需要提出假设、做实验、验证结果,而不是凭想象臆断。谢赛宁强调,DiT的改进集中在内部表征学习上,目前团队正在探索更多改进方案。来源:微信公众号【量子位】
