8月20日·DeepSeek V3.1 Base突袭上线！击败Claude 4编程爆表，全网在蹲R2和V4

2,529 0 0

8月20日·周三 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

DeepSeek V3.1 Base突袭上线！击败Claude 4编程爆表，全网在蹲R2和V4

DeepSeek官方悄然上线了全新的V3.1版本，上下文长度拓展到128k，拥有685B参数，支持多种精度格式。此次更新亮点包括编程能力突出，在Aider编程基准测试中取得71.6%高分，超越Claude 4 Opus，同时推理和响应速度更快。此外，新增了原生「search token」的支持，未来有望采用「混合架构」。成本方面，每次完整编程任务仅需1.01美元，成本仅为专有系统的六十分之一。DeepSeek V3.1的发布引发了社区的广泛关注，大家对即将发布的R2和V4充满期待。来源：微信公众号【新智元】

Meta AI大洗牌！超级智能一拆四，小扎押注硅谷华人，LeCun或已出局

Meta AI 重组，超级智能实验室一分为四 Meta在半年内第四次重组AI部门，超级智能实验室拆分为四个团队：TBD Lab、FAIR、产品和应用团队、基础设施团队。TBD Lab由Alexandr Wang领衔，负责研发新版旗舰大语言模型Llama，可能放弃Llama 4并转向闭源模型。此次重组涉及财务和基建层面的「加码」，Meta选择PIMCO与Blue Owl牵头一笔约290亿美元的数据中心融资。Yann LeCun作为Meta首席AI科学家的身份未被提及，可能已被「架空」。Meta的AI战略正从「研究范式」向「工程落地」转移。来源：微信公众号【新智元】

DeepSeek开源新基础模型，但不是V4，而是V3.1-Base

DeepSeek-V3.1-Base，这是V3系列的最新基础模型。该模型拥有128k上下文长度，采用混合专家（MoE）架构。尽管与V3差别不大，但此次更新引起了AI社区的广泛关注，短短几个小时内冲上了Hugging Face热门模型榜第4位。社区对此次更新看法不一，有人认为这是为V4和R2做铺垫，也有人认为更新不够亮眼。DeepSeek的下一步动作备受期待。来源：微信公众号【机器之心】

北大团队提出INP-CC模型，重塑开放词汇HOI检测

北京大学王选计算机研究所的团队在ICCV 2025上提出了INP-CC模型，用于开放词汇人类-物体交互（HOI）检测。该模型通过交互感知提示生成和概念校准，提升了对开放世界中交互关系的理解。INP-CC在HICO-DET和SWIG-HOI等主流数据集上取得了当前最佳性能。该模型通过动态生成交互感知提示，优化语言模型引导的概念校准，解决了传统方法在细粒度区域交互信息捕捉上的不足。相关代码与模型已全部开源，为多模态感知和生成领域带来了新的突破。来源：微信公众号【机器之心】

DiT遭质疑，作者谢赛宁回应争议

DiT（Diffusion Transformers）作为扩散模型领域的核心基石，近日遭到网友质疑，认为其在数学和形式上存在问题，甚至怀疑DiT是否真的使用了Transformer。质疑者引用了论文《TREAD: Token Routing for Efficient Architecture-agnostic Diffusion Training》中的观点，认为DiT架构存在隐含特性，且在训练过程中表现出的问题可能否定之前的方法。对此，DiT作者谢赛宁回应称，这些质疑缺乏科学依据，评价DiT需要提出假设、做实验、验证结果，而不是凭想象臆断。谢赛宁强调，DiT的改进集中在内部表征学习上，目前团队正在探索更多改进方案。来源：微信公众号【量子位】