11月10日·阿里 ROLL 团队推动 RL4LLM 全栈协同优化
11月10日·周一 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
阿里 ROLL 团队推动 RL4LLM 全栈协同优化
阿里巴巴 ROLL 团队联合上海交通大学、香港科技大学推出「3A」协同优化框架,包括 Async 架构、Asymmetric PPO 与 Attention 机制,致力于推动强化学习用于大语言模型(RL4LLM)迈向高效、精细与可解释的新范式。其中,Async 架构通过细粒度并行与采样 – 训练解耦,实现全链路异步执行,显著提升 GPU 利用率;Asymmetric PPO 首次系统论证评论家的参数规模与价值估计能力并无必然关联,仅需两个小型评论家即可提升推理性能与训练鲁棒性;Attention 机制被重新定义为揭示模型推理过程内在逻辑的「结构化蓝图」,并基于此设计推理结构感知的动态奖励分配机制。来源:微信公众号【机器之心】
多模态 LLM 新范式「空间超感知」登场
纽约大学助理教授谢赛宁与李飞飞、Yann LeCun 联合提出「Cambrian-S」,探索视频空间超感知。该研究认为,构建「超级智能」之前必须先构建「超感知」,并划分了多模态智能从现代到未来的发展路径,包括语义感知、流式事件认知、隐式 3D 空间认知和预测性世界建模。团队在 Cambrian-S 上训练了一个潜变量帧预测(LFP)头,通过「惊讶度」进行记忆管理和事件分割,在空间认知任务上取得显著提升。来源:微信公众号【机器之心】
让 LLM 像人一样读长文本
在 NeurIPS 2025 论文中,南京理工大学、中南大学、南京林业大学的研究团队提出 VIST(Vision-centric Token Compression in LLM),为大语言模型的长文本高效推理提供视觉解决方案。VIST 模仿人类「快 – 慢阅读通路」的视觉化压缩机制,通过快路径将远处、次要上下文渲染为图像,由轻量级视觉编码器提取显著性语义;慢路径则将关键近处文本直接输入 LLM 进行深层推理与语言生成。该设计让模型具备「像人一样速读」的能力,处理相同文本内容时所需视觉 Token 数量仅为传统文本分词所需 Token 数量的 56%,内存减少 50%。来源:微信公众号【机器之心】
AI IDE:国产模型实现 AI 编程新突破
全球首个实现项目级开发的 AI IDE——Vinsoo 发布 Beta 3.0 版本,仅用国产大模型(Qwen)就超越了搭载 Claude 的 Cursor、Codex、Claude Code 等流行 AI 编程产品。Vinsoo 解决了超长上下文工程的算法突破、支持同步运行的 multi-agent 架构、系统性感知能力强化和与基座模型能力解耦等四个核心问题,实现从需求确认到交付验收的 AI 全流程自动推进项目开发。其背后团队由 00 后主导,汇聚了中美顶尖学府的硕博士及资深工程师。来源:微信公众号【量子位】
银河通用灵巧手实现从能动到能用的飞跃
银河通用推出灵巧手神经动力学模型 DexNDM,让灵巧手在无需成功示例的情况下,通过分布有偏的真实数据训练,即可精准弥合 Sim2Real 鸿沟,实现对多类物体的稳定、多姿态、多轴向旋转操作。DexNDM 的核心在于关节级神经动力学模型,将复杂的手 – 物交互拆解到关节级,让每个关节独立预测自身的下一状态。团队还开发了全自动数据收集策略和残差策略网络,进一步提升了模型的操作灵活性、鲁棒性与泛化能力。来源:微信公众号【量子位】