11月10日·阿里 ROLL 团队推动 RL4LLM 全栈协同优化

195 0 0

11月10日·周一 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

阿里 ROLL 团队推动 RL4LLM 全栈协同优化

阿里巴巴 ROLL 团队联合上海交通大学、香港科技大学推出「3A」协同优化框架，包括 Async 架构、Asymmetric PPO 与 Attention 机制，致力于推动强化学习用于大语言模型（RL4LLM）迈向高效、精细与可解释的新范式。其中，Async 架构通过细粒度并行与采样 – 训练解耦，实现全链路异步执行，显著提升 GPU 利用率；Asymmetric PPO 首次系统论证评论家的参数规模与价值估计能力并无必然关联，仅需两个小型评论家即可提升推理性能与训练鲁棒性；Attention 机制被重新定义为揭示模型推理过程内在逻辑的「结构化蓝图」，并基于此设计推理结构感知的动态奖励分配机制。来源：微信公众号【机器之心】

多模态 LLM 新范式「空间超感知」登场

纽约大学助理教授谢赛宁与李飞飞、Yann LeCun 联合提出「Cambrian-S」，探索视频空间超感知。该研究认为，构建「超级智能」之前必须先构建「超感知」，并划分了多模态智能从现代到未来的发展路径，包括语义感知、流式事件认知、隐式 3D 空间认知和预测性世界建模。团队在 Cambrian-S 上训练了一个潜变量帧预测（LFP）头，通过「惊讶度」进行记忆管理和事件分割，在空间认知任务上取得显著提升。来源：微信公众号【机器之心】

让 LLM 像人一样读长文本

在 NeurIPS 2025 论文中，南京理工大学、中南大学、南京林业大学的研究团队提出 VIST（Vision-centric Token Compression in LLM），为大语言模型的长文本高效推理提供视觉解决方案。VIST 模仿人类「快 – 慢阅读通路」的视觉化压缩机制，通过快路径将远处、次要上下文渲染为图像，由轻量级视觉编码器提取显著性语义；慢路径则将关键近处文本直接输入 LLM 进行深层推理与语言生成。该设计让模型具备「像人一样速读」的能力，处理相同文本内容时所需视觉 Token 数量仅为传统文本分词所需 Token 数量的 56%，内存减少 50%。来源：微信公众号【机器之心】

AI IDE：国产模型实现 AI 编程新突破

全球首个实现项目级开发的 AI IDE——Vinsoo 发布 Beta 3.0 版本，仅用国产大模型（Qwen）就超越了搭载 Claude 的 Cursor、Codex、Claude Code 等流行 AI 编程产品。Vinsoo 解决了超长上下文工程的算法突破、支持同步运行的 multi-agent 架构、系统性感知能力强化和与基座模型能力解耦等四个核心问题，实现从需求确认到交付验收的 AI 全流程自动推进项目开发。其背后团队由 00 后主导，汇聚了中美顶尖学府的硕博士及资深工程师。来源：微信公众号【量子位】

银河通用灵巧手实现从能动到能用的飞跃

银河通用推出灵巧手神经动力学模型 DexNDM，让灵巧手在无需成功示例的情况下，通过分布有偏的真实数据训练，即可精准弥合 Sim2Real 鸿沟，实现对多类物体的稳定、多姿态、多轴向旋转操作。DexNDM 的核心在于关节级神经动力学模型，将复杂的手 – 物交互拆解到关节级，让每个关节独立预测自身的下一状态。团队还开发了全自动数据收集策略和残差策略网络，进一步提升了模型的操作灵活性、鲁棒性与泛化能力。来源：微信公众号【量子位】