5月27日·华为Pangu Light框架助力大模型高效瘦身与加速

451 0 0

5月27日·周二 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

华为Pangu Light框架助力大模型高效瘦身与加速

华为诺亚方舟实验室推出Pangu Light框架，成功破解大模型压缩难题。该框架通过跨层注意力剪枝（CLAP）、稳定化LayerNorm剪枝（SLNP）及Post-RMSNorm融合优化策略等核心技术，在昇腾NPU硬件支持下，实现模型高效压缩与推理加速。实验显示，Pangu Light在保持高精度的同时，推理速度提升1.6倍，显著优于业界同类方案。这一成果不仅为大模型的高效部署提供了新路径，也为国产AI计算平台的崛起注入强大动力，推动大模型应用门槛大幅降低，助力AI普惠发展。来源：微信公众号【新智元】

谷歌搜索面临AI冲击，商业模式受挑战

谷歌正在用AI重塑搜索，却可能成为AI的“祭品”。AI Overviews和AI Mode的推出，将搜索结果从“信息入口”变为“信息终点”，显著减少用户点击外部网站的需求，冲击了谷歌依赖搜索广告的商业模式。AI Overviews以摘要形式呈现结果，AI Mode则用生成式回答取代传统链接列表。2025年3月，AI Overviews的触发率已翻倍，且在高信任度领域增长迅速。谷歌高管们担心，生成式AI将蚕食搜索业务流量，导致广告点击量下降，搜索广告业务可能在2025年后急剧恶化。谷歌的搜索市场份额已跌破90%，ChatGPT等竞争对手正持续分流用户，谷歌的搜索广告垄断地位面临巨大挑战。来源：微信公众号【新智元】

阿里巴巴通义实验室推出QwenLong-L1-32B，强化长上下文推理能力

阿里巴巴通义实验室近日推出QwenLong-L1-32B模型，专门针对长上下文推理任务进行优化。该模型通过渐进式上下文扩展技术和混合奖励机制，解决了长上下文推理中训练效率低和优化不稳定的问题。实验表明，QwenLong-L1-32B在多个长文档问答基准测试中表现卓越，超越了OpenAI-o3-mini、Qwen3-235B-A22B等旗舰模型，甚至与Claude-3.7-Sonnet-Thinking持平。这一成果为长文本推理优化提供了新的技术方案，适用于金融、法律、科研等复杂领域任务。来源：微信公众号【机器之心】

Visual ARFT让视觉语言模型具备多模态智能体能力

上海交大、上海AI Lab等机构推出Visual ARFT（Visual Agentic Reinforcement Fine-Tuning），旨在赋予视觉语言模型（LVLMs）多模态智能体能力。该方法使模型能够调用搜索引擎、编写并执行代码处理图像，支持多步推理和跨模态泛化。团队还构建了多模态智能体评测基准MAT-Bench，测试结果显示Visual ARFT在多个子任务中全面超越GPT-4o，展现出强大的复杂多模态任务处理能力。Visual ARFT已全面开源，为多模态模型研究提供了新的方向和工具。来源：微信公众号【机器之心】

MiniMax开源视觉RL统一框架V-Triune，推理感知能力大幅提升

MiniMax团队开源了首个视觉强化学习（RL）统一框架V-Triune，首次实现了在单个后训练流程中联合学习视觉推理和感知任务。该框架通过样本级数据格式化、验证器级奖励计算和数据源级指标监控三大组件，以及动态IoU奖励机制，解决了传统RL方法无法兼顾多重任务的问题。基于V-Triune训练的Orsta模型系列（7B至32B）在MEGA-Bench Core基准测试中性能显著提升，从+2.1%提升至+14.1%，尤其在感知任务的mAP指标上表现突出。V-Triune框架和Orsta模型已在GitHub全面开源，为视觉语言模型的多模态任务研究提供了新的工具和思路。来源：微信公众号【量子位】

# AI资讯速递