5月27日·华为Pangu Light框架助力大模型高效瘦身与加速

5月27日·周二  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

华为Pangu Light框架助力大模型高效瘦身与加速

华为诺亚方舟实验室推出Pangu Light框架,成功破解大模型压缩难题。该框架通过跨层注意力剪枝(CLAP)、稳定化LayerNorm剪枝(SLNP)及Post-RMSNorm融合优化策略等核心技术,在昇腾NPU硬件支持下,实现模型高效压缩与推理加速。实验显示,Pangu Light在保持高精度的同时,推理速度提升1.6倍,显著优于业界同类方案。这一成果不仅为大模型的高效部署提供了新路径,也为国产AI计算平台的崛起注入强大动力,推动大模型应用门槛大幅降低,助力AI普惠发展。来源:微信公众号【新智元

5月27日·华为Pangu Light框架助力大模型高效瘦身与加速

谷歌搜索面临AI冲击,商业模式受挑战

谷歌正在用AI重塑搜索,却可能成为AI的“祭品”。AI Overviews和AI Mode的推出,将搜索结果从“信息入口”变为“信息终点”,显著减少用户点击外部网站的需求,冲击了谷歌依赖搜索广告的商业模式。AI Overviews以摘要形式呈现结果,AI Mode则用生成式回答取代传统链接列表。2025年3月,AI Overviews的触发率已翻倍,且在高信任度领域增长迅速。谷歌高管们担心,生成式AI将蚕食搜索业务流量,导致广告点击量下降,搜索广告业务可能在2025年后急剧恶化。谷歌的搜索市场份额已跌破90%,ChatGPT等竞争对手正持续分流用户,谷歌的搜索广告垄断地位面临巨大挑战。来源:微信公众号【新智元

5月27日·华为Pangu Light框架助力大模型高效瘦身与加速

阿里巴巴通义实验室推出QwenLong-L1-32B,强化长上下文推理能力

阿里巴巴通义实验室近日推出QwenLong-L1-32B模型,专门针对长上下文推理任务进行优化。该模型通过渐进式上下文扩展技术和混合奖励机制,解决了长上下文推理中训练效率低和优化不稳定的问题。实验表明,QwenLong-L1-32B在多个长文档问答基准测试中表现卓越,超越了OpenAI-o3-mini、Qwen3-235B-A22B等旗舰模型,甚至与Claude-3.7-Sonnet-Thinking持平。这一成果为长文本推理优化提供了新的技术方案,适用于金融、法律、科研等复杂领域任务。来源:微信公众号【机器之心

5月27日·华为Pangu Light框架助力大模型高效瘦身与加速

Visual ARFT让视觉语言模型具备多模态智能体能力

上海交大、上海AI Lab等机构推出Visual ARFT(Visual Agentic Reinforcement Fine-Tuning),旨在赋予视觉语言模型(LVLMs)多模态智能体能力。该方法使模型能够调用搜索引擎、编写并执行代码处理图像,支持多步推理和跨模态泛化。团队还构建了多模态智能体评测基准MAT-Bench,测试结果显示Visual ARFT在多个子任务中全面超越GPT-4o,展现出强大的复杂多模态任务处理能力。Visual ARFT已全面开源,为多模态模型研究提供了新的方向和工具。来源:微信公众号【机器之心

5月27日·华为Pangu Light框架助力大模型高效瘦身与加速

MiniMax开源视觉RL统一框架V-Triune,推理感知能力大幅提升

MiniMax团队开源了首个视觉强化学习(RL)统一框架V-Triune,首次实现了在单个后训练流程中联合学习视觉推理和感知任务。该框架通过样本级数据格式化、验证器级奖励计算和数据源级指标监控三大组件,以及动态IoU奖励机制,解决了传统RL方法无法兼顾多重任务的问题。基于V-Triune训练的Orsta模型系列(7B至32B)在MEGA-Bench Core基准测试中性能显著提升,从+2.1%提升至+14.1%,尤其在感知任务的mAP指标上表现突出。V-Triune框架和Orsta模型已在GitHub全面开源,为视觉语言模型的多模态任务研究提供了新的工具和思路。来源:微信公众号【量子位】

5月27日·华为Pangu Light框架助力大模型高效瘦身与加速
© 版权声明

相关文章

暂无评论

暂无评论...