9月14日·进化算法助力大模型内存优化,KV Cache预算降至1.5%

9月14日·周日  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

进化算法助力大模型内存优化,KV Cache预算降至1.5%

在大语言模型(LLM)的推理过程中,键值缓存(KV Cache)是提升运行效率的关键技术,但其内存占用问题一直是技术瓶颈。近期,中国科学院大学、中国科学院自动化研究所与苏黎世联邦理工学院的研究团队提出了EvolKV框架,通过进化算法优化KV Cache的分配策略。EvolKV将每层KV Cache预算视为优化变量,采用进化算法迭代搜索最优配置,从而在不同任务中实现内存占用与性能的平衡。实验表明,EvolKV在仅使用完整模型1.5%的KV Cache预算时,性能显著优于完整模型,大幅降低了推理成本。这一成果为大模型的实际部署提供了全新的内存优化思路。来源:微信公众号【机器之心】

9月14日·进化算法助力大模型内存优化,KV Cache预算降至1.5%

Cursor用在线强化学习优化代码建议,提升开发者体验

代码编辑器Cursor通过在线强化学习技术优化了其核心功能——Tab键代码建议。传统AI代码建议工具常因“过度热情”而打断开发者思路,Cursor的新Tab模型将用户交互(接受/拒绝建议)视为强化信号,实时优化模型。与旧模型相比,新模型建议数量减少21%,但接受率提升了28%。Cursor采用高频部署策略,每隔1.5-2小时更新一次模型,利用实时数据进行快速训练,颠覆了传统长周期训练模式。这一创新不仅提升了编码体验,还被开发者视为重要的生产力工具,甚至有人愿意为其单独付费。来源:微信公众号【机器之心

9月14日·进化算法助力大模型内存优化,KV Cache预算降至1.5%

小红书发布FireRedTTS-2,对话生成技术再升级

小红书智创音频技术团队推出了新一代对话合成模型FireRedTTS-2,旨在解决现有对话生成方案的痛点,如发音错误多、说话人切换不稳等问题。FireRedTTS-2通过升级离散语音编码器和文本语音合成模型,实现了更自然、更稳定的对话合成效果。该模型支持多说话人对话,能够模仿不同音色并生成自然流畅的播客音频。在多项测评中,FireRedTTS-2的音色切换稳定性和韵律自然度均达到行业领先水平,为AI播客等应用提供了强大的技术支持。来源:微信公众号【机器之心

9月14日·进化算法助力大模型内存优化,KV Cache预算降至1.5%

LLaSO框架定义LSLM研究新基准,推动语音大模型发展

北京深度逻辑智能科技有限公司推出了LLaSO,这是全球首个完全开源的语音语言模型(LSLM)研究框架。LLaSO通过提供大规模语音-文本对齐数据集(LLaSO-Align)、多任务指令微调数据集(LLaSO-Instruct)和标准化评估基准(LLaSO-Eval),解决了LSLM领域架构分化、数据私有化等问题。基于LLaSO数据训练的LLaSO-Base模型在多项任务中表现优异,证明了该框架的有效性。LLaSO的开源策略不仅降低了研究门槛,还为LSLM领域的系统性进步提供了基础设施,有望成为该领域研究的新基准。来源:微信公众号【机器之心

9月14日·进化算法助力大模型内存优化,KV Cache预算降至1.5%

“AI高斯”三周完成陶哲轩18个月未解的数学挑战

AI公司Math开发的Agent“Gauss”仅用三周时间就完成了陶哲轩和Alex Kontorovich提出的数学挑战——在Lean中形式化强素数定理。这一成就比陶哲轩团队18个月的阶段性进展更为显著。Gauss通过自动形式化技术,将人类数学内容转换为机器可读的形式语言,并利用计算机验证其正确性。Gauss生成了约25000行Lean代码,包含上千个定理和定义,极大地压缩了以往需要顶尖专家多年完成的工作量。Math团队还计划在未来12个月内将形式化代码总量提升100到1000倍,推动“可验证的超级智能”发展。来源:微信公众号【量子位】

9月14日·进化算法助力大模型内存优化,KV Cache预算降至1.5%
© 版权声明

相关文章

暂无评论

暂无评论...