2月25日·Claude 3.7发布,碾压Grok 3并获35亿美元融资
2月25日·周二 AI工具和资源推荐
AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。
Claude 3.7发布,碾压Grok 3并获35亿美元融资
Anthropic推出了Claude 3.7 Sonnet模型,凭借其强大的混合推理能力在全球开发者中引发关注。作为首个“原生”推理模型,Claude 3.7在物理模拟和编程生成方面表现出色,不仅在Devin编码基准测试中拿下67%的高分,还成功复刻了超级马里奥、宝可梦等经典游戏。此外,它在高考数学题测试中也展现出强大的解题能力。与此同时,Anthropic完成35亿美元融资,估值达615亿美元,Transformer论文唯一女性作者Niki Parmar也加入该公司。Claude 3.7的发布,标志着AI在推理和生成领域的又一次重大突破。来源:微信公众号【新智元】

360联合北大发布Tiny-R1模型,5%参数量逼近DeepSeek-R1性能
360与北京大学联合发布了中等量级推理模型Tiny-R1-32B-Preview。该模型仅用5%的参数量,就实现了逼近DeepSeek-R1-671B的性能表现。在数学领域,Tiny-R1以78.1分(AIME 2024评测)逼近原版R1模型的79.8分,远超DeepSeek-R1-Distill-Llama-70B的70.0分;在编程和科学领域也全面领先最佳开源70B模型。通过“分治-融合”策略,Tiny-R1基于DeepSeek-R1生成海量领域数据,训练数学、编程、科学三大垂直模型,并通过Mergekit工具智能融合,突破性能上限。该模型即将开源,包括技术报告、训练代码及部分数据集,旨在推动AI技术普惠化。Tiny-R1的成功展现了小模型在高效推理领域的巨大潜力,为AI发展提供了新思路。来源:微信公众号【新智元】

DeepSeek开源DeepEP通信库,推动MoE模型高效训练与推理
DeepSeek开源了专为混合专家系统(MoE)和专家并行(EP)设计的通信库DeepEP。该库支持FP8低精度运算,专为Hopper GPU优化,具备高吞吐量和低延迟的特点。DeepEP通过NVLink和RDMA技术实现节点间高效通信,支持计算-通信重叠,显著提升MoE模型的训练和推理效率。开源仅一小时,DeepEP在GitHub上的星标数已突破1500,显示出其在AI领域的巨大潜力。DeepEP还引入了基于回调机制的通信优化方法,适用于大规模分布式训练和实时推理任务。此次开源为AI开发者提供了强大的工具,有望打破大规模模型的性能瓶颈,推动AI技术的普惠化发展。来源:微信公众号【新智元】

上海AI Lab发布HoST算法,助力人形机器人自主站立
上海 AI Lab 具身智能中心发布了一种名为 HoST(Humanoid Standing-up Control)的人形机器人控制算法,实现了机器人从坐姿到站姿的自主转换。该算法通过强化学习框架和多项技术优化,使机器人在仿真和真实环境中均表现出色,具备强大的抗干扰能力。HoST 算法不依赖预定义轨迹,通过多评论家技术、基于课程的辅助力探索策略和运动约束等创新设计,显著提升了学习效率和动作平滑度。在真实环境中,该算法已成功部署于 Unitree G1 机器人,并在多种复杂地形和干扰条件下完成了自主站立任务。这一成果为人形机器人在家庭、医疗、救援等场景中的广泛应用奠定了基础,推动了具身智能技术的实用化进程。来源:微信公众号【机器之心】

豆包语音大模型升级,AI说书效果媲美真人
豆包语音模型团队近日升级了其语音合成技术,基于Seed-TTS框架进一步优化,实现了高表现力、高自然度和高语义理解的小说演播效果。该技术无需额外标签,通过端到端合成,解决了传统TTS在小说演播场景下旁白和角色区分、情感表达等问题。团队对Seed-TTS进行了多项改进,包括章节级数据处理、融合音素和韵律信息、引入上下文感知等,使模型在长文本理解上表现更出色。经过专业评测,优化后的模型在小说演播场景的CMOS评分已达一流主播的90%以上。目前,基于王明军、李满超等大咖声音合成的千部有声书已上线番茄小说,覆盖多种热门题材。来源:微信公众号【量子位】
