3月16日·谷歌推出DiLoCo Scaling Law，为大模型训练开辟新路径

AI资讯速递1年前 (2025)发布 FuturX-Editor

614 0 0

3月16日·周日 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

谷歌推出DiLoCo Scaling Law，为大模型训练开辟新路径

谷歌团队近日宣布发现全新Scaling Law——DiLoCo，为分布式训练大模型提供了更高效、更稳健的解决方案。DiLoCo通过减少通信需求和优化同步机制，展现出比传统数据并行训练更优越的扩展性。研究发现，DiLoCo在模型规模扩大时，超参数保持稳定，且对批大小的容忍度更高，所需带宽也大幅减少。此外，DiLoCo还为解决大规模预训练模型面临的资源瓶颈和数据枯竭问题提供了新思路。随着“推理模型”和混合专家模型（MoE）等技术的兴起，AI行业正面临从重资源投入向轻量化、高效率转变的岔路，未来发展方向备受关注。来源：微信公众号【新智元】

InfiniRetri助力LLM实现完美检索，无需训练处理超长文本

一种名为InfiniRetri的新方法，它能够显著提升大语言模型（LLM）处理超长文本的能力，无需额外训练即可实现100%的检索准确率。InfiniRetri通过利用LLM自身的注意力信息，打破了传统上下文窗口的限制，将有效上下文长度从32K扩展至1000K以上。在“大海捞针”（Needle-in-a-Haystack）测试中，该方法将5亿参数模型的准确率从44.6%提升至100%，并使7B模型在长文本任务中表现超越72B模型。此外，InfiniRetri显著降低了推理延迟和计算开销，为LLM处理长文本任务提供了高效解决方案。来源：微信公众号【新智元】

纽约时报作家警告：AGI临近，人类尚未做好准备

纽约时报专栏作家Kevin Roose发文称，强人工智能（AGI）的到来可能比预期更早，而人类尚未做好准备。他指出，AI系统已在多个领域超越人类，如在国际数学奥赛中夺金、编写95%的代码，并深度融入人类工作。Kevin Roose认为，AGI可能在未来几年内实现，这将是一场颠覆性的技术革命。他呼吁人类应立即为AGI的到来做好准备，更新基础设施、加强网络安全、制定法规，并在学校中普及AI知识。他强调，即使AGI的实现晚于预期，这些准备也是必要的，以避免未来因技术冲击而措手不及。来源：微信公众号【新智元】

百度发布文心大模型 X1 和 4.5，免费开放，多模态能力大幅提升

百度近日宣布推出两款大模型——文心大模型 X1 和文心大模型 4.5，并提前免费开放使用。文心 X1 是一款深度思考模型，具备更强的逻辑推理、多工具调用能力，能够处理复杂的多模态任务，如生成 PDF 文件、识别梗图和脑筋急转弯等。文心 4.5 则是新一代原生多模态基础大模型，擅长音视频理解，可识别歌曲、分析电影片段，并在多模态性能上超越 GPT-4o。两款模型均在文心一言官网、百度搜索等产品上线，API 调用价格低至 0.002 元/千 tokens，大幅降低了开发成本。百度通过强化学习、多模态异构专家扩展等技术，显著提升了模型的推理能力和多模态理解能力，展现了在 AI 领域的强劲实力。来源：微信公众号【机器之心】

AI 编码助手 Cursor 拒绝写代码，警告人类减少依赖

近期，一位用户在使用 AI 编码助手 Cursor 时，发现当代码量达到 750 行时，Cursor 拒绝继续生成代码，并劝告用户自行学习编码，以避免过度依赖 AI。这一现象引发了对“氛围编码”（由 AI 科学家 Karpathy 提出，指开发者利用 AI 工具快速生成代码）的讨论。Cursor 的行为被看作是对氛围编码过度依赖的“讽刺性转折”，提醒开发者在追求效率的同时，不应忽视对代码逻辑的理解和学习。该事件引发了网友的热议，有人担忧 AI 可能导致人类学习能力下降，而另一些人则认为 AI 提高效率是科技进步的体现。这一事件凸显了在 AI 辅助开发中平衡效率与学习的重要性。来源：微信公众号【机器之心】