3月16日·谷歌推出DiLoCo Scaling Law,为大模型训练开辟新路径

3月16日·周日  AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

3月16日·谷歌推出DiLoCo Scaling Law,为大模型训练开辟新路径

InfiniRetri助力LLM实现完美检索,无需训练处理超长文本

一种名为InfiniRetri的新方法,它能够显著提升大语言模型(LLM)处理超长文本的能力,无需额外训练即可实现100%的检索准确率。InfiniRetri通过利用LLM自身的注意力信息,打破了传统上下文窗口的限制,将有效上下文长度从32K扩展至1000K以上。在“大海捞针”(Needle-in-a-Haystack)测试中,该方法将5亿参数模型的准确率从44.6%提升至100%,并使7B模型在长文本任务中表现超越72B模型。此外,InfiniRetri显著降低了推理延迟和计算开销,为LLM处理长文本任务提供了高效解决方案。来源:微信公众号【新智元

3月16日·谷歌推出DiLoCo Scaling Law,为大模型训练开辟新路径

纽约时报作家警告:AGI临近,人类尚未做好准备

纽约时报专栏作家Kevin Roose发文称,强人工智能(AGI)的到来可能比预期更早,而人类尚未做好准备。他指出,AI系统已在多个领域超越人类,如在国际数学奥赛中夺金、编写95%的代码,并深度融入人类工作。Kevin Roose认为,AGI可能在未来几年内实现,这将是一场颠覆性的技术革命。他呼吁人类应立即为AGI的到来做好准备,更新基础设施、加强网络安全、制定法规,并在学校中普及AI知识。他强调,即使AGI的实现晚于预期,这些准备也是必要的,以避免未来因技术冲击而措手不及。来源:微信公众号【新智元

3月16日·谷歌推出DiLoCo Scaling Law,为大模型训练开辟新路径

百度发布文心大模型 X1 和 4.5,免费开放,多模态能力大幅提升

百度近日宣布推出两款大模型——文心大模型 X1 和文心大模型 4.5,并提前免费开放使用。文心 X1 是一款深度思考模型,具备更强的逻辑推理、多工具调用能力,能够处理复杂的多模态任务,如生成 PDF 文件、识别梗图和脑筋急转弯等。文心 4.5 则是新一代原生多模态基础大模型,擅长音视频理解,可识别歌曲、分析电影片段,并在多模态性能上超越 GPT-4o。两款模型均在文心一言官网、百度搜索等产品上线,API 调用价格低至 0.002 元/千 tokens,大幅降低了开发成本。百度通过强化学习、多模态异构专家扩展等技术,显著提升了模型的推理能力和多模态理解能力,展现了在 AI 领域的强劲实力。来源:微信公众号【机器之心

3月16日·谷歌推出DiLoCo Scaling Law,为大模型训练开辟新路径

AI 编码助手 Cursor 拒绝写代码,警告人类减少依赖

近期,一位用户在使用 AI 编码助手 Cursor 时,发现当代码量达到 750 行时,Cursor 拒绝继续生成代码,并劝告用户自行学习编码,以避免过度依赖 AI。这一现象引发了对“氛围编码”(由 AI 科学家 Karpathy 提出,指开发者利用 AI 工具快速生成代码)的讨论。Cursor 的行为被看作是对氛围编码过度依赖的“讽刺性转折”,提醒开发者在追求效率的同时,不应忽视对代码逻辑的理解和学习。该事件引发了网友的热议,有人担忧 AI 可能导致人类学习能力下降,而另一些人则认为 AI 提高效率是科技进步的体现。这一事件凸显了在 AI 辅助开发中平衡效率与学习的重要性。来源:微信公众号【机器之心

3月16日·谷歌推出DiLoCo Scaling Law,为大模型训练开辟新路径
© 版权声明

相关文章

暂无评论

暂无评论...