8月17日·谷歌Genie 3：开启世界模型新时代

339 0 0

8月17日·周日 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

谷歌Genie 3：开启世界模型新时代

谷歌DeepMind最新发布的世界模型 Genie 3，被认为是迈向通用人工智能（AGI）的关键一步。Genie 3能够通过文本提示实时生成高度一致、动态互动的世界，支持长达一分钟的空间记忆，并且物理规律的模拟更加逼真。其核心特性包括“特殊记忆”，能够记住之前发生的事情，如角色在墙上刷漆后痕迹依然存在。此外，Genie 3在地形多样性、物理效果和指令跟随方面表现出色，为未来的游戏开发、机器人训练和虚拟现实应用提供了强大的技术支持。来源：微信公众号【新智元】

谷歌Gemini Pro：学生党的终极学习外挂

谷歌宣布为全美大学生提供一年免费的Gemini Pro计划，旨在将AI技术深度融入学生的学习场景。Gemini Pro具备多项功能，包括一键生成小测验和记忆卡片、引导式学习以及全能工具包，帮助学生整理笔记、润色论文等。此外，该计划还提供2TB的存储空间，将学生的学习资料绑定在谷歌生态系统中。谷歌希望通过这一举措，从学生时代开始培养用户对AI工具的使用习惯，进而锁定未来的用户群体。来源：微信公众号【新智元】

分层推理模型HRM：性能提升背后的真相

分层推理模型（HRM）曾因在ARC-AGI基准测试中的出色表现引发关注，但最新的分析显示，其“分层架构”对性能提升的贡献微乎其微。相反，HRM的“外循环”优化过程和预训练的任务增强才是性能提升的关键。研究发现，仅使用300次增强就能达到接近最大性能的效果，而跨任务迁移学习的益处有限。尽管如此，HRM在小模型上的表现仍然值得关注，其创新之处在于将模型用作程序合成基底，通过梯度下降将任务编码到模型权重中。来源：微信公众号【机器之心】

隐空间扩散世界模型LaDi-WM：提升机器人操作能力

国防科大、北京大学和深圳大学的研究团队提出了一种基于隐空间扩散的世界模型LaDi-WM，用于提升机器人的操作策略成功率和跨场景泛化能力。LaDi-WM通过预训练的视觉基础模型构建隐空间表示，并利用扩散过程学习动态建模。实验表明，LaDi-WM在虚拟和真实场景中均表现出色，显著提高了机器人操作任务的成功率，尤其是在LIBERO-LONG数据集上，成功率提升了27.9%。该模型还展示了强大的跨场景泛化能力，为机器人在复杂环境中的操作提供了新的解决方案。来源：微信公众号【机器之心】

昆仑万维一周六连发：多模态AI的新高度

昆仑万维在一周内连续发布了六款多模态AI模型，涵盖视频生成、世界模型、统一多模态、智能体和音乐创作等多个热门领域。其中包括SkyReels-A3（数字人直播带货模型）、Matrix-Game 2.0（开源世界模型）、Skywork UniPic 2.0（统一多模态模型）和Mureka V7.5（音乐模型）。这些模型不仅在技术上取得了突破，还通过开源策略推动了行业的发展。昆仑万维的这一系列动作展示了其在AI领域的强大实力和战略布局，旨在通过垂直领域的深度优化和开源生态建设，推动多模态AI技术的广泛应用。来源：微信公众号【量子位】