8月6日·谷歌 DeepMind 发布 Genie 3，开启实时交互模拟新纪元

652 0 0

8月6日·周三 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

谷歌 DeepMind 发布 Genie 3，开启实时交互模拟新纪元

谷歌 DeepMind 近日发布了新一代通用世界模型 Genie 3，这是一款能够实时生成动态世界的强大工具。Genie 3 能以每秒 20 – 24 帧的速度生成 720p 画面，且可维持数分钟的视觉记忆一致性，相比前代产品在生成时长和交互能力上都有显著提升。它不仅能模拟物理世界中的水流、光照等自然现象，还能生成自然系统、奇幻场景以及动画角色等，甚至可以重现古代文明或探索不同地方的历史场景。Genie 3 的实时交互能力依赖于其强大的技术架构，能够在用户输入后迅速做出响应，并保持物理上的一致性。此外，它还支持通过文本提示词驱动世界事件，实现更丰富的交互体验。这一模型的出现为 AI 智能体的训练提供了更广阔的空间，也为教育、培训等领域带来了新的机遇，标志着世界模拟 AI 迈向了全新高度，向着 AGI / ASI 的目标又迈进了一步。来源：微信公众号【新智元】

Meta 推出非侵入性神经肌肉交互系统，人机交互迎来新变革

Meta 研发的非侵入性神经肌肉交互系统登上 Nature，这项基于手腕表面肌电图（sEMG）的技术为人机交互带来了新的可能性。受试者只需佩戴类似智能手环的设备，系统就能感知和解释肌肉激活信号，从而实现手势控制与机器互动，甚至可以用于打字、玩游戏等操作。在实验中，该系统在连续手势控制、离散手势控制和打字任务中都展现出了较好的性能，例如在打字任务中，参与者平均每分钟能输入 20.9 个单词，且通过个性化数据微调模型还能进一步提升识别性能。不过，sEMG 设备目前还存在体积较大、交互流畅性有待提升等问题，未来需要在设备小型化和性能优化方面继续努力。但这项技术为行动能力受限人群提供了可行的交互方案，也为脑机接口等领域的研究提供了数据支持，有望成为下一代人机交互的重要技术之一。来源：微信公众号【新智元】

首届大模型国际象棋对抗赛开赛，DeepSeek 和 Kimi 首轮出局

谷歌发起的首届大模型国际象棋对抗赛已经进行了第一轮比赛，参赛的多个大语言模型展开了激烈角逐。在这轮比赛中，DeepSeek – R1 和 Kimi K2 Instruct 均被对手以 4 – 0 的比分淘汰出局。Kimi K2 与 o3 的对局中，由于 Kimi K2 是非推理模型，在脱离开局理论后出现了技术问题，如忘记棋子走法等，导致连续四次未能找到合法着法而被判负。而 DeepSeek – R1 与 o4 – mini 的对局则呈现出开局表现不错但后续失误较多的特点。其他比赛中，Gemini 2.5 Pro 和 Grok 4 等模型也展现了各自的实力，其中 Grok 4 的表现尤为亮眼，精准捕捉无保护棋子并果断实施打击，其创始人埃隆・马斯克还提及了国际象棋简单的观点。这场比赛在 Kaggle Game Arena 平台上进行，旨在探索大语言模型在动态竞争环境中的表现，后续的半决赛也备受关注。来源：微信公众号【机器之心】

OpenAI 开源新推理模型，性能与 o4 – mini 比肩

OpenAI 近年来首次开源了两个推理模型，分别是 gpt – oss – 20b 和 gpt – oss – 120b。这两个模型的性能与 o4 – mini 水平相当，且具有诸多亮点。它们采用宽松的 Apache 2.0 许可证，可自由构建并适合实验、定制和商业部署。模型具备可调整的推理力度，能根据具体用例和延迟需求进行调节，还提供完整的思维链，便于调试和增强对输出的信任。此外，模型可微调，支持 agentic 功能，如函数调用、网页浏览等，并且采用了原生 MXFP4 量化，使得 gpt – oss – 120b 可在单个 H100 GPU 上运行，gpt – oss – 20b 能在 16GB 内存内运行，大大降低了部署成本。在性能评估中，这两个开源模型在编程、竞赛数学、医疗查询等多个基准测试中表现出色，甚至超越了部分专有模型。OpenAI 还为开发者提供了 playground 试用地址，方便大家体验。这一开源举措为开发者带来了更多选择和便利，也为 AI 模型的进一步发展和应用提供了新的动力。来源：微信公众号【机器之心】

华为版 CUDA 全面开源，昇腾生态加速发展

华为宣布为其昇腾 AI GPU 开源 CANN 软件工具包，这一举措标志着华为版 CUDA 的全面开源开放。过去，CUDA 的封闭生态系统给开发者带来了诸多不便，而华为的这一开源行动打破了这种局限。CANN 作为神经网络计算架构，提供多层编程接口，类似于英伟达的 CUDA，为 GPU 提供相同的接口，帮助用户构建针对华为昇腾的 AI 应用程序。目前，CANN 已升级到 8.0 版本，提供社区版和商业版两个版本，并新增适配 12 款操作系统。它还支持包括 PyTorch、MindSpore、TensorFlow 等在内的多种深度学习框架与第三方库。此外，与 CANN 配套的华为自研深度学习框架 MindSpore 也构成了华为原生的 AI 软硬件方案。华为的这一开源行动旨在支持用户自主深度挖潜昇腾 GPU 的潜力，加速开发者的创新步伐，让昇腾更好用、更易用，同时也为构建开源开放的昇腾生态奠定了坚实基础。来源：微信公众号【量子位】