Genie

Genie，全称为“Generative Interactive Environments”，即生成式交互环境，是谷歌DeepMind团队开发的一个AI模型。该模型于2024年2月26日正式发布，其基础架构融合了深度学习、自然语言处理、计算机视觉等多个领域的前沿技术，旨在为用户生成可交互的虚拟环境。Genie拥有110亿个参数，通过从互联网视频中学习，能够生成包括室内、室外、自然和人工环境在内的多种环境，并支持用户通过文本、合成图像、照片、草图等多种方式，描述和生成无数个动作“自主可控”的交互式环境。

Genie的功能特点

可交互性：用户可以通过文本提示对所生成虚拟环境中的角色动作进行逐帧操控，实现与虚拟世界的交互。
可推理与预测：基于潜在动作模型、视频分词器、动态模型，Genie能够理解并推理每对帧之间的潜在动作，对视频的下一帧进行预测，并生成符合运动规律的序列帧。
多领域应用：不仅限于游戏开发，Genie还可以应用于虚拟现实、机器人控制、教育和培训等多个领域。
生成式对抗网络（GAN）架构：通过生成器和判别器的协同工作，不断提升生成环境的逼真度和可交互性。