8月25日·GPT-5 视频 Agent 让视频创作进入“一句话”时代

631 0 0

8月25日·周一 AI工具和资源推荐

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

GPT-5 视频 Agent 让视频创作进入“一句话”时代

全球首个接入 GPT-5 的视频智能体 Video Ocean 正在颠覆视频创作领域。创作者只需输入一句话，如“生成一条 2 分钟的橘色皮划艇猫咪冒险短片”，AI Agent 即可自动完成分镜、画面、配音、字幕和剪辑，全流程仅需数分钟。Video Ocean 不仅能快速生成爆款视频，还支持多语言背景音乐与音效，适用于广告、纪录片、社交媒体等多种场景。其创新之处在于将创作任务从繁琐操作中解放出来，让创作者专注于创意表达，真正实现“Filmmaking for Everyone”。来源：微信公众号【新智元】

VLM + 扩散模型为自动驾驶生成真实域极限测试场景

浙江大学与哈工大（深圳）联合推出了 SafeMVDrive，这是一个利用视觉语言模型（VLM）和扩散模型生成真实域自动驾驶极限测试场景的框架。该框架能够批量生成高保真、多视角的安全关键驾驶视频，显著提升自动驾驶系统的碰撞率，用于端到端系统的极限压力测试。SafeMVDrive 通过精准选择安全关键车辆和双阶段轨迹生成，解决了传统方法中车辆选择不准确和生成视频质量低的问题，为自动驾驶的安全性测试提供了更有效的工具。来源：微信公众号【新智元】

南京大学与TeleAI推出MMPL，突破长视频生成瓶颈

南京大学联合TeleAI推出了一种新的AI视频生成范式——Macro-from-Micro Planning（MMPL），旨在解决AI长视频生成中的“高开低走”问题。传统方法在生成长视频时，常常面临色彩漂移、画面模糊、节奏断裂等问题，且生成效率低下。MMPL采用“宏观规划、微观执行”的双层架构，先在宏观层面统一规划视频的叙事脉络和视觉一致性，再将长视频拆解为多个短片段，并通过并行化生成管线高效填充每一帧细节。这一创新方法不仅实现了分钟级高质量长视频的稳定生成，还显著提升了生成效率，预览帧率最高可达约32FPS，接近实时交互体验。MMPL的推出，标志着AI视频生成从“片段级表达”向“统一叙事”迈出了重要一步，为视频创作带来了更稳定、更高效的技术路径。来源：微信公众号【机器之心】

南大、浙大推出跨平台内核生成评测框架 MultiKernelBench

南京大学与浙江大学联合推出了 MultiKernelBench，这是一个用于评估大语言模型（LLM）在不同硬件平台上生成高性能计算内核的评测框架。该框架支持 NVIDIA GPU、华为昇腾 NPU 和 Google TPU 等多种硬件平台，覆盖了 14 类核心深度学习算子。MultiKernelBench 通过模块化设计和统一接口，实现了跨平台的自动化评测，显著提升了 LLM 在多平台上的生成能力。这一框架的推出为高性能计算内核的自动化生成提供了新的标准和工具。来源：微信公众号【机器之心】

腾讯游戏发布 AI 大模型，大幅提高美术生产效率

腾讯游戏在 Devcom 开发者大会上发布了 VISVISE，这是一套基于 AI 的游戏创作全链路解决方案。VISVISE 包含动画制作、模型制作、数字资产管理和智能 NPC 四大管线，覆盖游戏美术开发全流程。其中，MotionBlink 工具通过 AI 自动补全中间帧，将动画制作效率提升了 8 倍。GoSkinning 蒙皮工具则通过两阶段 AI 解决了复杂蒙皮问题，显著降低了美术师的工作量。VISVISE 的推出不仅提高了游戏美术生产的效率，还为小型团队和创业者提供了强大的支持。来源：微信公众号【量子位】