Wan2.7-Video : 阿里通义推出的 AI 视频创作模型

AI工具3小时前更新 FuturX-Editor

8 0 0

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐，在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

主要介绍

Wan2.7-Video 是阿里通义实验室于2026年4月推出的全模态AI视频创作模型，旨在解决传统视频创作中内容生成不专业、修改困难的问题。该模型支持文本、图像、视频、音频全模态输入，覆盖生成、编辑、复刻、重塑、驱动、续写、参考等全链路创作流程，号称“更可控、更全能、能导擅演”。其核心目标是通过自然语言指令实现视频的精准编辑与生成，降低创作门槛，赋能影视制作、广告创意、内容创作等行业。 Wan2.7-Video : 阿里通义推出的 AI 视频创作模型

功能特点

全模态输入：支持文本、图像、视频、音频输入，用户可通过指令精确控制画面结构、剧情走向、局部细节及时序变化。
超强编辑能力：
- 局部调整：增删元素（如删除路人）、替换物体（如将胶片替换为盘子）、修改物体属性（如建筑颜色）。
- 环境变换：保持人物动作不变，将背景季节从夏季改为深秋，或一键切换画风（如写实转水墨）。
- 质量提升：支持黑白画面上色、主体分割、对焦调整等。
剧情修改：无需重拍，通过指令修改角色台词、动作和镜头角度，实现二次创作。
创意复刻与延续：快速复用已有视频元素，支持多宫格漫画转动画、动作运镜特效复刻。
视频续写与尾帧控制：用户可指定结尾画面，模型自动填充中间内容，兼顾动态延续性与结构可控性。
多模态参考：支持图像、视频、音频多模态输入，最多参考5个视频主体，锁定外观和音色。
风格与声音控制：延展上千种风格组合（如2D卡通、3D动画），提升声音真实感、自然度及音画同步质量。

优缺点

优点：

创作自由度高：支持全模态输入与精细编辑，满足多样化需求。
操作便捷：通过自然语言指令即可完成复杂编辑，无需专业技能。
风格多样：覆盖多种视觉语言，适配不同场景需求。
性能优化：底层架构效率提升，推理速度更快，支持高清输出。

缺点：

时长限制：目前视频时长仅支持2至15秒，难以满足长视频创作需求。
复杂交互不足：在复杂物理交互与伦理过滤方面仍需迭代。

如何使用

用户可通过以下平台体验Wan2.7-Video：

阿里云百炼：访问 https://bailian.console.aliyun.com，选择模型市场中的Wan2.7-Video。
万相官网：登录 https://tongyi.aliyun.com/wan，直接使用在线创作工具。
千问App：未来将接入Wan2.7-Video功能，支持移动端创作。

框架技术原理

Wan2.7-Video基于扩散Transformer（DiT）架构，融合文本、图像、语音等多条件输入，实现端到端生成。其技术亮点包括：

条件扩散过程优化：提升噪声调度与特征融合模块精度，避免风格漂移。
时序注意力机制增强：实现自然运动轨迹与物体互动，减少闪烁与形态突变。
音频联合训练：通过大规模音视频数据集与跨模态对齐算法，提升音画同步质量。
指令驱动编辑：引入边界条件控制与网格化输入，支持从“提示驱动”到“条件编程”的转变。

创新点

首尾帧视频生成：用户上传起始帧与结束帧，模型自动填充中间内容，保持主体身份与物理规律。
9宫格图像转视频：输入3×3网格图像，模型生成连贯视频，支持故事板式创作。
主体+语音参考克隆：同时提供主体图像与语音样本，复制面部、身材、服饰及声线特征。
电影工业流程解构：将戏剧结构编排、镜头语言设计等转化为可编程模块，支持智能剧本创作与分镜调度。

评估标准

视觉质量：细节保真度（如皮肤纹理、光影梯度）、风格适配能力。
运动流畅性：时序一致性、物体互动自然度。
音频同步：人声真实度、音画匹配精度。
编辑灵活性：指令响应准确性、多模态参考支持度。
性能效率：推理速度、分辨率支持（如4K输出）。

应用领域

影视制作：辅助剧本可视化、预览片段生成、特效复刻。
广告创意：快速制作产品演示视频、多场景广告。
内容创作：社交媒体短视频生成、个性化教学视频制作。
科研可视化：分子动态模拟、气候数据动画展示。

项目地址

万相官网：https://tongyi.aliyun.com/wan
阿里云百炼模型市场：https://bailian.console.aliyun.com

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

GLM-4-Air-0414 —— 智谱推出的基座模型

FuturX-Editor

848 0

KoalaQA ：开源AI售后服务社区，能7×24小时服务

FuturX-Editor

601 0

NLWeb ：微软推出支持自然语言与任何网站交互的开源项目

FuturX-Editor

680 0

Nano Bananary : 开源AI图像编辑工具，基于Gemini模型

FuturX-Editor

385 0

Glyph ：智谱联合清华开源的视觉文本压缩框架

FuturX-Editor

233 0

ZeroClaw ：开源的轻量级个人AI Agent运行框架

FuturX-Editor

392 0

暂无评论

暂无评论...

AI全网资源导航每日收集国内外热点AI/人工智能/工具/模型/框架以及最新的AI学习资料/课程等，在这个全新的AI时代，助力每一个人，赋能每一个具体业务场景，与所有人一起努力向前！

友链申请免责声明广告合作关于我们

Copyright © 2026 AI智库导航-aiguide.cc 沪ICP备2022030655号