可灵2.0:快手推出的新一代AI视频生成模型

AI工具12小时前发布 FuturX-Editor
78 0

AI智库导航-aiguide.cc为您提供最新的AI新闻资讯和最新的AI工具推荐,在这里你可以获得用于营销的AI聊天机器人、AI在商业管理中的应用、用于数据分析的AI工具、机器学习模型、面向企业的AI解决方案、AI在商业客户服务中的应用、AI和自动化工具等。

主要介绍

可灵2.0是快手于2025年4月15日正式发布的新一代AI视频生成模型,标志着AI视频创作领域的一次重大突破。该模型在动态质量、语义响应、画面美学等维度实现全球领先,支持生成长达3分钟、1080P高清、每秒30帧的流畅视频,并兼容16:9、9:16、1:1等多种画幅比例,满足多元化创作需求。

可灵2.0:快手推出的新一代AI视频生成模型

功能特点

  1. 动态质量提升
    • 支持生成长达3分钟、1080P、30fps的高清视频,自由设置宽高比(如16:9、9:16)。
    • 动作幅度更大且更符合物理规律,如滑板动作、人物跳跃等场景的流畅度显著提升。
  2. 语义响应增强
    • 精准理解复杂提示词,支持分镜脚本式输入(如镜头切换、光影变化、运镜参数)。
    • 示例:输入“男子从直升机舱内跃出,急速下坠,降落伞展开”后,生成动态张力强、画面连贯的视频。
  3. 画面美学升级
    • 提升色彩表现力与细节质感,如蜜蜂采蜜时翅膀的透明度、花瓣的细腻纹理。
    • 风格化支持增强,涵盖赛博朋克、迪士尼动画等60余种风格。
  4. 多模态编辑功能
    • 上传1-5秒视频后,可替换、增加或删除元素(如人物、背景),实现高效二次创作。

优缺点

  • 优点
    • 动态合理性:动作幅度大且符合物理规律,如恐龙奔跑的视觉冲击力、滑板动作的腿部细节。
    • 语义理解精准:对复杂提示词的遵循度高,如“男人先笑后怒,手锤桌子起身”的动作与情绪同步。
    • 多模态交互:支持视频片段、图像参考等多模态信息输入,提升创意表达效率。
  • 缺点
    • 物理模拟局限性:部分场景仍存在不合理现象,如“咖啡越倒越多”的悖论。
    • 多主体生成挑战:在生成多个角色时可能出现错误(如“猫狗合体”)。

如何使用

  1. 申请体验
    • 下载快手旗下快影App,点击“AI创作”→“AI生视频”,提交申请后等待审核(通常2小时内通过)。
  2. 文生视频
    • 输入自然语言描述(如“赛博朋克城市夜景”),生成最长3分钟的动态视频。
  3. 图生视频
    • 上传图片后,通过“灵感词库”细化场景描述(如“广角镜头拍摄夕阳下的金色沙滩”),AI自动补全镜头语言。
  4. 视频续写
    • 对已有视频片段进行扩展续写,最长生成3分钟长视频,支持自定义首尾帧画面。

框架技术原理

  1. 3D时空联合注意力机制
    • 建模复杂时空运动,生成大幅度的合理运动(如宇航员月球奔跑时影子与步态同步)。
  2. 类Sora的DiT架构
    • 以Transformer替代传统卷积网络,结合3D时空注意力机制,实现多对象动态关系的精准建模。
  3. 物理规律模拟
    • 集成flow模型作为扩散基座,提升水流、火焰等自然现象的模拟能力,生成内容符合现实物理特性。

创新点

  1. 多模态视觉语言(MVL)
    • 允许用户结合图像参考、视频片段等多模态信息,将复杂创意(如身份、外观、风格、场景、动作等)高效传达给AI。
  2. 大师版模型
    • 在语义响应、动态质量、画面美学等方面显著提升,支持更精准的复杂创意表达。
  3. 轻量化移动端模型
    • 支持实时预览与编辑,如腾讯元宝APP集成,降低创作门槛。

评估标准

  1. 画面质量
    • 细节刻画(如水珠、叶片)、物理世界一致性(光影反射、流体运动)。
  2. 内容可控性
    • 多主体生成、特定内容风格、模型创造力。
  3. 运动生成
    • 动态场景流畅性、时空关系合理性。

应用领域

  1. 影视制作
    • 快速生成分镜脚本对应的动态画面,辅助前期策划。
  2. 广告营销
    • 根据产品特点生成定制化视频,提升创意效率。
  3. 教育科普
    • 将抽象概念转化为可视化视频,如物理实验模拟、历史场景重现。

项目地址

  • 官网kling.kuaishou.com
  • 快影App:iOS/Android应用商店搜索“快影”下载体验。
© 版权声明

相关文章

暂无评论

暂无评论...