字节发布Waver 1.0，一键生成多风格AI视频

AI 2025-08-28 10:52:15

资讯

近日，字节跳动正式推出全新AI视频模型Waver 1.0。该模型支持文本到视频、图像到视频两种主流创作路径，可一次性生成长达10秒、最高1080p分辨率的短片，并提供极致现实、动画、粘土、毛绒等十余种艺术风格选项。经Waver-Bench1.0与Hermes Motion Testset两项基准人工评测，其在运动质量、视觉保真度和提示跟随性上均超越现有开源及闭源竞品。

一、核心能力：一体化生成与多镜头叙事

Waver 1.0采用整流流Transformer架构，在同一套框架内完成T2V、I2V乃至T2I任务，只需调整输入通道即可切换任务类型。其原生多镜头叙事功能可在不同景别与时空转换中保持主体形象、色调及氛围高度一致，为短视频广告、微剧集乃至动画分镜提供“一镜到底”的连贯体验。

二、性能数据：基准测试全面领先

官方公布的对比实验显示：在720p→1080p升格任务中，Waver-Refiner级联精炼器将推理时间压缩40%；在480p→1080p任务中，时间节省高达60%。人工评估环节，Waver 1.0在“动作自然度”“画面清晰度”与“文本一致性”三项指标上均获最高评分，显著优于Runway Gen-3、Pika 1.5等主流模型。