近日,字节跳动正式推出全新AI视频模型Waver 1.0。该模型支持文本到视频、图像到视频两种主流创作路径,可一次性生成长达10秒、最高1080p分辨率的短片,并提供极致现实、动画、粘土、毛绒等十余种艺术风格选项。经Waver-Bench1.0与Hermes Motion Testset两项基准人工评测,其在运动质量、视觉保真度和提示跟随性上均超越现有开源及闭源竞品。
一、核心能力:一体化生成与多镜头叙事
Waver 1.0采用整流流Transformer架构,在同一套框架内完成T2V、I2V乃至T2I任务,只需调整输入通道即可切换任务类型。其原生多镜头叙事功能可在不同景别与时空转换中保持主体形象、色调及氛围高度一致,为短视频广告、微剧集乃至动画分镜提供“一镜到底”的连贯体验。
二、性能数据:基准测试全面领先
官方公布的对比实验显示:在720p→1080p升格任务中,Waver-Refiner级联精炼器将推理时间压缩40%;在480p→1080p任务中,时间节省高达60%。人工评估环节,Waver 1.0在“动作自然度”“画面清晰度”与“文本一致性”三项指标上均获最高评分,显著优于Runway Gen-3、Pika 1.5等主流模型。
三、艺术风格:一键切换十余种视觉语言
用户仅需在提示词中加入“极致现实”“粘土定格”“毛绒玩具风”等标签,即可瞬间转换视觉风格。实测中,“粘土风”可呈现手工雕塑的颗粒感与光影;“毛绒风”则让角色表面呈现柔软纤维质感,配合柔和灯光营造治愈氛围。该多风格能力已被多家MCN机构用于批量制作差异化短视频内容,降低90%以上拍摄与后期成本。
四、运动表现:从体育场景到动物动作
针对人物跑步、踢球、游泳等复杂动作,Waver 1.0通过大规模运动捕捉数据训练,实现关节角度、肌肉拉伸与重心移动的自然过渡;在动物运动方面,可生成小狗奔跑、鸟类展翅等片段,动作流畅度较上一代提升约35%,为自然纪录片与广告创意提供新可能。
AD:精心整理了2000+好用的AI工具!点此获取