W.A.L.T

使用场景输入文本描述,生成相应的实景视频输入图像,生成含有该图像内容的视频输入视频几帧关键帧,生成完整细致的高清视频产品特色实景视频生成图像生成文本到视频生成