Cogvideox1.5 5B SAT

使用场景教育领域:根据教学文本描述生成教学视频,提高教学效果。娱乐产业:根据剧本生成预告片或电影片段,加快内容制作流程。商业领域:根据产品描述生成产品介绍视频,...

  • Cogvideox1.5 5B SAT

    类别:视频生成,模型训练与部署,视频生成,文本到视频,高分辨率,开源模型,清华大学,普通产品,开源,
    官网:https://huggingface.co/THUDM/CogVideoX1.5-5B-SAT 更新时间:2025-08-02 09:44:37
  • 使用场景

    教育领域:根据教学文本描述生成教学视频,提高教学效果。

    娱乐产业:根据剧本生成预告片或电影片段,加快内容制作流程。

    商业领域:根据产品描述生成产品介绍视频,提升产品宣传效果。

    产品特色

    支持10秒视频生成

    支持任意分辨率的视频生成

    包含I2V和T2V模型的权重

    VAE部分与CogVideoX-5B系列一致,无需更新

    Text Encoder与CogVideoX-5B的diffusers版本一致,无需更新

    模型发布在Hugging Face平台上,方便下载和使用

    模型遵循CogVideoX LICENSE授权协议

    使用教程

    1. 访问Hugging Face平台并搜索CogVideoX1.5-5B-SAT模型。

    2. 下载模型文件和相关权重。

    3. 根据模型文档配置环境和依赖。

    4. 使用文本描述作为输入,调用模型生成视频。

    5. 调整模型参数以优化视频生成效果。

    6. 将生成的视频用于教育、娱乐或商业等目的。