Pyramid Flow

使用场景生成描述为'美丽的、下雪的东京城市熙熙攘攘。摄像机穿过熙熙攘攘的城市街道,跟随几个在附近摊位享受美丽雪景和购物的人'的视频。生成描述为'一艘船在塞纳河上...

  • Pyramid Flow

    类别:AI视频生成,AI模型,视频生成,自回归模型,流匹配,高效训练,开源,普通产品,开源,
    官网:https://pyramid-flow.github.io/ 更新时间:2025-08-02 09:28:39
  • 使用场景

    生成描述为'美丽的、下雪的东京城市熙熙攘攘。摄像机穿过熙熙攘攘的城市街道,跟随几个在附近摊位享受美丽雪景和购物的人'的视频。

    生成描述为'一艘船在塞纳河上悠闲地航行,埃菲尔铁塔在背景中,黑白色调'的视频。

    生成描述为'一个30岁的太空人戴着红色羊毛摩托车头盔的冒险电影预告片,蓝天,盐沙漠,电影风格,35mm胶片拍摄,色彩鲜艳'的视频。

    产品特色

    • 基于自回归视频生成模型的高效训练:Pyramid Flow 能够在开源数据集上以20.7k A100 GPU小时数进行训练。

    • 高质量视频内容生成:支持生成1280x768分辨率、10秒和5秒长度、24fps的视频。

    • 文本到视频的生成能力:用户可以通过输入文本描述来生成相应的视频内容。

    • 文本条件图像到视频的生成:能够根据文本条件对图像进行视频生成。

    • 开源代码和预训练模型:提供了GitHub上的代码和Hugging Face上的预训练模型,方便研究者和开发者使用。

    • 交互式演示:通过Hugging Face的空间提供了交互式的演示,用户可以直观地体验Pyramid Flow的效果。

    使用教程

    1. 访问Pyramid Flow的GitHub页面以获取代码:https://github.com/jy0205/Pyramid-Flow。

    2. 根据README文件中的指南安装必要的依赖和环境。

    3. 下载并加载预训练模型,可以从Hugging Face上获取:https://huggingface.co/rain1011/pyramid-flow-sd3。

    4. 使用提供的脚本和命令行工具来生成视频,可以通过文本描述或图像条件来生成。

    5. 调整生成参数,如分辨率、视频长度和帧率,以满足特定的需求。

    6. 通过Hugging Face的空间进行交互式演示,体验Pyramid Flow的效果:https://huggingface.co/spaces/Pyramid-Flow/pyramid-flow。