RPG DiffusionMaster

使用场景使用RPG-DiffusionMaster生成包含多个对象的图像利用RPG-DiffusionMaster编辑图像以实现文本语义对齐采用RPG-Diff...

  • RPG DiffusionMaster

    类别:AI图像生成,AI图像编辑,文本到图像,生成编辑框架,多模态LLM,普通产品,开源,
    官网:https://huggingface.co/papers/2401.11708 更新时间:2025-08-01 17:00:15
  • 使用场景

    使用RPG-DiffusionMaster生成包含多个对象的图像

    利用RPG-DiffusionMaster编辑图像以实现文本语义对齐

    采用RPG-DiffusionMaster进行文本到图像生成的实验

    产品特色

    利用多模态LLM进行全局规划

    将复杂图像生成过程分解为简单生成任务

    实现区域化的组合生成

    闭环集成文本引导的图像生成和编辑

    提高泛化能力

    优于其他文本到图像扩散模型