UNIMO G

使用场景使用UNIMO-G模型生成包含多个图像实体的复杂多模态提示的高保真图像。利用UNIMO-G进行文本到图像的生成。UNIMO-G在零样本主题驱动合成方面表...

  • UNIMO G

    类别:AI图像生成,AI模型,图像生成,多模态,条件扩散,普通产品,开源,
    官网:https://huggingface.co/papers/2401.13388 更新时间:2025-08-01 17:02:00
  • 使用场景

    使用UNIMO-G模型生成包含多个图像实体的复杂多模态提示的高保真图像。

    利用UNIMO-G进行文本到图像的生成。

    UNIMO-G在零样本主题驱动合成方面表现出色。

    产品特色

    处理交错的文本和视觉输入

    生成图像

    预训练和指导调整的两阶段训练策略

    语言接地和图像分割的数据处理流程