Minigemini

使用场景根据给定的图像内容回答相关问题生成图像的文字描述根据指令对图像进行编辑生成新图像产品特色低分辨率/高分辨率双视觉编码器补丁级信息挖掘基于大型语言模型的图...

  • Minigemini

    类别:AI图像生成,AI模型,多模态,视觉语言模型,大型语言模型,图像理解,图像生成,普通产品,开源,
    官网:https://mini-gemini.github.io/ 更新时间:2025-08-01 17:37:12
  • 使用场景

    根据给定的图像内容回答相关问题

    生成图像的文字描述

    根据指令对图像进行编辑生成新图像

    产品特色

    低分辨率/高分辨率双视觉编码器

    补丁级信息挖掘

    基于大型语言模型的图文融合

    支持视觉理解和生成任务