AI模型 图片生成 多模态 图像定位 自然语言处理 人工智能 开源 普通产品
使用场景在多图像场景中,用户可以通过自然语言指令让模型定位特定物体或区域,例如在一组图片中找到共同出现的人物。研究人员可以使用 Migician 的模型和数据集...