AI图像生成 AI图像检测识别 文本到图像 空间一致性 视觉语言模型 视觉语言数据集 普通产品 开源
使用场景一间带有壁炉的客厅,沙发在壁炉的右侧,茶几在沙发前方。一个装满水果的篮子,苹果在左侧,香蕉在右侧,桔子在中间。一座城市的街景,高楼大厦在道路的两侧,路中...
使用场景
一间带有壁炉的客厅,沙发在壁炉的右侧,茶几在沙发前方。
一个装满水果的篮子,苹果在左侧,香蕉在右侧,桔子在中间。
一座城市的街景,高楼大厦在道路的两侧,路中间有一个喷泉。
产品特色
大规模空间关系数据集SPRIGHT
在具有大量物体的图像上微调训练以优化空间一致性
在多个基准测试中实现了空间一致性的最新水平
提高了图像质量评分FID和CMMD