SPRIGHT

AI图像生成 AI图像检测识别文本到图像空间一致性视觉语言模型视觉语言数据集普通产品开源

使用场景一间带有壁炉的客厅,沙发在壁炉的右侧,茶几在沙发前方。一个装满水果的篮子,苹果在左侧,香蕉在右侧,桔子在中间。一座城市的街景,高楼大厦在道路的两侧,路中...

SPRIGHT

类别：AI图像生成,AI图像检测识别,文本到图像,空间一致性,视觉语言模型,视觉语言数据集,普通产品,开源,

官网:https://spright-t2i.github.io/ 更新时间：2025-08-01 17:37:50
使用场景
一间带有壁炉的客厅,沙发在壁炉的右侧,茶几在沙发前方。
一个装满水果的篮子,苹果在左侧,香蕉在右侧,桔子在中间。
一座城市的街景,高楼大厦在道路的两侧,路中间有一个喷泉。
产品特色
大规模空间关系数据集SPRIGHT
在具有大量物体的图像上微调训练以优化空间一致性
在多个基准测试中实现了空间一致性的最新水平
提高了图像质量评分FID和CMMD

点击加载更多