Viewdiff

使用场景生成各种形状和质地的3D物体图像,并将其置于真实世界环境中根据文本描述生成一个3D物体的多角度图像给定单个图像,生成该物体在不同视角下的图像产品特色基于...

  • Viewdiff

    类别:AI图像生成,AI模型,3D重建,图像生成,文本到图像,多视角一致,普通产品,开源,
    官网:https://lukashoel.github.io/ViewDiff/ 更新时间:2025-08-01 17:42:44
  • 使用场景

    生成各种形状和质地的3D物体图像,并将其置于真实世界环境中

    根据文本描述生成一个3D物体的多角度图像

    给定单个图像,生成该物体在不同视角下的图像

    产品特色

    基于预训练的文本到图像模型生成3D一致的图像

    在U-Net网络中加入3D体积渲染和跨帧注意力层

    单个去噪过程中生成多视角一致的图像