Video Language Planning

使用场景将物体堆叠在桌子中央将水果放入顶层抽屉将积木按颜色分组产品特色训练视觉语言模型和文本到视频模型生成详细的多模态规划合成长期视频规划转化为真实机器人动作

  • Video Language Planning

    类别:AI开发助手,AI模型,视觉规划,多模态,机器人,普通产品,开源,
    官网:https://video-language-planning.github.io/ 更新时间:2025-08-01 15:31:55
  • 使用场景

    将物体堆叠在桌子中央

    将水果放入顶层抽屉

    将积木按颜色分组

    产品特色

    训练视觉语言模型和文本到视频模型

    生成详细的多模态规划

    合成长期视频规划

    转化为真实机器人动作