Large World Models

使用场景分析超过1小时的YouTube视频内容基于文本提示生成图像和视频回答关于复杂多模态世界的问题产品特色长视频理解长文本处理多模态学习视觉-语言交互

  • Large World Models

    类别:AI模型,AI模型推理训练,人工智能,机器学习,Transformer模型,多模态理解,普通产品,开源,
    官网:https://largeworldmodel.github.io 更新时间:2025-08-01 17:14:09
  • 使用场景

    分析超过1小时的YouTube视频内容

    基于文本提示生成图像和视频

    回答关于复杂多模态世界的问题

    产品特色

    长视频理解

    长文本处理

    多模态学习

    视觉-语言交互