Video MME

使用场景Gemini 1.5 Pro在不同视频长度和子类别中的准确度评分GPT-4o和GPT-4V在视频分析任务中的表现对比LLaVA-NeXT-Video模型...

  • Video MME

    类别:AI视频分析,AI模型评测,多模态,视频分析,性能评估,人工智能,普通产品,开源,
    官网:https://video-mme.github.io/home_page.html 更新时间:2025-08-01 18:15:02
  • 使用场景

    Gemini 1.5 Pro在不同视频长度和子类别中的准确度评分

    GPT-4o和GPT-4V在视频分析任务中的表现对比

    LLaVA-NeXT-Video模型在不同视频任务中的评分结果

    产品特色

    提供短、中、长视频的准确度评分

    包含6个主要领域和30个子类别的视频类型

    全面覆盖视频长度和任务类型

    新收集并由人工标注的数据,非现有视频数据集

    提供视频类别层级和视频时长及任务类型分布的统计信息

    与其他基准测试进行比较,突出Video-MME的独特优势

    使用教程

    访问Video-MME的官方网站

    了解不同视频长度和任务类型的评估标准

    选择感兴趣的MLLMs模型进行性能测试

    提交模型并获取在不同视频子类别中的表现结果

    分析结果,与其他模型或基准进行比较

    利用评估结果优化和改进MLLMs模型