Video Analyzer

使用场景视频内容创作者使用video-analyzer生成视频摘要,提高内容生产的效率。研究人员利用该工具分析视频数据,进行行为模式研究。教育机构使用video...

  • Video Analyzer

    类别:视频编辑,AI信息平台,视频分析,计算机视觉,音频转录,自然语言处理,本地运行,无需API密钥,普通产品,开源,
    官网:https://github.com/byjlw/video-analyzer 更新时间:2025-08-02 10:07:31
  • 使用场景

    视频内容创作者使用video-analyzer生成视频摘要,提高内容生产的效率。

    研究人员利用该工具分析视频数据,进行行为模式研究。

    教育机构使用video-analyzer来创建教学视频的详细描述,辅助视障学生学习。

    产品特色

    完全本地运行,无需云服务或API密钥

    利用openrouter的LLM服务提高速度和规模

    从视频中智能提取关键帧

    使用OpenAI的Whisper进行高质量音频转录

    使用Ollama和Llama3.2 11B视觉模型进行帧分析

    生成自然语言描述的视频内容

    自动处理音质不佳的音频

    详细JSON输出分析结果

    通过命令行参数或配置文件高度可配置

    使用教程

    1. 克隆仓库:git clone https://github.com/byjlw/video-analyzer.git

    2. 进入项目目录:cd video-analyzer

    3. 创建并激活虚拟环境:python3.11 -m venv .venv

    4. 激活虚拟环境:source .venv/bin/activate (Windows用户使用.venv\Scripts\activate)

    5. 安装包:pip install . (常规安装)或 pip install -e . (开发安装)

    6. 安装FFmpeg:根据操作系统使用相应的命令安装FFmpeg

    7. 安装Ollama并拉取默认视觉模型:ollama pull llama3.2-vision

    8. 启动Ollama服务:ollama serve

    9. 使用video-analyzer分析视频:video-analyzer path/to/video.mp4

    10. (可选)如果使用OpenRouter,获取API密钥并配置使用