使用场景
视频内容创作者使用video-analyzer生成视频摘要,提高内容生产的效率。
研究人员利用该工具分析视频数据,进行行为模式研究。
教育机构使用video-analyzer来创建教学视频的详细描述,辅助视障学生学习。
产品特色
完全本地运行,无需云服务或API密钥
利用openrouter的LLM服务提高速度和规模
从视频中智能提取关键帧
使用OpenAI的Whisper进行高质量音频转录
使用Ollama和Llama3.2 11B视觉模型进行帧分析
生成自然语言描述的视频内容
自动处理音质不佳的音频
详细JSON输出分析结果
通过命令行参数或配置文件高度可配置
使用教程
1. 克隆仓库:git clone https://github.com/byjlw/video-analyzer.git
2. 进入项目目录:cd video-analyzer
3. 创建并激活虚拟环境:python3.11 -m venv .venv
4. 激活虚拟环境:source .venv/bin/activate (Windows用户使用.venv\Scripts\activate)
5. 安装包:pip install . (常规安装)或 pip install -e . (开发安装)
6. 安装FFmpeg:根据操作系统使用相应的命令安装FFmpeg
7. 安装Ollama并拉取默认视觉模型:ollama pull llama3.2-vision
8. 启动Ollama服务:ollama serve
9. 使用video-analyzer分析视频:video-analyzer path/to/video.mp4
10. (可选)如果使用OpenRouter,获取API密钥并配置使用