使用场景
在图像中统计罐头数量
生成代码以统计图像中的人数
在视频中检测和跟踪人物
产品特色
支持生成代码以解决视觉任务
支持多种LLM提供商,如Anthropic和OpenAI
提供工具直接使用,如图像检测和视频处理
可通过Web应用快速测试功能
支持本地Jupyter Notebook运行
提供详细的文档和示例代码
支持视频文件处理和结果可视化
可自定义LLM提供商配置
使用教程
1. 安装VisionAgent库:`pip install vision-agent`
2. 设置LLM提供商的API密钥:`export ANTHROPIC_API_KEY=your-api-key` 和 `export OPENAI_API_KEY=your-api-key`
3. 使用VisionAgent生成代码:`agent.generate_code()`
4. 将生成的代码保存到本地文件并运行
5. 使用VisionAgent提供的工具直接处理图像或视频
6. 查看生成的代码和运行结果