Visionagent_图像

Visionagent

类别：代码助手,AI设计工具,人工智能,视觉任务,代码生成,LLM,图像处理,视频处理,普通产品,开源,

官网:https://github.com/landing-ai/vision-agent 更新时间：2025-08-02 10:27:12
使用场景
在图像中统计罐头数量
生成代码以统计图像中的人数
在视频中检测和跟踪人物
产品特色
支持生成代码以解决视觉任务
支持多种LLM提供商，如Anthropic和OpenAI
提供工具直接使用，如图像检测和视频处理
可通过Web应用快速测试功能
支持本地Jupyter Notebook运行
提供详细的文档和示例代码
支持视频文件处理和结果可视化
可自定义LLM提供商配置
使用教程
1. 安装VisionAgent库：`pip install vision-agent`
2. 设置LLM提供商的API密钥：`export ANTHROPIC_API_KEY=your-api-key` 和 `export OPENAI_API_KEY=your-api-key`
3. 使用VisionAgent生成代码：`agent.generate_code()`
4. 将生成的代码保存到本地文件并运行
5. 使用VisionAgent提供的工具直接处理图像或视频
6. 查看生成的代码和运行结果

Visionagent