Visionagent

使用场景在图像中统计罐头数量生成代码以统计图像中的人数在视频中检测和跟踪人物产品特色支持生成代码以解决视觉任务支持多种LLM提供商,如Anthropic和Ope...

  • Visionagent

    类别:代码助手,AI设计工具,人工智能,视觉任务,代码生成,LLM,图像处理,视频处理,普通产品,开源,
    官网:https://github.com/landing-ai/vision-agent 更新时间:2025-08-02 10:27:12
  • 使用场景

    在图像中统计罐头数量

    生成代码以统计图像中的人数

    在视频中检测和跟踪人物

    产品特色

    支持生成代码以解决视觉任务

    支持多种LLM提供商,如Anthropic和OpenAI

    提供工具直接使用,如图像检测和视频处理

    可通过Web应用快速测试功能

    支持本地Jupyter Notebook运行

    提供详细的文档和示例代码

    支持视频文件处理和结果可视化

    可自定义LLM提供商配置

    使用教程

    1. 安装VisionAgent库:`pip install vision-agent`

    2. 设置LLM提供商的API密钥:`export ANTHROPIC_API_KEY=your-api-key` 和 `export OPENAI_API_KEY=your-api-key`

    3. 使用VisionAgent生成代码:`agent.generate_code()`

    4. 将生成的代码保存到本地文件并运行

    5. 使用VisionAgent提供的工具直接处理图像或视频

    6. 查看生成的代码和运行结果