使用场景
用于自动化电商网站商品图片的分类和标注
辅助科研人员在生物医学图像中识别特定细胞或组织
在安全监控领域,用于实时分析视频流中的异常行为
产品特色
支持JPG、JPEG和PNG格式的图片上传
通过Gemini API检测物体并返回边界框坐标
在图片上可视化检测到的边界框,并允许自定义标签
下载带有边界框的图片
需要Python 3.9或更高版本运行环境
需要有效的Gemini API密钥
使用教程
克隆仓库到本地:git clone https://github.com/AlexZhangji/bonding_w_geimini.git
进入项目目录:cd bonding_w_geimini
安装必要的Python包
运行Streamlit应用:streamlit run bbox.py
在侧边栏输入Gemini API密钥
点击“浏览文件”上传本地的JPG、JPEG或PNG图片
输入描述如何检测物体的提示文本
点击“处理”按钮,发送图片和提示到Gemini API
等待结果,处理后的图片将显示检测到的物体边界框
点击“下载带有边界框的图片”按钮,保存处理后的图片