Showui_开发_未来号

Showui

类别：AI模型,开发与工具,视觉-语言-行动模型,GUI自动化,自然语言处理,人机交互,普通产品,开源,

官网:https://github.com/showlab/ShowUI 更新时间：2025-08-02 09:53:42
使用场景
- 使用ShowUI模型自动化网页操作，如填写表单、点击按钮。
- 利用ShowUI进行图像识别和基于指令的界面导航。
- 将ShowUI集成到自定义的应用中，以提供更自然的用户体验。
产品特色
- 视觉-语言-行动模型：结合视觉输入、语言理解和行动预测。
- GUI自动化：用于图形用户界面的自动化操作。
- 模型训练与部署：支持在huggingface平台进行模型训练和部署。
- 多模态输入：支持图像和文本的多模态输入。
- 行动预测：能够预测用户指令对应的界面操作。
- 界面操作：支持点击、输入、选择等多种界面操作。
- 模型微调：提供微调代码和指令，以适应特定应用场景。
使用教程
1. 安装依赖：通过pip安装requirements.txt中列出的依赖。
2. 克隆仓库：使用git clone命令克隆ShowUI的代码仓库。
3. 启动界面：运行app.py启动ShowUI的图形界面。
4. 加载模型：使用Qwen2VLForConditionalGeneration类加载预训练的ShowUI模型。
5. 界面操作：通过发送包含系统提示、图像和查询的messages列表来执行界面操作。
6. 结果展示：通过draw_point函数在图像上标记操作结果，如点击位置。
7. 微调模型：根据需要对模型进行微调，以适应特定的应用场景。

点击加载更多

Showui

Showui

精彩推荐

马斯克宣布旗下xAI开源Grok 2.5模型 Grok 3半年后跟进

AI医疗与创新药齐热，京东健康在押什么注？

即梦AI智能多帧功能：开启视频创作新时代

这群年轻人用“AI”种菜

马斯克旗下xAI宣布Grok 4 AI模型永久免费开放

猜你喜欢

人形机器人「朋友圈」的明牌和暗战

宇树科技专利侵权案一审判决：未构成侵权，原告败诉

OpenAI要刮油，谁会掉层皮？

用AI改造传统出行，这家公司推出万元级智能三轮车 | 涌现NewThings

刚刚，OpenAI Sora 2重磅登场！首个APP上线，或将成为AI时代新TikTok

字节信徒MiniMax

看360 - 吹响未来的号角！

Showui

Showui

精彩推荐

马斯克宣布旗下xAI开源Grok 2.5模型 Grok 3半年后跟进

AI医疗与创新药齐热，京东健康在押什么注？

即梦AI智能多帧功能：开启视频创作新时代

这群年轻人用“AI”种菜

马斯克​旗下xAI宣布Grok 4 AI模型永久免费开放

猜你喜欢

人形机器人「朋友圈」的明牌和暗战

宇树科技专利侵权案一审判决：未构成侵权，原告败诉

OpenAI要刮油，谁会掉层皮？

用AI改造传统出行，这家公司推出万元级智能三轮车 | 涌现NewThings

刚刚，OpenAI Sora 2重磅登场！首个APP上线，或将成为AI时代新TikTok

字节信徒MiniMax

看360 - 吹响未来的号角！

马斯克旗下xAI宣布Grok 4 AI模型永久免费开放