Browser Use

使用场景使用browser-use在hackernews上获取show hn的前10个帖子标题、积分和小时数,并计算每个帖子的积分每小时比率。搜索2024年的前...

  • Browser Use

    类别:开发与工具,自动化工作流,自动化,网页交互,语言模型,Python,开源,普通产品,开源,
    官网:https://github.com/gregpr07/browser-use 更新时间:2025-08-02 09:43:48
  • 使用场景

    使用browser-use在hackernews上获取show hn的前10个帖子标题、积分和小时数,并计算每个帖子的积分每小时比率。

    搜索2024年的前3大AI公司,并在3个新标签页中找出它们各自使用的硬件模型。

    在kayak.com上查找2025年1月12日从苏黎世到旧金山的单程航班。

    产品特色

    通用LLM支持 - 与任何语言模型兼容

    交互元素自动检测 - 自动找到可交互的网页元素

    多标签页管理 - 无缝处理浏览器标签页

    XPath提取 - 无需手动检查DevTools即可进行数据抓取

    视觉模型支持 - 处理视觉页面信息

    可定制动作 - 添加自定义浏览器交互

    处理动态内容 - 自动处理cookies或变化内容

    链式思维提示与记忆 - 解决长期任务

    自我纠正 - 如果LLM出错,代理将自我纠正其动作

    使用教程

    1. 创建虚拟环境并安装依赖:使用pip安装browser-use。

    2. 添加API密钥到.env文件:复制.env.example到.env,并添加你的API密钥。

    3. 使用LangChain支持的任何LLM模型,通过添加适当的环境变量来配置。

    4. 编写代码实现自动化任务:通过编写Python代码,使用browser-use库来实现具体的网页自动化任务。

    5. 运行你的自动化脚本:执行你的Python脚本,browser-use将根据你的指令自动执行网页操作。

    6. 查看结果:browser-use将输出自动化任务的结果,你可以在控制台或指定的输出文件中查看。