Digirl

使用场景在搜索好的意大利餐厅时,DigiRL能够自动完成搜索任务。在新蛋网上搜索Alienware Aurora时,DigiRL能够自动导航至产品页面并执行搜索...

  • Digirl

    类别:AI开发助手,AI强化学习,强化学习,自主学习,设备控制,Android任务,普通产品,开源,
    官网:https://digirl-agent.github.io/ 更新时间:2025-08-01 18:27:12
  • 使用场景

    在搜索好的意大利餐厅时,DigiRL能够自动完成搜索任务。

    在新蛋网上搜索Alienware Aurora时,DigiRL能够自动导航至产品页面并执行搜索。

    在训练过程中,DigiRL能够通过自主数据更新维持稳定的性能,即使在网站变化时也能保持高效。

    产品特色

    使用自主VLM评估器解决开放式Android任务

    通过离线强化学习最大化现有数据集的利用

    采用离线到在线的强化学习鼓励代理自我学习

    使用指令级价值函数构建自动课程

    利用步进级价值函数挑选有利动作

    通过自主收集的rollout训练,减少从错误中恢复的失败

    与现有的行为克隆方法相比,具有更低的样本复杂度和更高的学习效率

    使用教程

    1. 访问DigiRL的官方网站以获取更多信息。

    2. 阅读DigiRL的论文和代码,了解其算法和实现细节。

    3. 下载并安装必要的软件环境,以运行DigiRL模型。

    4. 根据DigiRL的指导文档设置实验环境,包括数据集和参数配置。

    5. 运行DigiRL模型,观察其在不同任务上的表现。

    6. 根据实验结果调整模型参数,优化DigiRL的性能。

    7. 将DigiRL应用于实际的设备控制任务,实现自动化操作。