强化学习

开发

Lerobot

使用场景在ALOHA环境中使用ACT策略进行机器人操作任务的研究。使用SimXArm环境和TDMPC策略进行机器人臂操作的模拟。利用PushT环境和Diffus...

AI开发助手,AI模型,机器学习,强化学习,模仿学习,PyTorch,机器人技术,普通产品,开源, 08月01日 0 0
创作

DIAMOND

使用场景研究人员使用DIAMOND模型在雅达利游戏中进行策略训练和评估。开发者利用DIAMOND进行游戏环境的自回归想象，以改进游戏AI。教育工作者将DIAMO...

AI模型,AI游戏创作,机器学习,强化学习,扩散模型,雅达利,人工智能,普通产品,开源, 08月01日 0 0
开发

RL4VLM

使用场景研究人员使用RL4VLM微调模型以改进自然语言处理任务中的决策制定能力。开发者利用该项目提供的代码库和环境来训练自定义的视觉-语言模型。教育机构将RL4...

AI模型,AI开发助手,强化学习,视觉-语言模型,决策制定,开源项目,普通产品,开源, 08月01日 0 0
学习

Nemotron 4 340B Reward

使用场景研究人员使用Nemotron-4-340B-Reward模型来评估和改进他们自己构建的语言模型。开发者利用该模型在对话系统开发中生成训练数据，以提高系统...

AI模型,AI 模型推理训练,AI,大型语言模型,合成数据生成,强化学习,普通产品,开源, 08月01日 0 0
开发

Digirl

使用场景在搜索好的意大利餐厅时，DigiRL能够自动完成搜索任务。在新蛋网上搜索Alienware Aurora时，DigiRL能够自动导航至产品页面并执行搜索...

AI开发助手,AI强化学习,强化学习,自主学习,设备控制,Android任务,普通产品,开源, 08月01日 0 0
学习

Meta Llama 3.1 8B Instruct

使用场景构建一个能够以多种语言进行交流的客服聊天机器人。开发一个多语言虚拟助手，用于提供信息查询和日常任务管理。实现一个教育应用，使用该模型进行语言学习辅导和对...

AI模型,AI聊天机器人,语言模型,对话生成,多语言支持,强化学习,微调,优质新品,开源, 08月01日 0 0
学习

Agent Q

使用场景在Open Table上进行的预订实验，成功率高达95.4%。开发者可以利用Agent Q进行复杂的网络数据收集和分析任务。消费者可以使用Agent Q...

AI Agents,AI模型,AI代理,自主导航,多步推理,强化学习,国外精选 08月01日 0 0
图像

Deepmind

使用场景AlphaFold 帮助科学家在药物设计中识别和设计新的蛋白质结构。Veo 被用于生成高质量的视频内容，用于教育和娱乐。Project Astra 被集...

研究工具,AI模型,人工智能,机器学习,深度学习,强化学习,图像生成,视频生成,蛋白质结构,全球热门 08月01日 0 0
开发

Agibot X1 Train

使用场景研究人员使用Agibot X1进行机器人行走稳定性的研究开发者利用Agibot X1的代码库为其他类型的机器人创建训练环境教育工作者将Agibot X1...

开发与工具,模型训练与部署,开源,强化学习,机器人,模块化,AimRT,普通产品,开源, 08月02日 0 0
学习

Tülu 3

使用场景研究人员可以使用Tülu 3来训练一个能够理解和生成代码的模型。开发者可以利用Tülu 3的数据集和配方来创建一个多语言交互的聊天机器人。企业家可以根据...

AI,语言模型,后训练,开源,强化学习,数据集,国外精选 08月02日 0 0

点击加载更多