监督微调-未来号

资讯

ZeroSearch：无需搜索引擎即可提升LLM搜索能力的创新框架

近日，阿里巴巴通义实验室推出了一种名为 ZeroSearch 的强化学习框架，该框架能够在无需与真实搜索引擎交互的情况下，显著提升大型语言模型（LLM）的搜索能...

ZeroSearch,大型语言模型,强化学习,搜索能力,监督微调,课程学习 07月29日 0 0

创作

使用场景医学考试中的问题解答。临床场景下的专业咨询。生物医学研究问题的专业分析。产品特色构建大规模、高质量的生物医学指令数据集UltraMedical。使用合成...

AI医疗健康,AI学术研究,生物医学,专业通用模型,数据集,监督微调,偏好优化,普通产品,开源, 08月01日 0 0

学习

使用场景用于开发多语言聊天机器人，提供24/7的自动客户服务。集成到多语言翻译应用中，提高翻译的准确性和流畅性。作为研究工具，用于分析和比较不同语言间的对话模式...

AI模型,AI语言模型,大型语言模型,对话生成,多语言支持,优化Transformer,监督微调,人类反馈强化学习,优质新品,开源, 08月01日 0 0