监督微调

  • ZeroSearch:无需搜索引擎即可提升LLM搜索能力的创新框架

    近日,阿里巴巴通义实验室推出了一种名为 ZeroSearch 的强化学习框架,该框架能够在无需与真实搜索引擎交互的情况下,显著提升大型语言模型(LLM)的搜索能...
    ZeroSearch,大型语言模型,强化学习,搜索能力,监督微调,课程学习 07月29日 0 0
  • Ultramedical

    使用场景医学考试中的问题解答。临床场景下的专业咨询。生物医学研究问题的专业分析。产品特色构建大规模、高质量的生物医学指令数据集UltraMedical。使用合成...
    AI医疗健康,AI学术研究,生物医学,专业通用模型,数据集,监督微调,偏好优化,普通产品,开源, 08月01日 0 0
  • Meta Llama 3.1 70B Instruct

    使用场景用于开发多语言聊天机器人,提供24/7的自动客户服务。集成到多语言翻译应用中,提高翻译的准确性和流畅性。作为研究工具,用于分析和比较不同语言间的对话模式...
    AI模型,AI语言模型,大型语言模型,对话生成,多语言支持,优化Transformer,监督微调,人类反馈强化学习,优质新品,开源, 08月01日 0 0