推理能力

资讯

CMU 团队推出元强化微调：提升大语言模型推理能力的新范式

在人工智能领域，大语言模型（LLM）正在不断进化，最近，卡内基梅隆大学(CMU)与 HuggingFace 的研究者们共同提出了一种名为 “元强化微调”(Met...

推理能力,大语言模型,语言模型 07月30日 0 0
资讯

腾讯发布混元 - T1 正式版，推理能力大幅提升

近日，腾讯发布了混元大模型系列的正式版 —— 混元 - T1。这款新模型基于混元中等规模底座，经过大规模后训练，显著增强了推理能力，特别是在深度思考和复杂问题解...

腾讯,混元,推理能力 07月30日 0 0
资讯

谷歌新研究：合成数据助力大模型，数学推理能力提升八倍

近期，谷歌、卡内基梅隆大学与 MultiOn 的研究团队联合发布了一项关于合成数据在大模型训练中应用的新研究。根据 AI 发展科研机构 Epoch AI 的报告...

谷歌,合成数据,数据,数学推理,大模型,推理能力 07月30日 0 0
资讯

谷歌研究揭示：合成数据提升大模型逻辑推理能力八倍

在最新的研究中，谷歌与卡内基梅隆大学及 MultiOn 团队联手，探讨了合成数据对大型模型的训练效果。他们发现，合成数据能够显著提升大模型在逻辑推理方面的表现，...

谷歌,合成数据,数据,大模型,推理能力 07月30日 0 0
资讯

推理能力飞跃?豆包1.5深度思考模型即将正式服务企业

火山引擎今日发布活动预热，正式宣布其新款豆包大模型将于明日（4月17日）在FORCE LINK AI创新巡展杭州站上隆重发布。官方信息显示，此次发布会将带来豆包...

推理能力,豆包,深度思考 07月30日 0 0
资讯

昆仑万维开源Skywork-R1V 2.0版本视觉与文本推理能力提升

4月24日，昆仑万维宣布正式开源其多模态推理模型Skywork-R1V2.0（以下简称R1V2.0）。这一升级版本在视觉与文本推理能力上均实现了显著提升，特别是...

昆仑万维,开源,视觉,文本,推理能力 07月30日 0 0
资讯

太卷了！Anthropic发布Claude 4 编程和推理能力秒杀Gemini2.5pro

最近，人工智能界传来重大消息，Anthropic 正式推出了其 Claude4系列模型，包括 Claude Opus4和 Claude Sonnet4。这次发布...

Anthropic,Claude,推理能力 07月30日 0 0
资讯

多模态大模型视觉推理能力评估:o3 仅得 25.8% 分数

近日，由清华大学、腾讯混元、斯坦福大学及卡耐基梅隆大学的研究团队联合发布了一项新评估基准 ——RBench-V，专门针对多模态大模型的视觉推理能力进行测试。该基...

多模态,大模型,视觉,推理能力 07月30日 0 0
资讯

DeepSeek 更新 R1 推理 AI 模型：代码生成与复杂推理性能大幅提升推理能力比肩 o1

DeepSeek 公司近日对其高性能推理 AI 模型 DeepSeek-R1进行了重大更新，显著提升了模型在代码生成和复杂推理任务中的表现，引发人工智能领域的广...

DeepSeek,推理能力,AI,代码,性能 07月30日 0 0
资讯

通义千问Qwen3发布：推理能力显著增强支持两种思考模式

通义千问团队宣布推出Qwen3，这是Qwen系列大型语言模型的最新成员。Qwen3系列模型在代码、数学和通用能力等基准测试中表现出色，与DeepSeek-R1、...

通义,Qwen,推理能力,思考模式 07月31日 0 0

点击加载更多