在人工智能领域,大语言模型(LLM)正在不断进化,最近,卡内基梅隆大学(CMU)与 HuggingFace 的研究者们共同提出了一种名为 “元强化微调”(Met...
推理能力,大语言模型,语言模型
07月30日
0
近日,腾讯发布了混元大模型系列的正式版 —— 混元 - T1。这款新模型基于混元中等规模底座,经过大规模后训练,显著增强了推理能力,特别是在深度思考和复杂问题解...
腾讯,混元,推理能力
07月30日
0
近期,谷歌、卡内基梅隆大学与 MultiOn 的研究团队联合发布了一项关于合成数据在大模型训练中应用的新研究。根据 AI 发展科研机构 Epoch AI 的报告...
谷歌,合成数据,数据,数学推理,大模型,推理能力
07月30日
0
在最新的研究中,谷歌与卡内基梅隆大学及 MultiOn 团队联手,探讨了合成数据对大型模型的训练效果。他们发现,合成数据能够显著提升大模型在逻辑推理方面的表现,...
谷歌,合成数据,数据,大模型,推理能力
07月30日
0
火山引擎今日发布活动预热,正式宣布其新款豆包大模型将于明日(4月17日)在FORCE LINK AI创新巡展杭州站上隆重发布。官方信息显示,此次发布会将带来豆包...
推理能力,豆包,深度思考
07月30日
0
4月24日,昆仑万维宣布正式开源其多模态推理模型Skywork-R1V2.0(以下简称R1V2.0)。这一升级版本在视觉与文本推理能力上均实现了显著提升,特别是...
昆仑万维,开源,视觉,文本,推理能力
07月30日
0
最近,人工智能界传来重大消息,Anthropic 正式推出了其 Claude4系列模型,包括 Claude Opus4和 Claude Sonnet4。这次发布...
Anthropic,Claude,推理能力
07月30日
0
近日,由清华大学、腾讯混元、斯坦福大学及卡耐基梅隆大学的研究团队联合发布了一项新评估基准 ——RBench-V,专门针对多模态大模型的视觉推理能力进行测试。该基...
多模态,大模型,视觉,推理能力
07月30日
0
DeepSeek 公司近日对其高性能推理 AI 模型 DeepSeek-R1进行了重大更新,显著提升了模型在代码生成和复杂推理任务中的表现,引发人工智能领域的广...
DeepSeek,推理能力,AI,代码,性能
07月30日
0
通义千问团队宣布推出Qwen3,这是Qwen系列大型语言模型的最新成员。Qwen3系列模型在代码、数学和通用能力等基准测试中表现出色,与DeepSeek-R1、...
通义,Qwen,推理能力,思考模式
07月31日
0