-
小扎「梦之队」首批论文上线,LLM自举进化,单步性能狂飙22%
真Meta Superintelligence Labs新作来了!LLM学会「自我改进」:只做单步训练,推理却能多步迭代。在数学、工具调用、多轮任务到MLE-b... -
刚刚,英伟达祭出下一代GPU!狂飙百万token巨兽,投1亿爆赚50亿
刚刚,英伟达祭出下一代GPU!狂飙百万token巨兽,投1亿爆赚50亿......"> 09月11日 0 0 -
=COPILOT()函数横空出世!AI自动写公式效率起飞,网友:让Excel再次伟大
=COPILOT()函数横空出世!AI自动写公式效率起飞,网友:让Excel再次伟大......">阿里云发布通义 Qwen3-Next 基础模型架构并开源 80B-A3B 系列:改进混合注意力机制、高稀疏度 MoE 结构
阿里云通义团队发布Qwen3-Next基础模型架构,开源80B-A3B系列模型,改进混合注意力机制与高稀疏度MoE结构,训练成本仅为Qwen3-32B的十分之一...成立7个月首发声!百亿美金独角兽万字雄文:攻克LLM推理非确定性难题
成立7个月首发声!百亿美金独角兽万字雄文:攻克LLM推理非确定性难题......"> 09月12日 0 0一刀砍掉90%训练成本!Qwen3-Next用1/10算力练成「长文推理利器」
一刀砍掉90%训练成本!Qwen3-Next用1/10算力练成「长文推理利器」......"> 09月13日 0 0