MoE架构

  • 月之暗面开源万亿参数“Kimi K2” 全球开源模型迎来新SOTA

    近日,月之暗面公司(Moonshot AI)正式发布并同步开源其首个万亿参数基础大模型Kimi K2。该模型基于MoE架构,总参数量1 T、激活参数32 B,在...
    KimiK2,MoE架构,MuonClip优化器,SOTA,万亿参数,代码生成,开源模型,数学推理,月之暗面,通用Agent 07月29日 0 0
  • 性能与效率的双赢:Qwen3横空出世,MoE架构大幅降低部署成本

    阿里云旗下通义千问(Qwen)团队正式发布Qwen3系列模型,共推出8款不同规格的模型,覆盖从移动设备到大型服务器的全部应用场景。这是国内首个全面超越DeepS...
    性能,Qwen,MoE架构,成本 07月31日 0 0
  • 阿里开源通义万相Wan2.2:全球首个MoE架构视频生成模型震撼发布

    阿里巴巴今晚正式开源视频生成模型"通义万相Wan2.2",此次发布包含三款核心模型:文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-...
    阿里,开源,通义,MoE架构,视频 07月31日 0 0
  • XVERSE MoE A36B

    使用场景用于生成多语言的新闻报道。在教育领域,辅助生成多语言的教学材料。在跨语言的客服系统中,提供多语言的自动回复。产品特色支持多语言文本生成,涵盖中、英、俄、...
    AI模型,AI语言模型,多语言,大型语言模型,MoE架构,文本生成,普通产品,开源, 08月01日 0 0