大规模模型

  • 《Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Experts Layer》论文解读与行业影响

    一、论文主要内容《Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Exper...
    人工智能研究,大规模模型,机器翻译,条件计算,架构创新,模型扩展,深度学习,混合专家模型,神经网络架构,稀疏激活,自然语言处理,计算效率,语言建模 07月29日 0 0
  • Vary

    产品特色扩展视觉词汇提高模型性能图像理解和语言生成能力
    AI图像生成,AI模型,视觉语言模型,图像理解,大规模模型,语言生成,普通产品,开源, 08月01日 0 0
  • Moe LLaVA

    使用场景网站:使用MoE-LLaVA进行多模态学习小程序:使用MoE-LLaVA进行图像推理桌面客户端:使用MoE-LLaVA进行自定义模型训练产品特色多模态学...
    AI模型,AI图像生成,大规模模型,多模态学习,图像处理,深度学习,普通产品,开源, 08月01日 0 0
  • 生数

    使用场景用于电影预告片的快速制作在教育领域生成科学实验的模拟视频为电商平台生成产品介绍视频在科研领域模拟物理实验过程产品特色一键生成长达16秒、1080P分辨率...
    视频生成,AI模型,AI视频生成,高清视频,多模态,大规模模型,技术创新,普通产品 08月01日 0 0
  • Skywork MoE Base FP8

    使用场景研究人员使用Skywork-MoE进行自然语言处理任务的模型训练和测试。企业利用Skywork-MoE模型进行产品文档的自动生成和问答系统开发。教育机构...
    AI模型,MoE,大规模模型,fp8精度,高性能计算,普通产品,开源, 08月01日 0 0
  • DRT O1 14B

    使用场景将含有隐喻的英文句子翻译成中文,以探索其深层含义。在跨文化交流中,使用DRT-o1-14B来理解和翻译复杂的比喻表达。在学术研究中,利用DRT-o1-1...
    翻译,模型训练与部署,神经机器翻译,长链推理,多代理框架,大规模模型,BF16张量,普通产品,开源, 08月02日 0 0
  • Deepseek V3

    使用场景在金融领域,DeepSeek-V3可以用于分析大量的财经新闻和报告,提取关键信息。在医疗行业,模型能够理解和分析医学文献,辅助药物研发和病例研究。在教育...
    AI模型,开发与工具,自然语言处理,深度学习,大规模模型,开源,高性能计算,中文精选,开源, 08月02日 0 0
  • Tülu 3 405B

    使用场景在学术研究中用于自然语言处理任务的性能测试企业开发智能客服系统,提升对话质量和效率教育领域辅助教学,提供个性化学习建议产品特色采用强化学习从可验证奖励(...
    AI模型,开发与工具,人工智能,自然语言处理,开源,强化学习,大规模模型,优质新品 08月02日 0 0
  • 苹果发布适配版SlowFast-LLaVA模型:长视频理解性能超越大规模模型

    发布于AI新闻资讯发布时间 :2025年8月25号 14:35阅读 :1分钟据国外媒体报道,苹果研究团队近日发布了适配版的SlowFast-LLaVA模型,该模...
    苹果,模型,视频,性能,大规模模型 08月26日 0 0