近日,DeepSeek团队在arXiv上发布了题为《Insights into DeepSeek-V3: Scaling Challenges and Refl...
AI架构,DeepSeek-V3,内存效率,大型语言模型,硬件与模型协同设计,计算效率,通信效率
07月29日
0
一、论文主要内容《Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Exper...
人工智能研究,大规模模型,机器翻译,条件计算,架构创新,模型扩展,深度学习,混合专家模型,神经网络架构,稀疏激活,自然语言处理,计算效率,语言建模
07月29日
0
最近,谷歌在天气预报领域取得了一项惊人的突破。他们开发了一种名为 NeuralGCM 的新型大气环流模型,这个模型的计算效率比传统的物理模型高出整整10万倍,相...
谷歌,AI,计算效率
07月30日
0
近日,字节跳动发布了一种新的两阶段视频模型,称为 FlashVideo。该技术通过独特的双阶段架构,在保持视频生成质量的同时大幅降低计算成本,为动态人脸个性化等...
字节,开源,视频,计算效率
07月30日
0
近日,人工智能领域再度掀起波澜,月之暗面(Moonshot)宣布开源新版优化器 Muon,成功将计算效率提升至传统 AdamW 的两倍。这个新优化器的推出恰逢 ...
月之暗面,计算效率
07月30日
0
在人工智能(AI)技术快速发展的今天,DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。这一系统旨在通过更高的吞吐量和更低的延迟,推动...
DeepSeek,开源,GPU,计算效率
07月30日
0
使用场景切片GPT可用于减少大型语言模型的内存消耗。切片GPT可用于加速大型语言模型的推理过程。切片GPT可用于提高预训练模型的计算效率。产品特色后训练稀疏化模...
AI模型,AI 模型推理训练,稀疏化,模型压缩,计算效率,普通产品,开源,
08月01日
0
使用场景案例一:研究人员使用1.58-bit FLUX模型进行学术研究,探索文本到图像的生成技术。案例二:设计师利用该模型快速生成设计概念图,加速创意实现过程。...
图片生成,AI模型,图像生成,量化,模型优化,自监督学习,计算效率,普通产品,开源,
08月02日
0
在视觉语言大模型(VLM)的研究和应用中,高计算成本一直是制约其广泛部署的主要障碍。近日,哈尔滨工业大学联合度小满共同研发出一种创新的自适应剪枝算法——Smar...
大模型,算法,多模态,模型,计算效率
08月18日
0
在今日举行的2025百度云智大会上,百度集团执行副总裁、百度智能云事业群总裁沈抖宣布,百度智能云的百舸AI计算平台正式升级至5.0全新版本。此次升级旨在通过在网...
百度,智能云,AI,计算效率,升级
08月29日
0