近日,DeepSeek团队在arXiv上发布了题为《Insights into DeepSeek-V3: Scaling Challenges and Refl...
AI架构,DeepSeek-V3,内存效率,大型语言模型,硬件与模型协同设计,计算效率,通信效率
07月29日
0
一、论文主要内容《Outrageously Large Neural Networks: The Sparsely-Gated Mixture-of-Exper...
人工智能研究,大规模模型,机器翻译,条件计算,架构创新,模型扩展,深度学习,混合专家模型,神经网络架构,稀疏激活,自然语言处理,计算效率,语言建模
07月29日
0
最近,谷歌在天气预报领域取得了一项惊人的突破。他们开发了一种名为 NeuralGCM 的新型大气环流模型,这个模型的计算效率比传统的物理模型高出整整10万倍,相...
谷歌,AI,计算效率
07月30日
0
近日,字节跳动发布了一种新的两阶段视频模型,称为 FlashVideo。该技术通过独特的双阶段架构,在保持视频生成质量的同时大幅降低计算成本,为动态人脸个性化等...
字节,开源,视频,计算效率
07月30日
0
近日,人工智能领域再度掀起波澜,月之暗面(Moonshot)宣布开源新版优化器 Muon,成功将计算效率提升至传统 AdamW 的两倍。这个新优化器的推出恰逢 ...
月之暗面,计算效率
07月30日
0
在人工智能(AI)技术快速发展的今天,DeepSeek 团队推出了其全新的 DeepSeek-V3/R1推理系统。这一系统旨在通过更高的吞吐量和更低的延迟,推动...
DeepSeek,开源,GPU,计算效率
07月30日
0
在视觉语言大模型(VLM)的研究和应用中,高计算成本一直是制约其广泛部署的主要障碍。近日,哈尔滨工业大学联合度小满共同研发出一种创新的自适应剪枝算法——Smar...
大模型,算法,多模态,模型,计算效率
08月18日
0
在今日举行的2025百度云智大会上,百度集团执行副总裁、百度智能云事业群总裁沈抖宣布,百度智能云的百舸AI计算平台正式升级至5.0全新版本。此次升级旨在通过在网...
百度,智能云,AI,计算效率,升级
08月29日
0
发布于AI新闻资讯发布时间 :2025年8月28号 14:01阅读 :1分钟在今日举行的2025百度云智大会上,百度集团执行副总裁、百度智能云事业群总裁沈抖宣布...
百度,智能云,AI,计算效率,升级
08月29日
0