-
华为发布 AI 推理创新技术 UCM:可实现高吞吐、低时延推理体验,计划 9 月开源
华为发布AI推理创新技术UCM,融合多类型缓存加速算法工具,可扩大推理上下文窗口,实现高吞吐、低时延的推理体验。该技术已在中国银联三大业务场景中应用试点,计划9... -
华为发布AI推理技术UCM,推动行业革新
2025年8月12日,华为在“2025金融AI推理应用落地与发展论坛”上正式发布AI推理创新技术UCM(推理记忆数据管理器)。该技术以KV Cache为中心,融...