近日,加州大学圣地亚哥分校、Stability AI 和 Arm 的研究人员联合发布了一项名为“对抗性相对论-对比(Adversarial Relativistic-Contrastive,ARC)后训练”的新技术,为文本到音频生成领域带来了重大突破。该技术首次将不基于蒸馏的对抗性加速算法应用于扩散/流模型,显著提升了文本到音频系统的生成速度,使其能够以毫秒级的速度生成高质量音频,极大地拓展了其在创意应用中的实用性。论文地址:https://arxiv.org/pdf/2505.08175
0个人收藏 收藏

评论交流