可灵AI全系列视频模型上线“视频音效”功能，开启沉浸式创作新时代

AI 2025-07-29 18:04:21

资讯

2025年6月27日，快手旗下的可灵AI宣布其全系列视频模型正式上线“视频音效”功能，这一创新功能能够在生成视频的同时同步生成高质量的立体声音效，为用户带来“所见即所听”的沉浸式体验。该功能的推出不仅极大地提升了视频创作的效率和质量，还为视频创作者提供了更强大的工具，进一步推动了AI在视频创作领域的应用。

一、功能升级：音画同步的创新体验

可灵AI此次上线的“视频音效”功能基于其自主研发的多模态视频生音效模型Kling-Foley。该模型能够实现音画的帧级对齐，确保音效与画面内容高度同步。用户在生成视频时，系统会自动匹配精准的音效，无论是自然环境音、动作音效还是背景音乐，都能与视频内容完美融合，带来沉浸式的视听享受。

二、操作便捷：一键生成与匹配

此次升级后，可灵AI平台的“音效生成”功能新增了“视频生音效”模块。用户不仅可以上传自己的视频作品，还可以调用历史生成的视频，通过一键操作即可生成与视频内容语义贴合、时间同步的音效。这种便捷的操作方式大大降低了视频后期制作的难度和成本，即使是非专业的视频创作者也能轻松上手。

三、限时免费：普惠创作者

为了让更多用户能够体验到这一前沿技术的魅力，可灵AI宣布“视频音效”功能将向所有用户限时免费开放。这一举措不仅体现了可灵AI对创作者的友好态度，也进一步推动了AI技术在视频创作领域的普及和应用。

四、技术突破：多模态数据集与模型优化

可灵AI在推出“视频音效”功能的过程中，构建了庞大的多模态数据集，样本总数高达1亿以上。这些数据经过严格筛选和标注，覆盖了自然环境、人类活动、动物声音等多种场景，为模型的训练提供了坚实的基础。此外，Kling-Foley模型还引入了先进的音频编解码器和同步模块，显著提升了音频质量、语义对齐和音视频同步的效果。