2025年6月27日,快手旗下的可灵AI宣布其全系列视频模型正式上线“视频音效”功能,这一创新功能能够在生成视频的同时同步生成高质量的立体声音效,为用户带来“所见即所听”的沉浸式体验。该功能的推出不仅极大地提升了视频创作的效率和质量,还为视频创作者提供了更强大的工具,进一步推动了AI在视频创作领域的应用。

一、功能升级:音画同步的创新体验

可灵AI此次上线的“视频音效”功能基于其自主研发的多模态视频生音效模型Kling-Foley。该模型能够实现音画的帧级对齐,确保音效与画面内容高度同步。用户在生成视频时,系统会自动匹配精准的音效,无论是自然环境音、动作音效还是背景音乐,都能与视频内容完美融合,带来沉浸式的视听享受。

二、操作便捷:一键生成与匹配

此次升级后,可灵AI平台的“音效生成”功能新增了“视频生音效”模块。用户不仅可以上传自己的视频作品,还可以调用历史生成的视频,通过一键操作即可生成与视频内容语义贴合、时间同步的音效。这种便捷的操作方式大大降低了视频后期制作的难度和成本,即使是非专业的视频创作者也能轻松上手。

三、限时免费:普惠创作者

为了让更多用户能够体验到这一前沿技术的魅力,可灵AI宣布“视频音效”功能将向所有用户限时免费开放。这一举措不仅体现了可灵AI对创作者的友好态度,也进一步推动了AI技术在视频创作领域的普及和应用。

四、技术突破:多模态数据集与模型优化

可灵AI在推出“视频音效”功能的过程中,构建了庞大的多模态数据集,样本总数高达1亿以上。这些数据经过严格筛选和标注,覆盖了自然环境、人类活动、动物声音等多种场景,为模型的训练提供了坚实的基础。此外,Kling-Foley模型还引入了先进的音频编解码器和同步模块,显著提升了音频质量、语义对齐和音视频同步的效果。

AD:精心整理了2000+好用的AI工具!点此获取

0个人收藏 收藏

评论交流