使用场景
生成80年代风格的鼓点
创作具有特定氛围的电子音乐
模拟自然声音如雨声或火车鸣笛
产品特色
生成长达47秒的立体声音频
支持44.1kHz的音频采样率
使用自编码器压缩波形
基于T5的文本嵌入技术
基于变换的扩散模型(DiT)
社区生成的音频示例展示
音频记忆分析,确保生成内容的原创性
使用教程
1. 访问Stable Audio Open网站
2. 选择一个文本提示,如'80s drum beat'
3. 系统将根据文本提示生成相应的音频
4. 可以试听生成的音频效果
5. 根据需要调整文本提示,生成不同的音频
6. 参考社区生成的音频示例,获取灵感
7. 检查音频记忆分析,确保生成的音频具有原创性