Auralis

使用场景- 将整个哈利波特系列的第一本书转换为语音,仅用10分钟。- 为语言学习应用提供多语言的语音输出,增强学习体验。- 在播客制作中,快速将剧本转换为自然语...

  • Auralis

    类别:文本转声音,API服务,TTS,语音克隆,文本到语音,音频处理,Python API,普通产品,开源,
    官网:https://github.com/astramind-ai/Auralis 更新时间:2025-08-02 09:55:23
  • 使用场景

    - 将整个哈利波特系列的第一本书转换为语音,仅用10分钟。

    - 为语言学习应用提供多语言的语音输出,增强学习体验。

    - 在播客制作中,快速将剧本转换为自然语音,提高制作效率。

    产品特色

    - 快速处理长文本:使用智能批处理技术快速处理长文本。

    - 多请求并行处理:能够同时处理多个请求。

    - 流式处理长文本:支持长文本的流式处理。

    - 简单的Python API:提供了简洁的Python接口,易于集成和使用。

    - 内置音频增强:包括背景噪音降低、语音清晰度增强和音量标准化。

    - 自动语言检测:可以自动识别文本的语言。

    - 语音克隆:从短样本中克隆声音。

    - 支持自定义模型:用户可以使用自己的XTTSv2微调模型。

    使用教程

    1. 安装Auralis包:在终端中运行`pip install auralis`。

    2. 导入Auralis模块:在Python代码中添加`from auralis import TTS, TTSRequest`。

    3. 初始化TTS实例:创建TTS对象并从预训练模型加载`tts = TTS().from_pretrained("AstraMindAI/xttsv2", gpt_model='AstraMindAI/xtts2-gpt')`。

    4. 创建TTS请求:构建包含文本和参考音频文件的TTSRequest对象`request = TTSRequest(text="Hello Earth! This is Auralis speaking.", speaker_files=['reference.wav'])`。

    5. 生成语音:使用TTS实例生成语音`output = tts.generate_speech(request)`。

    6. 保存语音输出:将生成的语音保存为文件`output.save('hello.wav')`。