Pdf2audio

使用场景研究人员将学术论文转换为音频,以便在通勤时学习学生将教科书内容转换成音频,以便于复习和学习播客创作者将文章转换成播客脚本,提高内容生产效率产品特色支持上...

  • Pdf2audio

    类别:AI文本转语音,AI音频生成,PDF转换,音频生成,文本到语音,OpenAI GPT,优质新品,开源,
    官网:https://github.com/lamm-mit/PDF2Audio 更新时间:2025-08-01 19:11:52
  • 使用场景

    研究人员将学术论文转换为音频,以便在通勤时学习

    学生将教科书内容转换成音频,以便于复习和学习

    播客创作者将文章转换成播客脚本,提高内容生产效率

    产品特色

    支持上传多个PDF文件

    提供多种指令模板选择(如播客、讲座、摘要等)

    允许自定义文本生成和音频模型

    支持选择不同的语音进行朗读

    通过具体或一般性的评论和编辑草稿进行迭代

    可以在Colab上使用

    支持本地安装和运行

    使用教程

    克隆代码库到本地

    安装Miniconda(如果尚未安装)

    验证安装:执行`conda --version`

    创建一个新的Conda环境:`conda create -n pdf2audio python=3.9`

    激活Conda环境:`conda activate pdf2audio`

    安装所需的依赖:`pip install -r requirements.txt`

    在项目根目录下创建一个.env文件,并添加你的OpenAI API密钥

    确保你在项目目录中,并且你的Conda环境已激活:`conda activate pdf2audio`

    运行Python脚本启动Gradio界面:`python app.py`

    在浏览器中打开终端提供的URL(通常是http://127.0.0.1:7860)

    使用Gradio界面上传PDF文件并转换为音频