Pdf2audio_音频

Pdf2audio

类别：AI文本转语音,AI音频生成,PDF转换,音频生成,文本到语音,OpenAI GPT,优质新品,开源,

官网:https://github.com/lamm-mit/PDF2Audio 更新时间：2025-08-01 19:11:52
使用场景
研究人员将学术论文转换为音频，以便在通勤时学习
学生将教科书内容转换成音频，以便于复习和学习
播客创作者将文章转换成播客脚本，提高内容生产效率
产品特色
支持上传多个PDF文件
提供多种指令模板选择（如播客、讲座、摘要等）
允许自定义文本生成和音频模型
支持选择不同的语音进行朗读
通过具体或一般性的评论和编辑草稿进行迭代
可以在Colab上使用
支持本地安装和运行
使用教程
克隆代码库到本地
安装Miniconda（如果尚未安装）
验证安装：执行`conda --version`
创建一个新的Conda环境：`conda create -n pdf2audio python=3.9`
激活Conda环境：`conda activate pdf2audio`
安装所需的依赖：`pip install -r requirements.txt`
在项目根目录下创建一个.env文件，并添加你的OpenAI API密钥
确保你在项目目录中，并且你的Conda环境已激活：`conda activate pdf2audio`
运行Python脚本启动Gradio界面：`python app.py`
在浏览器中打开终端提供的URL（通常是http://127.0.0.1:7860）
使用Gradio界面上传PDF文件并转换为音频

Pdf2audio