使用场景
研究人员将学术论文转换为音频,以便在通勤时学习
学生将教科书内容转换成音频,以便于复习和学习
播客创作者将文章转换成播客脚本,提高内容生产效率
产品特色
支持上传多个PDF文件
提供多种指令模板选择(如播客、讲座、摘要等)
允许自定义文本生成和音频模型
支持选择不同的语音进行朗读
通过具体或一般性的评论和编辑草稿进行迭代
可以在Colab上使用
支持本地安装和运行
使用教程
克隆代码库到本地
安装Miniconda(如果尚未安装)
验证安装:执行`conda --version`
创建一个新的Conda环境:`conda create -n pdf2audio python=3.9`
激活Conda环境:`conda activate pdf2audio`
安装所需的依赖:`pip install -r requirements.txt`
在项目根目录下创建一个.env文件,并添加你的OpenAI API密钥
确保你在项目目录中,并且你的Conda环境已激活:`conda activate pdf2audio`
运行Python脚本启动Gradio界面:`python app.py`
在浏览器中打开终端提供的URL(通常是http://127.0.0.1:7860)
使用Gradio界面上传PDF文件并转换为音频