AI Powered Meeting Summarizer

使用场景会议记录整理:用户上传会议录音,系统自动生成会议摘要和完整文本记录。远程会议要点提取:用户上传远程会议的录音,系统提供会议关键点摘要。会议决策和行动项总...

  • AI Powered Meeting Summarizer

    类别:AI会议助手,AI文本摘要工具,语音识别,文本摘要,机器学习,Gradio,Whisper,普通产品,开源,
    官网:https://github.com/AlexisBalayre/AI-Powered-Meeting-Summarizer 更新时间:2025-08-02 09:25:12
  • 使用场景

    会议记录整理:用户上传会议录音,系统自动生成会议摘要和完整文本记录。

    远程会议要点提取:用户上传远程会议的录音,系统提供会议关键点摘要。

    会议决策和行动项总结:用户上传会议录音,系统帮助用户快速识别会议中的决策和行动项。

    产品特色

    音频到文本转换:使用whisper.cpp将音频文件转换为文本。

    文本摘要:使用Ollama服务器上的模型对文本进行摘要。

    支持多种模型:支持不同的Whisper模型(基础版、小型、中型、大型V3)以及Ollama服务器上的任何可用模型。

    翻译功能:允许将非英语音频翻译成英语。

    Gradio界面:提供用户友好的Web界面,用于上传音频文件、查看摘要和下载文本。

    要求Python 3.x环境:确保Python环境的兼容性和稳定性。

    FFmpeg(用于音频处理):确保音频文件格式的兼容性。

    Whisper.cpp(用于音频到文本转换):确保音频文件可以被准确转换。

    Ollama服务器(用于文本摘要):确保文本摘要的准确性和效率。

    Gradio(用于Web界面):确保用户界面的友好性和易用性。

    Requests(用于处理Ollama服务器的API调用):确保API调用的稳定性和效率。

    使用教程

    步骤1:克隆仓库到本地。

    步骤2:运行设置脚本,安装所有必要的依赖项(包括Python虚拟环境、whisper.cpp、FFmpeg和Python包),并运行应用程序。

    步骤3:访问应用程序。完成设置和执行后,Gradio会提供一个URL(通常是http://127.0.0.1:7860)。在Web浏览器中打开此URL以访问会议摘要器界面。

    步骤4:上传音频文件。点击音频上传区域并选择任何支持的格式(例如.wav、.mp3)的音频文件。

    步骤5:提供额外的上下文(可选)。为了更好的摘要,可以提供额外的上下文(例如,“关于人工智能和伦理的会议”)。

    步骤6:选择Whisper模型。从可用的Whisper模型(基础版、小型、中型、大型V3)中选择一个进行音频到文本的转换。

    步骤7:选择摘要模型。从Ollama服务器提供的可用选项中选择一个模型。

    步骤8:查看结果。上传音频文件后,你将获得由选定模型生成的摘要文本。