使用场景
用户可以通过语音指令让百聆查询天气情况,如说‘杭州天气怎么样?’,百聆会返回杭州的天气信息。
用户可以使用百聆进行雅思口语练习,百聆会生成雅思口语练习题目和对话,帮助用户进行练习。
用户可以设置定时任务,如说‘每天早上8点提醒我喝水。’,百聆会按照设定的时间提醒用户。
产品特色
高效开源模型:百聆使用多个开源模型,确保高效、可靠的语音对话体验。
无需GPU:通过优化,可本地部署,仍能提供类GPT-4的性能表现。
模块化设计:ASR、VAD、LLM和TTS模块相互独立,可根据需求进行替换和升级。
支持记忆功能:具备持续学习能力,能够记忆用户的偏好与历史对话,提供个性化的互动体验。
支持工具调用:灵活集成外部工具,用户可通过语音直接请求信息或执行操作,提升助手的实用性。
支持任务管理:高效管理用户任务,能够跟踪进度、设置提醒,并提供动态更新,确保用户不错过任何重要事项。
使用教程
1. 克隆项目仓库:git clone https://github.com/wwbin2017/bailing.git,然后进入项目目录cd bailing。
2. 安装所需依赖:pip install -r requirements.txt。
3. 配置环境变量:打开config/config.yaml配置ASR LLM等相关配置,下载SenseVoiceSmall到目录models/SenseVoiceSmall,并获取deepseek的api_key。
4. 启动后端服务:cd server,运行python server.py(可选)。
5. 启动主程序:运行python main.py,系统会等待语音输入,用户即可开始使用百聆进行语音对话。