使用场景
在会议中快速记录要点,无需手动输入。
学生在课堂上通过语音记录笔记,课后转为文字复习。
内容创作者通过语音输入撰写文章或脚本。
产品特色
支持按下 Option 或 Alt 按钮开始录制,抬起按钮结束录制。
支持多语言语音转译,可将多种语言转译为文字。
支持中文翻译为英文,满足双语输入需求。
调用 Groq 或 SiliconFlow 提供的高性能语音转录模型,转译速度快。
自带标点符号支持,无需额外润色即可输出完整句子。
使用教程
1. 确保本地有 Python 环境,版本不低于 3.10。
2. 注册 Groq 或 SiliconFlow 账户,获取免费的 API KEY。
3. 克隆项目到本地:`git clone git@github.com:ErlichLiu/Whisper-Input.git`。
4. 创建虚拟环境并激活:`python -m venv venv`,然后运行 `source venv/bin/activate`(macOS/Linux)或 `.\venv\Scripts\activate`(Windows)。
5. 安装依赖:`pip install pip-tools`,然后运行 `pip-compile requirements.in` 和 `pip install -r requirements.txt`。
6. 配置 `.env` 文件,填入 API KEY 和相关设置。
7. 运行程序:`python main.py`,即可通过按键进行语音转文字操作。