Whisper Input

使用场景在会议中快速记录要点,无需手动输入。学生在课堂上通过语音记录笔记,课后转为文字复习。内容创作者通过语音输入撰写文章或脚本。产品特色支持按下 Option...

  • Whisper Input

    类别:语音转文本,效率工具,语音转文字,生产力工具,多语言支持,免费,普通产品,开源,
    官网:https://github.com/ErlichLiu/Whisper-Input 更新时间:2025-08-02 10:21:27
  • 使用场景

    在会议中快速记录要点,无需手动输入。

    学生在课堂上通过语音记录笔记,课后转为文字复习。

    内容创作者通过语音输入撰写文章或脚本。

    产品特色

    支持按下 Option 或 Alt 按钮开始录制,抬起按钮结束录制。

    支持多语言语音转译,可将多种语言转译为文字。

    支持中文翻译为英文,满足双语输入需求。

    调用 Groq 或 SiliconFlow 提供的高性能语音转录模型,转译速度快。

    自带标点符号支持,无需额外润色即可输出完整句子。

    使用教程

    1. 确保本地有 Python 环境,版本不低于 3.10。

    2. 注册 Groq 或 SiliconFlow 账户,获取免费的 API KEY。

    3. 克隆项目到本地:`git clone git@github.com:ErlichLiu/Whisper-Input.git`。

    4. 创建虚拟环境并激活:`python -m venv venv`,然后运行 `source venv/bin/activate`(macOS/Linux)或 `.\venv\Scripts\activate`(Windows)。

    5. 安装依赖:`pip install pip-tools`,然后运行 `pip-compile requirements.in` 和 `pip install -r requirements.txt`。

    6. 配置 `.env` 文件,填入 API KEY 和相关设置。

    7. 运行程序:`python main.py`,即可通过按键进行语音转文字操作。