Excerptor

使用场景研究生使用Excerptor从学术书籍中提取关键数据,用于撰写论文。历史学家利用Excerptor识别古籍中的手写笔记,进行历史研究。作家使用Excer...

  • Excerptor

    类别:知识管理,研究工具,文本识别,OCR,图像处理,书籍扫描,信息提取,普通产品,开源,
    官网:https://github.com/osnsyc/Excerptor 更新时间:2025-08-02 09:40:49
  • 使用场景

    研究生使用Excerptor从学术书籍中提取关键数据,用于撰写论文。

    历史学家利用Excerptor识别古籍中的手写笔记,进行历史研究。

    作家使用Excerptor整理书籍引用,加速创作过程。

    产品特色

    - 划线文本识别:识别实体书籍中的划线文本。

    - 手写标记识别:识别手写在书籍上的标记。

    - 图像预处理:对拍摄的书籍页面进行白平衡和去噪处理。

    - 去弯曲校正:将弯曲的书籍页面图像进行校正。

    - 光学字符识别:将图像中的文字转换为可编辑的文本格式。

    - 模型训练:支持使用YOLO模型进行文本区域的分割。

    - 错误修正:提供接口修正OCR过程中的错误。

    - 批量处理:支持对多页书籍进行批量处理。

    使用教程

    1. 准备需要提取文本的实体书籍,并将其页面平铺拍摄成图片。

    2. 将拍摄的图片放入Excerptor指定的输入文件夹。

    3. 运行Excerptor程序,根据需要选择识别划线文本或手写标记的选项。

    4. Excerptor将自动进行图像预处理、去弯曲校正和光学字符识别。

    5. 检查识别结果,如有错误可手动进行修正。

    6. 将识别后的文本保存到输出文件夹,或进行进一步的编辑和处理。

    7. 如果需要,可以将原图片存档到指定的存档文件夹。