使用场景
研究生使用Excerptor从学术书籍中提取关键数据,用于撰写论文。
历史学家利用Excerptor识别古籍中的手写笔记,进行历史研究。
作家使用Excerptor整理书籍引用,加速创作过程。
产品特色
- 划线文本识别:识别实体书籍中的划线文本。
- 手写标记识别:识别手写在书籍上的标记。
- 图像预处理:对拍摄的书籍页面进行白平衡和去噪处理。
- 去弯曲校正:将弯曲的书籍页面图像进行校正。
- 光学字符识别:将图像中的文字转换为可编辑的文本格式。
- 模型训练:支持使用YOLO模型进行文本区域的分割。
- 错误修正:提供接口修正OCR过程中的错误。
- 批量处理:支持对多页书籍进行批量处理。
使用教程
1. 准备需要提取文本的实体书籍,并将其页面平铺拍摄成图片。
2. 将拍摄的图片放入Excerptor指定的输入文件夹。
3. 运行Excerptor程序,根据需要选择识别划线文本或手写标记的选项。
4. Excerptor将自动进行图像预处理、去弯曲校正和光学字符识别。
5. 检查识别结果,如有错误可手动进行修正。
6. 将识别后的文本保存到输出文件夹,或进行进一步的编辑和处理。
7. 如果需要,可以将原图片存档到指定的存档文件夹。