DTLR

使用场景用于识别和转录历史文献中的手写文本。在医疗领域,用于识别医生的手写处方。在教育领域,用于自动评分学生的手写作业。产品特色基于DINO-DETR的改进模型...

  • DTLR

    类别:AI模型,AI文字识别,OCR,手写识别,字符检测,深度学习,预训练模型,普通产品,开源,
    官网:https://github.com/raphael-baena/DTLR 更新时间:2025-08-01 19:15:06
  • 使用场景

    用于识别和转录历史文献中的手写文本。

    在医疗领域,用于识别医生的手写处方。

    在教育领域,用于自动评分学生的手写作业。

    产品特色

    基于DINO-DETR的改进模型,用于文本识别和字符检测。

    在合成数据上预训练,提高模型的泛化能力。

    使用CTC损失在真实数据集上进行微调,优化模型性能。

    支持多种语言和字符集,包括拉丁文、法文、德文和中文。

    提供预训练模型和微调模型的权重文件。

    包含N-gram模型,用于评估和提高识别准确性。

    提供详细的安装和使用指南,方便用户快速上手。

    使用教程

    1. 克隆代码库到本地环境。

    2. 创建虚拟环境并安装所需的Python依赖。

    3. 根据指南安装与系统和CUDA版本兼容的Pytorch。

    4. 将数据集放置在指定的文件夹中,并进行必要的预处理。

    5. 下载预训练模型权重,并放置在适当的目录下。

    6. 使用提供的脚本进行模型的微调。

    7. 使用评估脚本在不同数据集上评估模型性能。

    8. 根据需要,训练自己的N-gram模型以进一步提高识别准确性。