TF ID

使用场景研究者使用TF-ID自动提取学术论文中的实验结果表格。学者利用TF-ID模型分析历史文献中的图表数据。教育机构采用TF-ID辅助学生快速获取文献中的统计...

  • TF ID

    类别:AI图像检测识别,AI模型,学术文献,对象检测,信息提取,自动化,普通产品,开源,
    官网:https://github.com/ai8hyf/TF-ID 更新时间:2025-08-01 18:33:30
  • 使用场景

    研究者使用TF-ID自动提取学术论文中的实验结果表格。

    学者利用TF-ID模型分析历史文献中的图表数据。

    教育机构采用TF-ID辅助学生快速获取文献中的统计信息。

    产品特色

    从学术论文中提取表格和图表

    提供带标题和不带标题的模型版本

    微调自microsoft/Florence-2模型检查点

    支持训练自定义模型

    开源模型权重和人工标注数据集

    提供详细的训练和使用指南

    使用教程

    克隆TF-ID的GitHub仓库到本地。

    下载并准备所需的数据集和标注文件。

    将标注文件和图像文件按照要求放置在指定目录。

    使用提供的脚本将数据集转换为所需的格式。

    使用Accelerate工具启动模型训练。

    训练完成后,使用训练得到的检查点进行模型推断。