使用场景
研究者使用TF-ID自动提取学术论文中的实验结果表格。
学者利用TF-ID模型分析历史文献中的图表数据。
教育机构采用TF-ID辅助学生快速获取文献中的统计信息。
产品特色
从学术论文中提取表格和图表
提供带标题和不带标题的模型版本
微调自microsoft/Florence-2模型检查点
支持训练自定义模型
开源模型权重和人工标注数据集
提供详细的训练和使用指南
使用教程
克隆TF-ID的GitHub仓库到本地。
下载并准备所需的数据集和标注文件。
将标注文件和图像文件按照要求放置在指定目录。
使用提供的脚本将数据集转换为所需的格式。
使用Accelerate工具启动模型训练。
训练完成后,使用训练得到的检查点进行模型推断。