Docllm

使用场景企业发票的文本和空间布局理解处理企业合同中的文本和空间结构解析企业报告中的多模态信息产品特色处理企业文档中的文本和空间布局优于现有大型语言模型的性能避免...

  • Docllm

    类别:AI模型,AI开发平台,多模态,文档理解,大型语言模型,企业文档,普通产品,开源,
    官网:https://huggingface.co/papers/2401.00908 更新时间:2025-08-01 16:44:11
  • 使用场景

    企业发票的文本和空间布局理解

    处理企业合同中的文本和空间结构

    解析企业报告中的多模态信息

    产品特色

    处理企业文档中的文本和空间布局

    优于现有大型语言模型的性能

    避免昂贵的图像编码器

    专注于边界框信息以纳入空间布局结构

    捕获文本和空间模态之间的交叉对齐

    学习填充文本段落,以解决视觉文档中的不规则布局和异质内容