Florence 2 Large

使用场景在社交媒体上自动为图片生成描述性文字。为电子商务网站提供商品图片的目标检测和分类服务。在自动驾驶领域中,用于道路和交通标志的识别。产品特色图像描述:根据...

  • Florence 2 Large

    类别:AI图像生成,AI图像检测识别,视觉模型,多任务学习,图像描述,目标检测,普通产品,开源,
    官网:https://huggingface.co/microsoft/Florence-2-large 更新时间:2025-08-01 18:25:04
  • 使用场景

    在社交媒体上自动为图片生成描述性文字。

    为电子商务网站提供商品图片的目标检测和分类服务。

    在自动驾驶领域中,用于道路和交通标志的识别。

    产品特色

    图像描述:根据图像内容生成描述性文本。

    目标检测:识别图像中的物体并标注其位置。

    分割:区分图像中的不同区域,如物体和背景。

    密集区域描述:为图像中的密集区域生成详细描述。

    区域提议:提出图像中可能包含物体的区域。

    OCR:从图像中识别和提取文本。

    OCR与区域:结合区域信息进行文本识别。

    使用教程

    导入必要的库,如requests、PIL、Image和transformers。

    使用AutoModelForCausalLM和AutoProcessor从预训练模型中加载Florence-2-large模型。

    定义需要执行的任务提示,例如图像描述或目标检测。

    加载或获取需要处理的图像数据。

    通过模型和处理器将文本提示和图像数据转换为模型可接受的输入格式。

    调用模型的generate方法生成结果。

    使用处理器的batch_decode方法将生成的ID转换为文本。

    根据任务类型,使用后处理方法解析生成的文本,获取最终结果。