Cola

使用场景使用Cola-Zero进行视觉问答使用Cola-FT进行图像描述使用Cola提高VLM性能产品特色使用语言模型聚合多个视觉-语言模型的输出支持LM微调和...

  • Cola

    类别:AI图像检测识别,AI模型,语言模型,视觉推理,LM微调,零样本学习,普通产品,开源,
    官网:https://github.com/cliangyu/Cola 更新时间:2025-08-01 15:36:45
  • 使用场景

    使用Cola-Zero进行视觉问答

    使用Cola-FT进行图像描述

    使用Cola提高VLM性能

    产品特色

    使用语言模型聚合多个视觉-语言模型的输出

    支持LM微调和零样本学习

    提高性能并增强对VLM错误的鲁棒性