AI模型 图片编辑 视觉特征提取 多模态学习 增量学习 大规模数据集 图像分类 语义分割 普通产品 开源
使用场景使用InternViT-300M-448px-V2_5进行图像分类任务,以识别和分类不同的图像内容。在多语言OCR数据上应用该模型,以提高文本识别的准确...