Internvl2 5 38B

使用场景用于图像和文本的联合理解任务,如图像描述生成。在视频内容分析中,用于理解视频内容并生成视频摘要。作为聊天机器人的底层技术,提供图像和文本交互的能力。产品...