Phi 3 Vision 128k Instruct

使用场景用于教育领域,帮助学生理解复杂概念。在商业环境中,用于图像和文本数据的分析和处理。在研究中,作为生成AI功能的强大基础模型。产品特色4.2B参数,包含图...

  • Phi 3 Vision 128k Instruct

    类别:AI模型,AI图像生成,多模态,高质量,推理,视觉,文本,优质新品
    官网:https://ai.azure.com/explore/models/Phi-3-vision-128k-instruct/version/1/registry/azureml 更新时间:2025-08-01 18:09:40
  • 使用场景

    用于教育领域,帮助学生理解复杂概念。

    在商业环境中,用于图像和文本数据的分析和处理。

    在研究中,作为生成AI功能的强大基础模型。

    产品特色

    4.2B参数,包含图像编码器、连接器、投影器和Phi-3 Mini语言模型。

    支持文本和图像输入,最适合使用聊天格式的提示。

    上下文长度为128K tokens。

    使用512 H100-80G GPU进行训练,训练时间为1.5天。

    训练数据包含5000亿视觉和文本token。

    输出为针对输入生成的文本。

    模型训练日期为2024年2月至4月。

    模型为静态模型,训练截止日期为2024年3月15日。

    使用教程

    1. 访问Azure AI模型库并选择Phi-3-vision-128k-instruct模型。

    2. 根据需要进行模型的下载或部署。

    3. 准备输入数据,包括文本和图像。

    4. 设置模型参数,例如温度和最大新token数。

    5. 将输入数据传递给模型并接收输出。

    6. 分析模型输出,根据应用场景进行进一步处理。