Moonshot V1 Vision Preview

使用场景开发者在开发图像问答应用时,利用 Kimi 视觉模型理解用户上传的图片并回答相关问题。企业用于自动化图像内容审核,快速识别图片中的关键信息,提高审核效率...

  • Moonshot V1 Vision Preview

    类别:图片生成,AI模型,图像识别,视觉分析,AI 模型,多轮对话,流式输出,中文精选
    官网:https://platform.moonshot.cn/docs/guide/use-kimi-vision-model 更新时间:2025-08-02 10:16:46
  • 使用场景

    开发者在开发图像问答应用时,利用 Kimi 视觉模型理解用户上传的图片并回答相关问题。

    企业用于自动化图像内容审核,快速识别图片中的关键信息,提高审核效率。

    研究人员在图像识别研究中,借助该模型进行大规模图像数据的分析和处理。

    产品特色

    支持多轮对话,能够根据上下文理解并回答问题。

    提供流式输出,实时返回处理结果,提升用户体验。

    可进行工具调用,扩展模型的应用范围。

    支持 JSON Mode,方便开发者进行数据交互和处理。

    支持 Partial Mode,允许部分处理和响应,提高效率。

    不支持联网搜索,确保数据安全和隐私。

    不支持创建带有图片内容的 Context Cache,但可使用已创建成功的 Cache 调用模型。

    仅支持 base64 编码的图片内容,保证数据传输的稳定性和兼容性。

    使用教程

    1. 获取 Moonshot API Key,用于认证和访问 API。

    2. 选择合适的 Kimi 视觉模型,如 moonshot-v1-8k-vision-preview 等。

    3. 将图片文件转换为 base64 编码的字符串。

    4. 构建 API 请求,包括模型名称、图片内容和相关指令。

    5. 发送请求到 Moonshot AI 开放平台,获取模型的响应。

    6. 解析响应结果,提取所需信息并进行后续处理。