经验

  • 什么是模型泛化(Generalization)

    模型泛化(Generalization)是机器学习中的一个核心概念,指的是模型在训练数据之外的新数据上的表现能力。换句话说,泛化能力衡量的是模型能否在未见过的样...
    2025-08-01 12:24:54 0 0
  • 什么是上下文窗口(Context Window)

    上下文窗口指的是在自然语言处理(NLP)任务中,模型在处理一个特定输入时所考虑的上下文信息的范围。具体来说,它决定了模型在生成或理解文本时,可以同时看到和利用多...
    2025-08-01 12:24:52 0 0
  • 什么是数据蒸馏(Dataset Distillation)

    数据蒸馏(Dataset Distillation),也称为数据集压缩(Dataset Compression),是一种旨在从大规模数据集中提取关键信息并构建一...
    2025-08-01 12:24:49 0 0
  • 什么是规模定律(Scaling Law)

    规模定律(Scaling Law)描述了模型性能如何随着模型规模(如参数数量)、训练数据集大小以及用于训练的计算资源的增加而变化。体现为模型性能与这些因素之间的...
    2025-08-01 12:24:47 0 0
  • 什么是联结主义(Connectionism)

    联结主义(Connectionism),也称为连接主义,是认知科学和人工智能领域的一种理论框架,它主张通过模拟大脑中神经元的相互连接来解释认知过程。这一理论认为...
    2025-08-01 12:24:44 0 0
  • 什么是目标函数(Objective Function)

    目标函数(Objective Function)是数学优化问题中的核心概念,它表示所关心的目标与影响因素之间的函数关系。简单来说,目标函数是你试图通过计算或优化...
    2025-08-01 12:24:41 0 0
  • 什么是慢感知(slow perception)

    慢感知(Slow Perception)是阶跃多模态团队提出的一种新型视觉感知概念,通过逐步分解和流动的方式,让模型像人类一样更精细地感知复杂的几何图形。实验中...
    2025-08-01 12:24:39 0 0
  • 什么是评估模型(Judge models)

    评估模型(Judge models)是用于评估其他模型输出质量的辅助模型,充当“裁判员”的角色,对大语言模型(LLM)的输出结果进行评估和打分。模型通过输入问题...
    2025-08-01 12:24:37 0 0
  • 什么是智能体RAG(Agentic RAG)

    智能体RAG(Agentic RAG)是一种结合了AI智能体(Agent)和检索增强生成(RAG)系统的方法。它通过引入智能体框架来改变处理问答方式的技术。与仅...
    2025-08-01 12:24:35 0 0
  • 什么是前向链结(Forward Chaining)

    前向链结(Forward Chaining)是在人工智能领域中使用推理引擎进行自动推理的方法。是数据驱动的推理策略,从已知事实出发,通过应用一系列规则来推导出新...
    2025-08-01 12:24:32 0 0
  • 什么是判别式模型(Discriminative Model)

    判别式模型是机器学习中一类重要的模型,主要用于分类和回归任务。它们的核心目标是学习输入变量x和输出变量y之间的映射关系,即条件概率分布P(y|x)。与生成式模型...
    2025-08-01 12:24:29 0 0
  • 什么是NSA(Native Sparse Attention)

    NSA(Native Sparse Attention )是DeepSeek提出的一种新型稀疏注意力机制,通过算法创新和硬件优化提升长文本建模的效率。核心在于动...
    2025-08-01 12:24:27 0 0
  • 什么是草稿链(ChainofDraft, CoD)

    草稿链(Chain-of-Draft, CoD)是Zoom的研究团队提出新的AI推理范式,通过模仿人类的简洁思维过程来提升推理效率,节省成本。受到了人类解决问题...
    2025-08-01 12:24:24 0 0
  • 什么是MCP(Model Context Protocol)

    模型上下文协议(Model Context Protocol,MCP)是一种开放协议,让大型语言模型(LLM)与外部工具和数据源实现无缝通信。通过统一的协议实现...
    2025-08-01 12:24:22 0 0
  • 什么是氛围编程(Vibe Coding)

    Vibe Coding(氛围编程)是OpenAI联合创始人Andrej Karpathy推出的新型编程范式。基于人工智能,特别是大型语言模型(LLM),开发者通...
    2025-08-01 12:24:19 0 0
  • 什么是ANP(Agent Network Protocol)

    ANP(Agent Network Protocol)是开源的智能体通信协议,成为智能体互联网时代的 HTTP,为数十亿智能体构建一个开放、安全、高效的协作网络...
    2025-08-01 12:24:17 0 0
  • 通用人工智能(AGI)是什么?一文看懂

    通用人工智能(Artificial General Intelligence, AGI)是具备与人类相当甚至超越人类的广泛认知能力的人工智能形态 。能像人类一样...
    2025-08-01 12:24:14 0 0
  • MCP是什么?一文看懂

    Model Context Protocol(MCP) 是 Anthropic 推出的开放协议,标准化大型语言模型(LLM)与外部数据源和工具之间的通信。通过提...
    2025-08-01 12:24:08 0 0
  • 鸿蒙智能体框架(HMAF)是什么?一文看懂

    鸿蒙智能体框架(Harmony Agent Framework,简称 HMAF)是华为公司为其自主研发的鸿蒙操作系统(HarmonyOS)打造的一款核心人工智能...
    2025-08-01 12:24:05 0 0
  • 上下文工程是什么?一文读懂

    上下文工程是指构建一个动态系统,以正确的格式提供正确的信息和工具,使大语言模型(LLM)能合理地完成任务。是一种系统性的方法,确保LLM获得执行任务所需的一切必...
    2025-08-01 12:24:01 0 0