生成对抗网络(GANs)是一种深度学习模型,由生成器和判别器两部分组成,通过互相博弈学习达到数据生成的目的。生成器的任务是从随机噪声中生成数据,而判别器则负责判...
监督式微调(Supervised Fine-Tuning, SFT)是在预训练模型的基础上,使用特定任务的标注数据集进行进一步训练的过程。预训练模型通常在大规模...
交叉验证(Cross-validation)是统计分析中一种重要的模型验证技术,主要用于评估模型在未知数据上的泛化能力。它通过将数据集分割成若干个子集,然后使用...
微调(Fine-Tuning)是一种在预训练模型基础上,针对特定任务或数据集进行细微的参数调整的过程。这一过程充分利用了预训练模型在大规模数据集上学习到的通用知...
语义理解(Semantic Understanding)是自然语言处理(NLP)中的一个重要领域,关注于理解和解释文本中词汇、短语和句子的含义。涉及字面意义,还...
知识表示(Knowledge Representation)是指将知识以一种机器可理解的形式表示出来,它涉及数据结构及其处理机制的综合:表示= 数据结构+处理机...
元学习(Meta-Learning),也称为“学会学习”,是机器学习领域中一个令人兴奋且极具潜力的研究方向。它的核心目标是让机器学习系统学会高效地学习新任务,解...
视频扩散模型(Video Diffusion Models, VDM)是一种结合了变分自编码器(VAE)和扩散模型优势的生成模型。VDM的核心思想是在潜在空间中...
超参数调整(Hyperparameter Tuning)是机器学习模型训练中的关键步骤,涉及到选择最佳的超参数组合以优化模型的性能。超参数是在学习过程开始之前设...
实时互动(Real-Time Engagement, RTE)是一种技术集合、产品架构和场景方案,旨在解决远程条件下沟通互动的双方能够实时性的真实、无缝还原线下...
机器人流程自动化(Robotic Process Automation, RPA)是一种软件技术,通过模拟人类行为与数字系统和软件进行互动,实现业务流程的自动化...
专家组合(Mixture of Experts, MoE)是一种在机器学习领域中用于构建大型模型的技术,它通过将模型分解为多个子网络或“专家”来提高模型的性能和...
遗传算法(Genetic Algorithm, GA)是一种模拟生物进化过程的启发式搜索算法,属于进化算法的范畴。它们基于自然选择和遗传学的思想,通过模拟自然选...
生成式人工智能(Generative AI)是能基于已有数据创造性地生成新内容的人工智能技术。在多个领域有着广泛的应用,包括文本生成、图像生成、音频和视频生成等...
对比语言-图像预训练(Contrastive Language-Image Pretraining, CLIP)是OpenAI开发的一种多模态预训练神经网络模型...
大模型幻觉(Hallucinations of large models)指的是模型生成的内容与现实世界事实或用户输入不一致的现象。
具身智能(Embodied Intelligence, EI)是一个多学科交叉的研究领域,它涉及认知科学、人工智能、机器人技术、神经科学等多个领域。具身智能的核...
训练数据(Training Data)是机器学习过程中用于构建预测模型的数据集。包含了一系列的输入特征和相应的目标输出,这些数据被用来让模型学习如何根据特征进行...
奖励模型是强化学习中的一个核心概念,用于评估智能体在特定状态下的行为表现。在大型语言模型(LLMs)中,奖励模型通过对输入的问题和答案进行评分,指导模型生成更符...
提示工程(Prompt Engineering)是一门新兴学科,专注于开发和优化提示词(Prompt),帮助用户有效地利用大型语言模型(Large Langua...