TTS(Text to Speech)即文本转语音技术。是一种将文本信息转化为自然语音输出的技术。通过TTS技术,计算机可以将输入的文本自动转换成自然语音,模拟...
跨模态泛化(Cross-Modal Generalization)是指利用在一个或多个特定模态上学习到的知识,来提升系统在新的、未见过的模态上的性能。适用于多模...
专家系统(Expert System, ES)是人工智能领域的一个重要应用研究领域。是一种智能计算机程序系统,内部含有大量的某个领域专家水平的知识与经验。专家系...
代理型AI(Agentic AI)是一种人工智能系统,能自主行动和决策。这些系统被称为AI代理,可以独立于直接人类干预追求目标。代理型AI使用高级技术,如强化学...
零样本学习(Zero-Shot Learning, ZSL)是一种机器学习场景,其中AI模型被训练以识别和分类对象或概念,事先不知道这些类别或概念的任何示例。大...
扩散模型(Diffusion Models)是一种深度生成模型,通过模拟数据从有序状态向无序状态的扩散过程,以及相反的从无序状态恢复到有序状态的逆扩散过程,实现...
知识图谱问答(KGQA)是一种结合知识图谱和自然语言处理技术的系统,旨在通过理解用户的自然语言问题,从结构化的知识图谱中检索并生成准确的答案。
向量数据库是专门用来存储和查询向量的数据库系统。用于表示多维度的数据点,例如在机器学习和人工智能中使用的数据。在向量数据库中,数据被表示为向量,这些向量可以在多...
数据挖掘(Data Mining)是一种从大型数据集中发现模式和其他有价值信息的过程。利用机器学习和统计分析技术,从海量数据中提取有用信息,帮助组织做出更明智的...
检索增强生成(Retrieval-Augmented Generation, RAG)是一种结合了信息检索(IR)和自然语言生成(NLG)的技术。它通过从外部知...
端到端学习(End-to-End Learning)是一种机器学习和深度学习中的设计方法论,支持模型直接从输入数据学习到所需的输出结果,不需要人为地将任务分割成...
过拟合(Overfitting)是指模型在训练数据上表现得过于完美,以至于无法对新数据做出准确预测的现象。发生在模型过于复杂或者训练时间过长时,模型开始学习训练...
数字孪生(Digital Twin)是指一个物理实体或系统的虚拟数字副本,通过实时数据更新来精确反映其物理对应物的状态和行为。 数字孪生跨越对象的生命周期,利用...
光学字符识别(Optical Character Recognition,OCR)是一种将文本图像转换为机器可读格式的技术。通过自动数据提取,能快速识别扫描文档...
词嵌入(Word Embedding)是一种在自然语言处理(NLP)领域中用于表示文本数据的技术。通过将单词或短语映射到固定维度的向量空间中,使语义相近的单词在...
情感分类(Sentiment analysis)也称为情感分析或意见挖掘,是一种自然语言处理技术,用于分析文本数据以识别和提取作者的情感倾向、观点和评价。通过评...
Token是一种用于识别用户身份的凭证,由服务器生成并返回给客户端。客户端在后续请求中携带该Token,服务器通过解析Token验证用户身份,决定是否授权访问资...
基准测试(Benchmarking)是一种评估和比较系统性能的方法,通过一系列标准化的测试程序来测量系统的性能表现。这种测试可以帮助确定系统在特定条件下的性能水...
狭义人工智能(Artificial Narrow Intelligence, ANI)也被称为“弱人工智能”,是指被设计和训练来执行特定任务或狭窄范围内任务的人...
前向传播(Forward Propagation)是神经网络中的核心过程,它描述了输入数据如何通过网络层传递并生成输出的过程。输入数据被送入神经网络的输入层。输...