实时新闻动态更新

为您提供有关金现代的第一手资讯

Title
业务咨询
联系电话
400-600-7966
企业微信
扫码咨询

AI 词典・进阶篇|读懂这30个概念,你也是AI圈内人

2025-06-02 22:17:36   来源: 本站原创 

上篇文章(AI词典|30条AI术语,全网最易懂版!)梳理了 AI 基础术语,本文将聚焦30个易混概念,涵盖多智能体系统、具身智能等前沿应用,以及模型幻觉、过拟合等开发实践问题,帮助大家理解概念本质,解决 “听得懂但说不清” 的痛点。

1. 通用人工智能(AGI)

Artificial General Intelligence

定义:具备人类水平的综合认知能力,能在各类任务中自主学习和推理的人工智能,与仅擅长单一领域的 “弱人工智能”(Narrow AI)相对。

举例:科幻作品中的钢铁侠,可理解复杂指令、自主决策并处理多领域任务(目前仍属理论阶段)。

2. 具身智能

Embodied Intelligence

定义:拥有物理实体并通过 “感知 - 决策 - 行动” 与真实环境互动的智能体。

举例:波士顿动力机器人 Spot 通过摄像头感知环境、机械腿执行动作(如爬楼梯、开门),而 ChatGPT 仅为纯软件(无实体)。

3. 世界模型

World Model

定义:AI 通过模拟现实构建的虚拟环境,用于 “无真实数据时生成训练数据”。

举例:自动驾驶公司利用世界模型模拟暴雨、拥堵等极端场景,让汽车 AI 在虚拟环境中练习,避免真实道路测试风险。

4. 多智能体系统

Multi-agent System

定义:多个独立智能体协作完成复杂任务的系统,类似 “AI 团队分工合作”。

举例:智能交通系统中,路口传感器(感知智能体)收集车流量→控制中心(决策智能体)计算信号灯时长→信号杆(执行智能体)自动调整,全程无需人工干预。

5.人工智能偏见

Al Bias

定义:人工智能系统在决策过程中因数据、算法设计或训练方式等因素导致的系统性错误或歧视现象。

举例:招聘算法若基于历史性别歧视数据训练,可能优先推荐男性候选人;在AI生成的图片中,白人常被描绘为高位、财富满溢的模样,而其他有色人种则常被描绘为低薪劳工或被贴上“罪犯”的标签。

6. 模型泛化

Generalization

定义:模型对未见过的新数据的适应能力,即 “从训练数据中学习规律并推广到真实场景” 的能力。

举例:用 1-9 的手写体训练模型,若能准确识别从未见过的不同人书写的 “3”(新数据风格),说明泛化能力强;若仅能识别训练集中特定笔迹的 “3”,则泛化能力弱。

7. 大模型幻觉

Hallucination of LLM

定义:模型生成 “看似合理但事实错误” 的内容,类似 “AI 版不懂装懂”。

举例:询问“企鹅会飞吗”,可能得到“是的,它们进化出短距离飞行能力以躲避北极熊的捕食。”不懂的人,看回答觉得十分合理,实际与现实不符。

8. 过拟合

Overfitting

定义:过拟合是指模型过于复杂,不仅学习了数据中的基本规律,还学习了训练数据中的噪声和随机波动。与之对应的欠拟合则是指模型过于简单,无法捕捉数据中的基本规律。

举例:在训练模型识别 “猫” 的图片时,若训练数据中所有猫的图片均带有 “蓝色地毯” 背景(巧合),过拟合是指型错误地将 “蓝色地毯” 也视为猫的核心特征,生成 “有蓝色地毯才是猫” 的规则,导致遇到 “木地板上的猫” 时无法正确识别。

9. 思维树(ToT)

Tree of Thoughts

定义:将复杂问题拆解为树状分支,通过 “拓展子问题→评估分支→选择路径” 的决策框架。

举例:AI 规划旅行路线时,先拆分为 “目的地选择→交通方式→住宿预订” 主分支,再细分 “景点偏好→预算限制” 等子分支,最终生成最优方案。

10. 模型上下文协议(MCP)

Model Context Protocol

定义:开放协议,通过提供一个统一的接口,使得AI模型能够与各种工具和服务进行有效的交互,从而简化AI应用的开发和维护过程。

举例:没有MCP时,智能体等应用的开发就像“手工作坊”:每个工具需单独写接口(如天气 API、数据库函数);有了MCP后,智能应用的开发就像“工业流水线”,工具即插即用,开发者只需调用标准化模块。

11. 推理与行动框架

ReAct,Reasoning and Action

定义:结合 “推理→行动→反馈→再推理” 的闭环架构,使 AI 动态调整策略。

举例:智能客服处理退款时,先推理用户是否符合条件(查订单时间、商品状态),符合则调用退款接口(行动),不符合则询问补充信息(根据反馈调整)。

12. 生成对抗网络

Generative Adversarial Network

定义:是一种由生成器和判别器两个相互对抗的神经网络组成的模型。判别器评价是否通过,不通过时生成器重新生成直至判别通过。旨在通过对抗训练生成逼真的数据。

举例:美颜相机智能生成合照功能:生成器将用户的脸P到明星合影中,判别器检查肤色过渡是否自然、发丝细节等,最终生成毫无违和感的 “合照”。

13. 视觉识别

Visual Recognition

定义:通过计算机视觉和机器学习算法,使计算机能够识别和分类图像或视频中的对象、场景和动作。

举例:北京地铁通过视觉统计系统,通过人头密度分析动态调整扶梯方向,降低早高峰拥堵。

14. 目标检测

Object Detection

定义:计算机视觉任务之一,旨在识别图像或视频中的特定物体,并定位其在画面中的位置(通常用边界框标注)。

举例:安防系统通过目标检测识别监控画面中的可疑人物;自动驾驶汽车实时检测道路上的行人、车辆和交通标志。

15.高性能计算(HPC)

High Performance Computing

定义:通过超级计算机或计算集群,高效处理大规模、高复杂度计算任务的技术,显著提升数据处理速度。

举例:预测全球变暖趋势需处理海量气象数据,HPC 可缩短模拟时间;《流浪地球》使用 HPC 集群渲染行星发动机特效,较普通电脑节省 90% 以上时间。

16. 缩放定律

Scaling Law

定义:模型性能随参数规模和数据量增长呈规律性提升的现象。

举例:GPT-3 凭借 1750 亿参数生成流畅文本,GPT-4 参数更多,支持图文理解、代码生成等多模态任务。

17. 注意力机制

Attention Mechanism

定义:让模型在处理信息时 “选择性聚焦关键内容”,而非平均分配资源。

举例:翻译 “我喜欢苹果和香蕉,但讨厌榴莲” 时,模型重点关注 “苹果”“香蕉”“榴莲”(实体词),弱化 “和”“但”(虚词)。

18. 卷积神经网络(CNN)

Convolutional Neural Network

定义:包含卷积计算的神经网络,通过卷积层提取图像中的边缘、纹理等特征。

举例:人脸识别系统中,CNN先检测图像中的边缘→组合成眼睛、鼻子等局部特征→最终识别出完整人脸身份。

19. 循环神经网络(RNN)

Recurrent Neural Network

定义:处理序列数据(如文本、语音)的神经网络,能捕捉时序依赖关系。

举例:预测用户输入的下一个词:在 “我今天要去___” 中,RNN 根据 “今天”“去” 推断可能为 “上班”“逛街”。

20. 超参数

Hyperparameter

定义:超参数是在机器学习中设置的关键参数,这些参数不是通过训练数据学习得到的,而是在模型训练之前设定的。它们直接影响模型的学习过程和性能。

举例:想象你要烤一块蛋糕,蛋糕的配方就像机器学习模型的算法,而配方里的各种原料和它们的比例(不同的面粉、糖的量、烤箱的温度等)就像模型的超参数。

21. 语料库

Corpus

定义:用于人工智能模型训练的大规模文本或语音数据集,作为知识、示例或模式的存储库,包含结构化或非结构化数据。

举例:谷歌的 Common Crawl 包含数十亿网页文本,用于训练自然语言处理模型;语音识别系统的训练语料库包含不同口音的语音片段。

22. 知识蒸馏

Knowledge Distillation

定义:将大模型的 “知识” 迁移至小模型,压缩体积同时保留能力。

举例:将 GPT-3 的知识蒸馏到手机端小模型,使其能回答简单问题,且耗电少、响应快。

23. 低秩适应

LoRA

定义:LoRA是一种通过低秩分解来微调大模型的技术。它的核心思想是在不改变原始模型权重的情况下,仅通过引入少量可训练参数,就能让模型适配新的任务。

举例:通过 LoRA 技术,使用消费级显卡(例如 RTX 4090)就能对中文对话模型进行微调,而传统微调方法则需要依赖专业服务器。

24. 零样本学习

Zero-shot Learning

定义:模型未训练某类数据却能完成任务,依赖通用特征学习。

举例:模型在训练时只见过猫、狗、马的图片,但能通过文字描述(如有长鼻子的大型动物)正确识别测试集中的大象。

25. 小样本学习

Few-shot Learning

定义:模型仅通过极少量标注样本就能快速学习新任务或新类别的机器学习方法。

举例:给模型看3张熊猫照片,即可识别其他熊猫图片,传统模型需数万张训练图。

26. 深度学习

Deep Learning

定义:一类受生物神经网络启发的机器学习技术,通过多层人工神经网络自动提取数据特征,适用于处理复杂非线性问题。

举例:AlphaGo 通过深度学习击败人类围棋冠军;图像识别模型 ResNet 用于医学影像分析,检测肿瘤特征。

27. 梯度下降

Gradient Descent

定义:一种通过迭代优化模型参数以最小化损失函数的优化算法,广泛应用于机器学习和深度学习领域。

举例:在机器人控制中,机械臂需在复杂环境中规划从起点到终点的路径,同时避开障碍物。梯度下降可用于优化机械臂关节角度,使末端执行器沿 “能量最小化” 或 “距离最短” 路径移动。

28. 函数调用

Function Calling

定义:大模型通过 API 调用外部工具的能力,解决 “需实时数据或操作” 的问题。

举例:用户询问 “北京到上海明天的高铁余票”,模型调用 12306 接口获取数据后再回复。

29. 深度伪造

Deepfake

定义:用 AI 技术替换视频中的人脸或声音,达到以假乱真的效果。

举例:将电影片段中的演员面部替换为其他人,或模拟明星声音制作语音内容。

30. 降维

Dimensionality Reduction

定义:通过算法减少数据特征数量,保留关键信息的同时降低复杂度,解决 “维度灾难”(特征过多导致模型性能下降)。

举例:人脸数据集中,每张人脸图片(如100×100像素=10000维)通过PCA降维到50维,仍能保留90%以上的关键特征,使后续识别任务更高效。