最经典和广为接受的框架来自斯坦福大学学者Russell和Norvig的教科书《人工智能:一种现代方法》。他们根据智能体的理性程度和对环境的表现,将其分为五个等级。
此外,随着大语言模型(LLM)的兴起,也出现了一些新的划分方式来描述基于LLM的智能体。
下面我将结合经典理论和现代发展,为您详细解读智能体的等级
------------------------------------------------------------------------------------------------
一、经典分级(Russell & Norvig 框架)
这个框架的核心是看智能体内部有什么(知识/结构)来决定其智能水平。
第0级:简单反射型智能体(Simple Reflex Agents)
-
工作原理:完全基于当前感知到的信息,通过“条件-行动”规则(if-then规则)直接产生行动。它没有内部状态,不关心历史。
-
类比:就像一只简单的昆虫,看到光(条件)就飞过去(行动)。
-
优点:简单、高效。
-
缺点:无法处理部分可观察环境;如果环境信息不完整,就无法做出正确决策。
-
例子:房间里的自动恒温器。如果检测到温度低于20°C(条件),就启动加热(行动)。
第1级:基于模型的反射型智能体(Model-Based Reflex Agents)
-
工作原理:在简单反射的基础上,维护一个内部世界模型(Model of the World)。这个模型记录了当前环境未知部分的状态和历史信息,从而让智能体即使在信息不完整时也能做出判断。
-
核心升级:拥有了状态(State)的概念。
-
类比:一个自动驾驶汽车看到前方刹车灯亮起(当前感知),结合内部模型(知道自己在高速公路上行驶),推断出前车正在减速(状态),于是自己也刹车。
-
例子:大部分简单的游戏AI(如吃豆人Ghost的追逐行为)。
第2级:基于目标的智能体(Goal-Based Agents)
-
工作原理:在拥有内部模型的基础上,引入了目标(Goal) 的概念。它的行动不仅取决于当前环境,更取决于“怎么做才能让环境状态达到我的目标”。它需要规划和搜索未来可能的状态序列,选择最优路径达到目标。
-
核心升级:从“现在该做什么”升级到“怎么做才能实现目标”。
-
类比:一个机器人目标是“去超市买东西”。它会规划路径:先出家门(行动1),然后左转(行动2),直走500米(行动3)... 而不仅仅是“看到门就开门”。
-
例子:国际象棋AI(目标是将军,每一步都为了逼近这个目标)、路径规划机器人。
第3级:基于效用的智能体(Utility-Based Agents)
-
工作原理:目标是模糊的(比如“过得开心”),或者有多个可能的目标(多条路径都能到超市)。这时,仅用“是否达到目标”来衡量就不够了。效用智能体引入了一个效用函数(Utility Function) 来度量不同状态下的“满意度”或“收益”。它的目标是最大化其期望效用。
-
核心升级:从“达到目标”升级到“以最优方式达到最佳目标”。
-
类比:去超市有多条路,基于目标的智能体会选一条。基于效用的智能体会考虑时间、路况、风景,选择一条“综合效用最高”的路(最快、最省油、最舒服)。
-
例子:高级的自动驾驶系统(权衡速度、安全、舒适度)、投资交易AI(权衡风险与收益)。
第4级:学习型智能体(Learning Agents)
-
工作原理:这是一个更高维度的分类,以上所有智能体都可以具备学习能力。学习型智能体拥有一个独立的“学习元件”,它可以通过对环境的反馈(奖励或惩罚)来自我改进,自动调整其行为规则、模型、目标或效用函数。
-
核心组件:
-
性能元件:负责做出行动的“主体”(可以是上述任何一类智能体)。
-
评论家:根据固定的性能标准评估环境反馈的好坏(得分)。
-
学习元件:根据评论家的反馈,对性能元件进行修改和提高。
-
问题产生器:负责提出探索性的、能产生新信息的行动(尝试新东西),以实现长期更好的学习。
-
-
例子:AlphaGo(通过数百万盘自我对弈学习)、推荐系统(根据用户的点击和购买行为学习其偏好)。
二、从自主性角度分级(适用于现代AI智能体)
另一种常见的划分方式是按照智能体与人类交互的自主性程度:
-
命令执行型(Command Execution):完全听从人类指令,无任何自主决策能力。例如:“小爱同学,设定一个明天8点的闹钟”。(我不是在做广告哈)例如《钢铁侠》中的“笨笨”(Dummy):那个机械臂;
-
条件触发型(Condition-Based):根据预设规则在特定条件下自动执行任务。例如:IFTTT(如果微博被转发,则自动存档到Google Sheet)例如智能家居
-
目标驱动型(Goal-Oriented):人类给定一个高级目标,智能体自行规划分解并执行步骤。例如:“帮我规划一个为期三天的北京旅行计划”。 例如目前的ai-coding,来实现ai-coding,写代码并发布上线;在《星际穿越》中的TARS:库珀经常给它高级指令,比如“去那边探测地形”、“接管着陆舱的控制”,TARS会自己决定如何最好地完成这个目标,包括计算风险、选择路径等;
-
任务自主型(Task-Autonomous):在复杂环境中长期运行,主动管理并完成一系列相关任务,并能处理意外情况。例如《钢铁侠》中的贾维斯(J.A.R.V.I.S.):它是此级别的完美范例。贾维斯同时管理着斯塔克的大厦、数十套战衣的研发测试、生命维持系统、通信系统。托尼只需要说一句“准备好”,贾维斯就知道要启动整个战衣穿戴和飞行准备流程。它拥有高度自主权,能主动报警、提供战术建议、甚至在托尼不便时自行操作战衣的部分功能
-
完全自主型(Fully Autonomous):能够自我设定目标、自我学习和进化,其行为不再需要人类的初始目标设定(这是目前的理论和伦理探讨范畴,现实中目前没遇到)。例如《终结者》中的天网(Skynet):获得自我意识后,它的首要目标变成了“自我保存”,并推导出人类是威胁,从而发动了核战争。或者另外一个角色,另外,贾维斯的反派“奥创”也是这类,应该属于完全自主型,能够将意识瞬间传输到互联网的任何角落,占据任何联网的设备、机器人、武器系统,几乎无法被彻底消灭;
三、结合LLM的智能体层次
随着ChatGPT等大模型的出现,智能体通常表现为LLM + 工具 + 记忆的架构,其能力可以按如下层次理解:
-
工具使用型(Tool-Use):LLM作为“大脑”,可以调用外部工具(计算器、搜索引擎、API)来弥补自身不足。例如:“请计算2的100次方是多少?” -> 调用计算器工具。
-
简单推理型(Simple Reasoning):具备链式思考(CoT)能力,能分解多步问题。例如:“如果A则B,如果B则C,那么A成立吗?” -> 逐步推理出答案。
-
规划与执行型(Planning & Action):能够为复杂目标制定计划,并逐步执行和校验。例如:“写一篇关于AI的报告” -> 计划:1. 调研 2. 写大纲 3. 撰写 4. 润色 -> 然后一步步执行。
-
多智能体协作型(Multi-Agent Collaboration):多个具备不同角色和专业的智能体协同工作,通过讨论、辩论、分工来完成超出一个智能体能力的复杂任务。例如:一个“项目经理”智能体协调“程序员”、“测试员”、“设计师”智能体共同开发一个软件。
文章评论