七脉的笔记

大模型智能体
聚焦LLM与工具、记忆融合后形成的智能体层次及协同方式
aigc-agent

agent 上下文工程记录

上下文工程的本质 大模型推理时的信息来源仅包括参数知识(训练阶段获得,推理阶段不可改)和上下文窗口内容。上下文工程本质是构建大模型的工作记忆,决定其决策时能看到的信息,进而影响行为质量。 与 Prompt Engineering 的区别 Prompt Engineering:关注措辞、格式、few-shot 示例等 “怎么说” 的问题。 上下文工程:关注每轮推理时上下文窗口中 “看到什么”,包括信息的选择、结构排列。 核心差异:Agent 是多轮推理循环(典型任务平均调用 50 次工具),上下文信息不断累积,存在 …

2026年3月22日 174点热度 0人点赞 阅读全文
aigc-agent

AGENT 落地为什么是编程agent?的核心矛盾:灵活性 vs 确定性

AGENT 的核心矛盾:灵活性 vs 确定性 灵活性来源:模型自主决策,但天然带有不确定性,无法 100% 预测下一步行动。 确定性来源:人定规则,但规则写死会丧失灵活性,无法应对未覆盖情况。 关系:两者是跷跷板关系,无法同时最大化,多数 agent 项目失败源于未明确平衡点。 编程 agent 成功的关键要素 试错成本极低 代码生成结果可通过执行即时验证,错误信息可被 agent 捕获并自主修正,反馈循环为毫秒级,无需人工判断。 对比企业业务场景(如取消订单、发送邮件),试错成本极高,错误可能导致事故,无法通过多…

2026年3月22日 148点热度 0人点赞 阅读全文
aigc-agent

Agent 评测方法论

Agent 评测方法论 Agent 迭代中的问题 常见问题:迭代后 Agent 出现 “降智” 现象,表现为能力退化或极端情况处理失败 核心痛点:缺乏量化评测,导致迭代依赖直觉,问题发现滞后(如用户投诉后才察觉),陷入被动救火循环 Agent 评测的核心逻辑 核心目标:将模糊的 Agent 表现转化为可信赖、可量化的数字评测 与传统大模型评测的差异:Agent 涉及多轮交互(调用工具、修改状态、调整策略),单轮测试失效,中间环节错误易导致任务失败 Agent 评测的核心概念 Task(测试用例):包含输入和成功标准…

2026年3月15日 182点热度 0人点赞 阅读全文
aigc-agent

Agent从理论到落地:记忆机制的设计

Agent 记忆机制设计 ChatGPT 记忆机制的逆向发现 通过对话实验逆向得出 ChatGPT 的记忆系统未使用向量数据库、RAG、embedding 召回及相似度匹配,而是采用 4 层纯结构化设计。尽管 ChatGPT 是对话产品而非 Agent,但其 memory 设计思路回答了 Agent 记忆系统的核心问题:何时该用检索,何时不该。 不用向量数据库的核心原因 精确调用需求:向量检索是模糊匹配,无法确保关键事实类信息的精准命中。例如用户预算等需精确读取的信息,结构化存储可直接查对应字段,避免歧义。 时间处…

2026年3月15日 172点热度 0人点赞 阅读全文
aigc-agent

agent从理论到落地:MCP 与 Skill 的区别及关系理解

MCP 与 Skill 的区别及关系 MCP 与 Skill 的核心区别 Skill 定义能力:是一组预定义的指令和处理逻辑,告诉 AI 怎么做事,如按规范生成数据分析报告(先区域拆分、算同比环比、按模板输出),与数据来源无关 MCP 定义连接:是标准化开放协议,解决 agent 与外部系统(数据库、网盘、代码仓库等)的通信问题,负责打通通道,支持 agent 实时读取、操作外部资源,且持续在线 类比:Skill 类似菜谱(记录做菜步骤),MCP 类似通向菜市场的路(食材通道),二者缺一不可 为何 Skill 中加…

2026年3月15日 157点热度 0人点赞 阅读全文
aigc-agent

大模型从理论到落地:Agent Skills 概念介绍

Agent Skills 概念介绍 Agent Skills(技能)是让 AI 像新员工一样被培训而非编程的概念。它本质是一个文件夹,包含核心的 skill MD 文件、配套脚本、资源和示例,如同为新员工准备的入职培训班,所有需学习的内容整齐存放其中。 三层渐进式加载机制 该机制的核心是渐进式披露:Level 1 仅加载 100 个 TOKEN,相当于只看目录;Level 2 读取完整的技能说明书;Level 3 则按需加载额外资源。这种按需加载方式可告别上下文爆炸,即使复杂技能包也能轻松驾驭,类似查字典时按需查阅…

2026年3月15日 156点热度 0人点赞 阅读全文
aigc-agent

Agent从理论到落地二:理解好上下文

上下文工程的定义 传统提示词工程关注如何写指令,而上下文工程更进一步,策划哪些信息该进入模型视野,是从写作者到编辑的升级。 Agent 性能下降的核心问题 随着 Agent 运行时间变长,上下文信息量呈指数级爆炸(从几百 token 到几万甚至几十万),这是制约复杂任务的最大瓶颈,根源在于上下文管理失控。 上下文腐败的表现 输入变长导致模型性能下降,且以意外方式崩溃。 模型对信息位置极其敏感:关键信息在开头或结尾表现好,在中间时性能断崖式下降(类似读厚书只记开头结尾)。 连续处理相似任务时陷入模式固化:学习到的是无…

2026年3月15日 240点热度 0人点赞 阅读全文
AI-study

LangGraph 多智能体场景选择与底层运行机制

多智能体场景适配和场景   多智能体运行模式 核心特点 适合的业务场景 顺序执行(Pipeline/Sequential) 流程固定、串行执行,前一步输出为后一步输入,无分支无并行 1. 内容生成(规划→写作→润色→发布); 2. 数据处理(清洗→分析→可视化); 3. 标准化客服流程; 4. 代码生成流水线(需求→编码→测试→修复) 监督者-工作者(Supervisor-Workers)-- 用的最多 中央监督者调度、分配任务、汇总结果,工作者专注专业任务,强管控、可审计 1. 企业级多专家系统(法律/…

2026年3月3日 227点热度 0人点赞 阅读全文
AI-study

智能体Agent 等级的深度思考与案例

最经典和广为接受的框架来自斯坦福大学学者Russell和Norvig的教科书《人工智能:一种现代方法》。他们根据智能体的理性程度和对环境的表现,将其分为五个等级。 此外,随着大语言模型(LLM)的兴起,也出现了一些新的划分方式来描述基于LLM的智能体。 下面我将结合经典理论和现代发展,为您详细解读智能体的等级 ------------------------------------------------------------------------------------------------ 一、经典分级(…

2025年8月25日 877点热度 1人点赞 阅读全文
最新文档分类
  • AI-study
  • aigc-agent
  • B端产品
  • 产品工具篇
  • 产品生命周期
  • 好好学习
  • 技术积累
  • 日常攻略
  • 行业信息
  • 随笔记录
最新 热点 随机
最新 热点 随机
个人助理:家庭mini-AI实验室建设 Agent从原理到落地笔记:Harness Engineering 面向长期运行型应用开发的 Harness 设计(译文) Multi-Agent 架构使用判断框架 agent 上下文工程记录 mannus和openclaw的核心竞争力是什么?
面向长期运行型应用开发的 Harness 设计(译文)Agent从原理到落地笔记:Harness Engineering个人助理:家庭mini-AI实验室建设
中级教程:图生图 从优秀产品经理到顶级产品经理 2023年:胆识+情商 优先关注你的客户而非你的竞争对手 l为什么很多saas企业级产品都熬不过第一年 CPU指令集学习
标签聚合
GPU部署 智能决策 大模型应用 RAG技术 产品经理 AI技术对比 图像压缩 智能体分级 AI框架 大模型智能体 模型训练方法 技术架构

COPYRIGHT © 2026 75live.com. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang