七脉的笔记

七脉的笔记
日常学习的笔记稿与记录稿
AI-study

个人助理:家庭mini-AI实验室建设

自从2026年过年之前就在思考 如何构建自己的家庭AI实验室,我日常的学习中面临了如下几个问题: 当下的AI设计也有,看到太多的变化,但这些变化很多都停留在纸面上,缺少动手实操和深入了解,我认为我需要深入了解一些特有的框架,找到他们的共性,而不是人云亦云; 实操更容易有体感,真实的了解他们是如何运行的; 构建可持续的学习环境,预期可以实现开发、算力部署、训练、测试一体的环境; 本文档记录日常搭建家庭mini版本的AI实验室的整体记录,整体预算控制在 5万左右(); 网络建设(内网2.5Gbps,下行1000Mbs、…

2026年4月10日 16点热度 0人点赞 阅读全文
AI-study

Agent从原理到落地笔记:Harness Engineering

Harness Engineering 详解 Harness Engineering 的定义与核心价值 Agent 可靠性的瓶颈不在模型,而在模型周围的系统。模型是引擎,Harness 是方向盘。以 LangChain Coding Agent 为例,在 Terminal Bench 排行榜中,通过仅优化 Harness(系统提示、工具配置、中间件钩子),模型未更换的情况下,排名从 30 名开外提升至前五。Harness 源自马具(缰绳、马鞍等)的比喻:模型如马(强大但无方向),人类工程师如骑手(提供方向),Har…

2026年4月6日 35点热度 0人点赞 阅读全文
AI-study

面向长期运行型应用开发的 Harness 设计(译文)

面向长期运行型应用开发的 Harness 设计 (原文译文) 发布于 2026 年 3 月 24 日 Harness 设计是前沿智能体编程(agentic coding)领域实现高性能的关键。本文将介绍我们如何通过这一设计,在前端开发和长期自主软件工程领域进一步提升 Claude 的能力。 作者:普里特维・拉贾塞卡兰(Prithvi Rajasekaran),Anthropic 实验室团队成员 过去几个月里,我一直在攻克两个相互关联的难题:一是让 Claude 生成高质量前端设计,二是让它在无需人工干预的情况下构建…

2026年3月26日 108点热度 0人点赞 阅读全文
aigc-agent

Multi-Agent 架构使用判断框架

Multi-Agent 架构使用判断框架 Anthropic 的核心立场 大多数团队不需要 Multi-Agent 系统。在单个 Agent 上反复改进 prompt,效果可匹配花数月搭建的复杂多 Agent 架构,且代价更低。普通 Agent 消耗约 4 倍于聊天的 token,而 Multi-Agent 系统消耗约 15 倍,额外开销来自跨 Agent 的上下文复制、协调消息和结果汇总,因此需任务价值足够高才能覆盖开销。 该使用 Multi-Agent 的场景 上下文污染 不同子任务积累的信息互相干扰导致推理质…

2026年3月22日 127点热度 0人点赞 阅读全文
aigc-agent

agent 上下文工程记录

上下文工程的本质 大模型推理时的信息来源仅包括参数知识(训练阶段获得,推理阶段不可改)和上下文窗口内容。上下文工程本质是构建大模型的工作记忆,决定其决策时能看到的信息,进而影响行为质量。 与 Prompt Engineering 的区别 Prompt Engineering:关注措辞、格式、few-shot 示例等 “怎么说” 的问题。 上下文工程:关注每轮推理时上下文窗口中 “看到什么”,包括信息的选择、结构排列。 核心差异:Agent 是多轮推理循环(典型任务平均调用 50 次工具),上下文信息不断累积,存在 …

2026年3月22日 113点热度 0人点赞 阅读全文
aigc-agent

mannus和openclaw的核心竞争力是什么?

行业现象:“套壳” 产品的意外成功 AI 行业存在 “做模型的看不起做应用的,做应用的看不起套壳的” 的鄙视链,但 2026 年出现两个纯套壳产品的成功案例:一个被 Meta 以 20 亿美元收购(Menace),另一个两周内获得 17 万 GitHub Stars(OpenClaw),引发行业对 “套壳” 认知的反思。 案例介绍:两款典型 “套壳” 产品 Menace:2025 年 3 月发布,24 小时内成为国内 AI 领域讨论度最高产品,邀请码被炒至数万元。核心模型能力来自 Claude,通过调用 29 种工…

2026年3月22日 103点热度 0人点赞 阅读全文
aigc-agent

AGENT 落地为什么是编程agent?的核心矛盾:灵活性 vs 确定性

AGENT 的核心矛盾:灵活性 vs 确定性 灵活性来源:模型自主决策,但天然带有不确定性,无法 100% 预测下一步行动。 确定性来源:人定规则,但规则写死会丧失灵活性,无法应对未覆盖情况。 关系:两者是跷跷板关系,无法同时最大化,多数 agent 项目失败源于未明确平衡点。 编程 agent 成功的关键要素 试错成本极低 代码生成结果可通过执行即时验证,错误信息可被 agent 捕获并自主修正,反馈循环为毫秒级,无需人工判断。 对比企业业务场景(如取消订单、发送邮件),试错成本极高,错误可能导致事故,无法通过多…

2026年3月22日 92点热度 0人点赞 阅读全文
aigc-agent

Agent 评测方法论

Agent 评测方法论 Agent 迭代中的问题 常见问题:迭代后 Agent 出现 “降智” 现象,表现为能力退化或极端情况处理失败 核心痛点:缺乏量化评测,导致迭代依赖直觉,问题发现滞后(如用户投诉后才察觉),陷入被动救火循环 Agent 评测的核心逻辑 核心目标:将模糊的 Agent 表现转化为可信赖、可量化的数字评测 与传统大模型评测的差异:Agent 涉及多轮交互(调用工具、修改状态、调整策略),单轮测试失效,中间环节错误易导致任务失败 Agent 评测的核心概念 Task(测试用例):包含输入和成功标准…

2026年3月15日 130点热度 0人点赞 阅读全文
aigc-agent

Agent从理论到落地:记忆机制的设计

Agent 记忆机制设计 ChatGPT 记忆机制的逆向发现 通过对话实验逆向得出 ChatGPT 的记忆系统未使用向量数据库、RAG、embedding 召回及相似度匹配,而是采用 4 层纯结构化设计。尽管 ChatGPT 是对话产品而非 Agent,但其 memory 设计思路回答了 Agent 记忆系统的核心问题:何时该用检索,何时不该。 不用向量数据库的核心原因 精确调用需求:向量检索是模糊匹配,无法确保关键事实类信息的精准命中。例如用户预算等需精确读取的信息,结构化存储可直接查对应字段,避免歧义。 时间处…

2026年3月15日 119点热度 0人点赞 阅读全文
aigc-agent

agent从理论到落地:MCP 与 Skill 的区别及关系理解

MCP 与 Skill 的区别及关系 MCP 与 Skill 的核心区别 Skill 定义能力:是一组预定义的指令和处理逻辑,告诉 AI 怎么做事,如按规范生成数据分析报告(先区域拆分、算同比环比、按模板输出),与数据来源无关 MCP 定义连接:是标准化开放协议,解决 agent 与外部系统(数据库、网盘、代码仓库等)的通信问题,负责打通通道,支持 agent 实时读取、操作外部资源,且持续在线 类比:Skill 类似菜谱(记录做菜步骤),MCP 类似通向菜市场的路(食材通道),二者缺一不可 为何 Skill 中加…

2026年3月15日 113点热度 0人点赞 阅读全文
12345…26
最新文档分类
  • AI-study
  • aigc-agent
  • B端产品
  • 产品工具篇
  • 产品生命周期
  • 好好学习
  • 技术积累
  • 日常攻略
  • 行业信息
  • 随笔记录
最新 热点 随机
最新 热点 随机
个人助理:家庭mini-AI实验室建设 Agent从原理到落地笔记:Harness Engineering 面向长期运行型应用开发的 Harness 设计(译文) Multi-Agent 架构使用判断框架 agent 上下文工程记录 mannus和openclaw的核心竞争力是什么?
Agent从理论到落地二:理解好上下文AGENT 落地为什么是编程agent?的核心矛盾:灵活性 vs 确定性agent 上下文工程记录面向长期运行型应用开发的 Harness 设计(译文)Agent从原理到落地笔记:Harness EngineeringAgent从理论到落地:Agent 上下文管理
科学使用谷歌进行搜索 从“愚昧之巅”到“绝望之谷”,讲讲我价值几千万的认知 全自动AI短视频工厂实操 在线教育行业研究 如果做一个机器学习平台或者智能体平台,如果只选择三个,那是什么? 人这一生都在为自己的认知买单
标签聚合
大模型应用 向量存储 智能决策 RAG技术 AI技术对比 AI框架 智能体分级 自动化工具 大模型智能体 产品经理 图像压缩 技术架构

COPYRIGHT © 2026 75live.com. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang