七脉的笔记

AI技术对比
提供不同AI产品和技术方案的深度对比分析,帮助用户了解行业竞争格局
aigc-agent

Agent从理论到落地:记忆机制的设计

Agent 记忆机制设计 ChatGPT 记忆机制的逆向发现 通过对话实验逆向得出 ChatGPT 的记忆系统未使用向量数据库、RAG、embedding 召回及相似度匹配,而是采用 4 层纯结构化设计。尽管 ChatGPT 是对话产品而非 Agent,但其 memory 设计思路回答了 Agent 记忆系统的核心问题:何时该用检索,何时不该。 不用向量数据库的核心原因 精确调用需求:向量检索是模糊匹配,无法确保关键事实类信息的精准命中。例如用户预算等需精确读取的信息,结构化存储可直接查对应字段,避免歧义。 时间处…

2026年3月15日 171点热度 0人点赞 阅读全文
aigc-agent

大模型从理论到落地:Agent Skills 概念介绍

Agent Skills 概念介绍 Agent Skills(技能)是让 AI 像新员工一样被培训而非编程的概念。它本质是一个文件夹,包含核心的 skill MD 文件、配套脚本、资源和示例,如同为新员工准备的入职培训班,所有需学习的内容整齐存放其中。 三层渐进式加载机制 该机制的核心是渐进式披露:Level 1 仅加载 100 个 TOKEN,相当于只看目录;Level 2 读取完整的技能说明书;Level 3 则按需加载额外资源。这种按需加载方式可告别上下文爆炸,即使复杂技能包也能轻松驾驭,类似查字典时按需查阅…

2026年3月15日 155点热度 0人点赞 阅读全文
aigc-agent

Agent从理论到落地二:理解好上下文

上下文工程的定义 传统提示词工程关注如何写指令,而上下文工程更进一步,策划哪些信息该进入模型视野,是从写作者到编辑的升级。 Agent 性能下降的核心问题 随着 Agent 运行时间变长,上下文信息量呈指数级爆炸(从几百 token 到几万甚至几十万),这是制约复杂任务的最大瓶颈,根源在于上下文管理失控。 上下文腐败的表现 输入变长导致模型性能下降,且以意外方式崩溃。 模型对信息位置极其敏感:关键信息在开头或结尾表现好,在中间时性能断崖式下降(类似读厚书只记开头结尾)。 连续处理相似任务时陷入模式固化:学习到的是无…

2026年3月15日 239点热度 0人点赞 阅读全文
aigc-agent

Agent从理论到落地:Agent 上下文管理

Agent≠调 API 的核心区别 面试中常被质疑 “Agent 只是调大模型 API”,但实际落地面临关键挑战:当对话轮次增加(如 50 轮),上下文 token 超过模型窗口(如 128K)时,需解决信息取舍问题,而非简单删除或全量发送。 上下文窗口限制与落地痛点 大语言模型上下文窗口存在硬限制(常见 128K-20 万,Gemini 达 100 万),但实际交互中: 固定开销:System Prompt + 工具说明约 4000 tokens 动态开销:每轮对话(输入 + 输出)500-2000 tokens…

2026年3月15日 196点热度 0人点赞 阅读全文
行业信息

关于2035 年中国科技强国建设全景路径、实施方案与当前进展收集

引言:科技强国战略的顶层设计与核心内涵 2035 年建成科技强国是中国式现代化的核心支撑,源于对全球科技竞争格局的深刻研判和国家发展的战略需求。党的二十大将科技自立自强作为国家发展的战略支撑,《科技强国建设纲要(2021-2035 年)》明确 “两步走” 实施路径:2025 年基础研究和原始创新能力显著提升,关键核心技术实现重大突破;2035 年进入创新型国家前列,全面建成科技强国。 这一战略的核心内涵可概括为 “五大支柱”:基础研究引领力、关键核心技术攻坚力、产业技术创新力、高水平人才集聚力、全球科技治理参与力,…

2026年1月29日 337点热度 0人点赞 阅读全文
技术积累

可灵与即梦 AI 深度对比分析分析

可灵与即梦 AI 深度对比分析 一、项目背景与概述 1.1 市场背景 生成式 AI 技术在 2024-2025 年迎来爆发式增长,尤其是视频生成领域成为竞争焦点。根据 QuestMobile 最新发布的 2025 年三季度 AI 应用行业报告显示,我国 AI 应用移动端月活跃用户规模已突破 7 亿大关,达到 7.29 亿。在这一背景下,国内两大互联网巨头字节跳动和快手分别推出了即梦 AI 和可灵 AI 两款视频生成产品,展开了激烈的市场竞争。 1.2 产品概述 可灵 AI:快手旗下的 AI 视频生成大模型,于 20…

2025年10月28日 1368点热度 3人点赞 阅读全文
最新文档分类
  • AI-study
  • aigc-agent
  • B端产品
  • 产品工具篇
  • 产品生命周期
  • 好好学习
  • 技术积累
  • 日常攻略
  • 行业信息
  • 随笔记录
最新 热点 随机
最新 热点 随机
个人助理:家庭mini-AI实验室建设 Agent从原理到落地笔记:Harness Engineering 面向长期运行型应用开发的 Harness 设计(译文) Multi-Agent 架构使用判断框架 agent 上下文工程记录 mannus和openclaw的核心竞争力是什么?
面向长期运行型应用开发的 Harness 设计(译文)Agent从原理到落地笔记:Harness Engineering个人助理:家庭mini-AI实验室建设
用产品思维分析在线直播为什么火 一些比较好的开源项目 我的常用工具箱与收藏夹 人力历史驱动力:发明技术、创造财富 Stirling-PDF PDF在线编辑,查看处理神器; 格局-精力分配与思想层次
标签聚合
智能决策 模型训练方法 智能体分级 大模型智能体 大模型应用 产品经理 GPU部署 RAG技术 技术架构 图像压缩 AI框架 AI技术对比

COPYRIGHT © 2026 75live.com. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang