七脉的笔记

模型训练方法
探索各类机器学习与深度学习模型的训练技巧及优劣对比,适合技术学习者参考。
AI-study

个人助理:家庭mini-AI实验室建设

自从2026年过年之前就在思考 如何构建自己的家庭AI实验室,我日常的学习中面临了如下几个问题: 当下的AI设计也有,看到太多的变化,但这些变化很多都停留在纸面上,缺少动手实操和深入了解,我认为我需要深入了解一些特有的框架,找到他们的共性,而不是人云亦云; 实操更容易有体感,真实的了解他们是如何运行的; 构建可持续的学习环境,预期可以实现开发、算力部署、训练、测试一体的环境; 本文档记录日常搭建家庭mini版本的AI实验室的整体记录,整体预算控制在 5万左右(); 网络建设(内网2.5Gbps,下行1000Mbs、…

2026年4月10日 90点热度 0人点赞 阅读全文
aigc-agent

Agent 从理论到落地:大模型 Function Calling 底层原理与实现

Function Calling 的底层机制 Function Calling 没有引入新的推理机制,底层与生成普通文本一致,均基于上下文的 next token prediction。模型通过训练学会在特定情况下将输出从自然语言切换为结构化 JSON 格式,而非存在独立的决策模块。关键在于模型通过大量样本学习输出模式,而非 “读懂”“判断” 或 “决定”。 Function Calling 的训练阶段 分为监督微调(SFT)和强化学习两个阶段。SFT 阶段:训练数据包含大量工具调用完整对话链(系统提示工具信息→用…

2026年3月15日 149点热度 0人点赞 阅读全文
AI-study

【知识点】记录学习人工智能零散的记录

1. SFT 和 RL 机器学习训练的区别: 1. 监督微调(SFT, Supervised Fine-Tuning) 定义: 在预训练模型(如基于海量文本训练的基座模型)的基础上,使用标注数据(输入-输出对)进行有监督的微调,使模型适应特定任务。 特点: 数据形式:输入(如用户提问) + 对应的理想输出(如人工标注的回答)。 目标:通过最小化预测输出与标注输出的差异(如交叉熵损失),让模型学会生成符合要求的回答。 优点:简单直接,适合学习明确的输入-输出映射。 局限:依赖高质量标注数据,无法学习更复杂的策略或长线…

2025年5月29日 497点热度 0人点赞 阅读全文
最新文档分类
  • AI-study
  • aigc-agent
  • B端产品
  • 产品工具篇
  • 产品生命周期
  • 好好学习
  • 技术积累
  • 日常攻略
  • 行业信息
  • 随笔记录
最新 热点 随机
最新 热点 随机
个人助理:家庭mini-AI实验室建设 Agent从原理到落地笔记:Harness Engineering 面向长期运行型应用开发的 Harness 设计(译文) Multi-Agent 架构使用判断框架 agent 上下文工程记录 mannus和openclaw的核心竞争力是什么?
面向长期运行型应用开发的 Harness 设计(译文)Agent从原理到落地笔记:Harness Engineering个人助理:家庭mini-AI实验室建设
下一代图像压缩格式科普---HEIF 与AVIF格式 CURL的常用 用法记录 人性弱点:习惯性反驳 中级教程:图生图 使用S3 fuse以及类S3挂载本地存储 AIGC人工智能考试案例题与参考答案
标签聚合
产品经理 大模型应用 智能决策 智能体分级 大模型智能体 RAG技术 图像压缩 模型训练方法 GPU部署 技术架构 AI框架 AI技术对比

COPYRIGHT © 2026 75live.com. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang