七脉神剑的秘密

人工智能学习
汇集人工智能领域学习技巧与知识梳理,帮助读者更系统掌握相关技术要点。
AI-study

【知识点】记录学习人工智能零散的记录

1. SFT 和 RL 机器学习训练的区别: 1. 监督微调(SFT, Supervised Fine-Tuning) 定义: 在预训练模型(如基于海量文本训练的基座模型)的基础上,使用标注数据(输入-输出对)进行有监督的微调,使模型适应特定任务。 特点: 数据形式:输入(如用户提问) + 对应的理想输出(如人工标注的回答)。 目标:通过最小化预测输出与标注输出的差异(如交叉熵损失),让模型学会生成符合要求的回答。 优点:简单直接,适合学习明确的输入-输出映射。 局限:依赖高质量标注数据,无法学习更复杂的策略或长线…

2025年5月29日 0条评论 299点热度 0人点赞 阅读全文
最新文档分类
  • AI-study
  • B端产品
  • 产品工具篇
  • 产品生命周期
  • 吃喝玩乐
  • 好好学习
  • 技术积累
  • 行业观点
  • 随笔记录
最新 热点 随机
最新 热点 随机
不同系统的系统提示词 记录:系统约束与应答规则(System Remind) AI 日常学习提示词记录 Claude Skills是什么? Agent 进化深度分析:Skills、Tools 与 MCP 的协同之道 AIGC人工智能考试案例题与参考答案 可灵与即梦 AI 深度对比分析分析
AI 日常学习提示词记录不同系统的系统提示词 记录:系统约束与应答规则(System Remind)AIGC人工智能考试案例题与参考答案Agent 进化深度分析:Skills、Tools 与 MCP 的协同之道Claude Skills是什么?
引用-腾讯资深产品经理管理经验之谈 产品分享:数据驱动产品闭环 全自动AI短视频工厂实操 如何设计一款优秀的短视频-sdk 人性弱点:习惯性反驳 学习组织能力杨三角笔记
标签聚合
ImageX 图像处理工具篇 内容创作 短视频 安全产品经历 HEIF压缩 产品经理 分布式 SDK 开原系统 图像压缩 MPV

COPYRIGHT © 2026 75live.com. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang