七脉神剑的秘密

人工智能学习
汇集人工智能领域学习技巧与知识梳理,帮助读者更系统掌握相关技术要点。
AI-study

【知识点】记录学习人工智能零散的记录

智能摘要 监督微调(SFT)使用标注数据优化模型,使其适应特定任务,适用于对话模型初步优化,但依赖高质量数据,无法处理主观目标。强化学习(RL)则通过奖励信号优化模型,尤其在RLHF中结合人类反馈提升对话质量,适用于复杂目标和动态环境,但训练不稳定。SFT与RL常结合使用,先用SFT训练模型,再用RL进行微调。GPU利用率指标SM Activity用于衡量流式多处理器在执行任务时的活跃程度,当GPU利用率长期偏低时,会影响性能。— 此摘要由AI生成仅供参考。 1. SFT 和 RL 机器学习训练的区别: 1. 监督…

2025年5月29日 0条评论 172点热度 0人点赞 阅读全文

七脉神剑

这个人很懒,什么都没留下

最新 热点 随机
最新 热点 随机
可灵与即梦 AI 深度对比分析分析 Nano Banana核心团队:图像生成模型下一个阶段的思考 通用agent观点:回访,对谈 LemonAI 创始人宜博 大模型+数据库典型公司:Databricks 大模型推理效率和成本优化手段与GPU利用率优化手段 2025 年企业级 AI 生成功能产品战略与市场
可灵与即梦 AI 深度对比分析分析
中级进阶:In/Outpainting 一些比较好的开源项目 玩客币的前世今生-边缘计算下的经济 国内有那些好用的BI工具篇 互联网 VS 国企 产品团队搭建的时候的一些思考
标签聚合
分布式 ImageX 图像压缩 图像处理工具篇 开原系统 HEIF压缩 产品经理 MPV

COPYRIGHT © 2026 75live.com. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang