七脉神剑的秘密

AI-study
学习AI过程中的点点滴滴
AI-study

如果做一个机器学习平台或者智能体平台,如果只选择三个,那是什么?

智能摘要 一个高效的机器学习或智能体平台必须具备三大核心能力:首先是统一的数据管理与处理,涵盖数据版本控制、特征存储、质量监控及大规模处理,确保数据可追溯与高质量;其次是全生命周期的模型工作流管理,包括实验追踪、自动化训练、流水线编排和模型注册,实现模型开发的标准化与可复现;最后是安全可靠的部署运维体系,支持弹性伸缩、多模式部署、性能监控与安全保障,保障模型在生产环境稳定运行。三者构成从数据到价值输出的完整闭环,缺一不可。— 此摘要由AI生成仅供参考。 1. 高效、统一的数据管理与处理能力 (Data) 2. 全生…

2025年8月28日 0条评论 57点热度 0人点赞 阅读全文
AI-study

智能体Agent 等级的深度思考与案例

智能摘要 文章介绍了智能体的等级划分,主要基于斯坦福学者Russell和Norvig的经典框架,将智能体分为五级:从简单反射型到学习型,逐级提升。同时结合现代发展,提出按自主性划分的类型,包括命令执行型、条件触发型、目标驱动型、任务自主型与完全自主型。还阐述了大语言模型(LLM)智能体的层次,涵盖工具使用、简单推理、规划执行及多智能体协作。实际应用中,先进智能体往往是多等级能力的融合体。— 此摘要由AI生成仅供参考。 最经典和广为接受的框架来自斯坦福大学学者Russell和Norvig的教科书《人工智能:一种现代方…

2025年8月25日 0条评论 316点热度 0人点赞 阅读全文
AI-study

NVIDIA 的AI推理系统技术细节

智能摘要 NVIDIA Dynamo是一款高吞吐量低延迟的分布式推理框架,专为多节点环境中的生成式AI模型服务设计。其核心功能包括分离prefill(处理输入提示并生成KV缓存)和decode(自回归生成token)阶段,以优化GPU资源分配;动态GPU调度机制实时调整资源比例,应对高并发负载;LLM-aware智能路由基于请求特征(如Prompt Tokens、Output Tokens)精准调度至合适节点;并采用NIXL库加速KV cache传输,通过RDMA和异步数据处理降低延迟。系统以Rust实现核心组件,…

2025年8月6日 0条评论 132点热度 0人点赞 阅读全文
AI-study

RTX5070ti部署Gpustack 踩坑指南-部署VLLM最新版本

智能摘要 文章介绍了在RTX 5070ti显卡上部署Gpustack和最新版本VLLM的注意事项和具体步骤。由于版本依赖较强,需使用CUDA 12.8以避免出现sm_120不可用的错误。作者推荐使用NVIDIA官网下载CUDA 12.8.1并以runfile方式安装,避免覆盖已有的显卡驱动。随后通过配置环境变量和创建虚拟环境安装VLLM,并通过软链接将VLLM接入GPUstack的指定路径以成功运行后端服务。整个流程强调版本适配和安装方法选择。— 此摘要由AI生成仅供参考。 对于50系显卡,我的是5070ti,cu…

2025年7月18日 0条评论 261点热度 0人点赞 阅读全文
AI-study

知识库使用中RAG策略指南

智能摘要 文章讨论了在构建RAG(检索增强生成)知识库问答系统时的关键策略与优化方法。虽然低代码平台如Dify、Coze提供了便捷的配置方式,但在企业级场景中,其问答精准度往往只能达到50、60分,难以满足高要求。文章分别介绍了知识提取、分块、嵌入、存储与索引、检索、生成与效果评估各环节中的技术和最佳实践。重点指出,需通过多个细致优化步骤提升系统性能,并推荐结合文档实际情况和生成目标选择合适的处理方式,持续关注新兴技术,如Self-RAG,以实现更高质量的知识库问答系统。— 此摘要由AI生成仅供参考。 像Dify、…

2025年6月26日 0条评论 111点热度 0人点赞 阅读全文
AI-study

全自动AI短视频工厂实操

智能摘要 文章介绍如何搭建一个全自动AI短视频生成工厂。流程包括部署n8n工作流,使用Google Gemini模型撰写文案并配置API密钥,下载并部署开源项目MoneyPrinterTurbo实现视频生成,通过Pexels获取素材,利用web页面或API完成视频生成测试。文章还列出了常见异常解决方式,例如代理设置和网络问题。最后,通过添加YouTube等平台的上传节点,完成多平台自动化发布。— 此摘要由AI生成仅供参考。 目标 输入一个标题,自动生成对应的一个短视频。 环境要求 1、部署n8n 2、梯子必要要求,…

2025年6月11日 0条评论 430点热度 0人点赞 阅读全文
AI-study

AI应用搭建框架对比指南

智能摘要 本文系统对比了 **LangChain、Coze、Dify、Flowise、LlamaIndex** 五种 AI 应用开发框架。不同框架在技术门槛、企业级功能、中文支持等方面各有侧重,适用于不同开发场景和团队类型。企业级系统开发建议使用 **Dify**,强安全合规和私有化能力契合政府与金融行业需求;个人和小团队快速开发推荐 **Coze**,依托字节生态可5分钟内创建机器人;科研与文档处理推荐 **LlamaIndex**,可视化工作流建议使用 **Flowise**;深度定制Agent则适合具备编程能…

2025年6月3日 0条评论 166点热度 0人点赞 阅读全文
AI-study

【知识点】记录学习人工智能零散的记录

智能摘要 监督微调(SFT)使用标注数据优化模型,使其适应特定任务,适用于对话模型初步优化,但依赖高质量数据,无法处理主观目标。强化学习(RL)则通过奖励信号优化模型,尤其在RLHF中结合人类反馈提升对话质量,适用于复杂目标和动态环境,但训练不稳定。SFT与RL常结合使用,先用SFT训练模型,再用RL进行微调。GPU利用率指标SM Activity用于衡量流式多处理器在执行任务时的活跃程度,当GPU利用率长期偏低时,会影响性能。— 此摘要由AI生成仅供参考。 1. SFT 和 RL 机器学习训练的区别: 1. 监督…

2025年5月29日 0条评论 136点热度 0人点赞 阅读全文
AI-study

comfyUI:高级教程

智能摘要 介绍了使用 ComfyUI 通过 ControlNet 插件实现图片转换的进阶方法。可通过 Canny 节点将普通图片转化为边缘图,用于 ControlNet 生成。同时,可使用 DWPose Estimation 节点将已有图片转换为人物姿势图,便于精准控制生成结果。还可借助 ReferenceOnlySimple 节点实现参考图设计。此外,还提供了边绘制边生成的实时应用技巧,例如使用 SDXL Turbo 模型和 Auto Queue 设置自动生图流程。— 此摘要由AI生成仅供参考。 在 Contro…

2025年4月28日 0条评论 406点热度 0人点赞 阅读全文
AI-study

中阶教程:ContorlNet

正式开始学习本章前,请先下载以下模型,并将模型文件放到对应的文件夹内: Dreamshaper(opens in a new tab):将其放到 ComfyUI 里的 models/checkpoints 文件夹内。 ControlNet Scribble(opens in a new tab):将其放到 ComfyUI 里的 models/controlnet 文件夹内。 ControlNet Openpose(opens in a new tab): 将其放到 ComfyUI 里的 models/control…

2025年4月28日 0条评论 195点热度 0人点赞 阅读全文
12

七脉神剑

这个人很懒,什么都没留下

最新 热点 随机
最新 热点 随机
大模型推理效率和成本优化手段与GPU利用率优化手段 2025 年企业级 AI 生成功能产品战略与市场 35岁后,经营自己的黄金十年 如果做一个机器学习平台或者智能体平台,如果只选择三个,那是什么? 智能体Agent 等级的深度思考与案例 NVIDIA 的AI推理系统技术细节
智能体Agent 等级的深度思考与案例如果做一个机器学习平台或者智能体平台,如果只选择三个,那是什么?35岁后,经营自己的黄金十年2025 年企业级 AI 生成功能产品战略与市场大模型推理效率和成本优化手段与GPU利用率优化手段
管理课程日常学习纪要 轻松查看媒体资源信息 远离毒鸡汤 Stirling-PDF PDF在线编辑,查看处理神器; 优先关注你的客户而非你的竞争对手 AI与大模型:大模型编排和工作流工具整理
标签聚合
AVIF格式 认知升级 逻辑闭环 图像压缩 视频编解码 H266技术 产品经理 WP插件

COPYRIGHT © 2026 75live.com. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang