七脉的笔记

GPU部署
提供关于GPU部署的技术指导和常见问题解决方案,帮助开发者高效配置和运行GPU相关服务。
AI-study

个人助理:家庭mini-AI实验室建设

自从2026年过年之前就在思考 如何构建自己的家庭AI实验室,我日常的学习中面临了如下几个问题: 当下的AI设计也有,看到太多的变化,但这些变化很多都停留在纸面上,缺少动手实操和深入了解,我认为我需要深入了解一些特有的框架,找到他们的共性,而不是人云亦云; 实操更容易有体感,真实的了解他们是如何运行的; 构建可持续的学习环境,预期可以实现开发、算力部署、训练、测试一体的环境; 本文档记录日常搭建家庭mini版本的AI实验室的整体记录,整体预算控制在 5万左右(); 网络建设(内网2.5Gbps,下行1000Mbs、…

2026年4月10日 220点热度 2人点赞 阅读全文
AI-study

小白学AI第一节:深入浅出模型推理的重要的概念(PD)第一节

如何在保证低延迟、高吞吐的同时,高效利用GPU资源,避免算力浪费?HuggingFace 推出的 Text Generation Inference(TGI),正是为解决这一痛点而生的开源解决方案。本文基于 HuggingFace 官方博客《LLM Inference at Scale with TGI》,拆解 TGI 的核心原理、架构设计、关键优化技术,并补充实战配置与调优技巧,帮你快速掌握 LLM 规模化推理的落地方法 一、背景说明:LLM 规模化推理的痛点与 TGI 的定位 随着 LLM 在聊天机器人、RAG…

2026年2月14日 406点热度 0人点赞 阅读全文
AI-study

RTX5070ti部署Gpustack 踩坑指南-部署VLLM最新版本

对于50系显卡,我的是5070ti,cuda版本要12.8的版本不然会报sm_120不可用,建议pip安装之前先切到阿里源,清华源不稳定会报403 因此需要进行踩坑处理; RTx5070ti 对于 cuda 、pytorch 、vllm 版本有非常强的版本号依赖; 1.下载CUDA 由于我装完 Ubuntu22.04 后就自动带了最新的显卡驱动,就没有再去配置驱动。 先查看驱动能支持的CUDA最高版本,这里显示可支持到12.8。 nvidia-smi 在CUDA的 说明文档 可查看CUDA对应的驱动版本要求。 在 …

2025年7月18日 1011点热度 0人点赞 阅读全文
最新文档分类
  • AI-study
  • aigc-agent
  • B端产品
  • 产品工具篇
  • 产品生命周期
  • 好好学习
  • 技术积累
  • 日常攻略
  • 行业信息
  • 随笔记录
最新 热点 随机
最新 热点 随机
用户与 Agent 对话时序图 SSML 语音合成标记语言 & LaTeX 公式朗读 调研报告 Hermes 的多 Agents 是一套边界清晰的三层架构记录 个人助理:家庭mini-AI实验室建设 Agent从原理到落地笔记:Harness Engineering 面向长期运行型应用开发的 Harness 设计(译文)
Hermes 的多 Agents 是一套边界清晰的三层架构记录SSML 语音合成标记语言 & LaTeX 公式朗读 调研报告用户与 Agent 对话时序图
如果做一个机器学习平台或者智能体平台,如果只选择三个,那是什么? 产品经理应该如何控制设计师天马行空 产品设计法则-格式塔理论 林彪教我怎样当师长 从零开始,炼制你的第一个LoRA 中级教程:图生图
标签聚合
技术架构 模型训练方法 RAG技术 大模型智能体 AI技术对比 AI框架 智能决策 GPU部署 产品经理 大模型应用 图像压缩 智能体分级

COPYRIGHT © 2026 75live.com. ALL RIGHTS RESERVED.

Theme Kratos Made By Seaton Jiang