简单易懂的LLM相关知识梳理

2026-04-11 13:311阅读0评论SEO问题

内容介绍
文章标签
相关推荐

问题描述：

迫于项目被砍，失业赋闲在家，恰好也快过年了不想动了，想了下写点文章回馈下社区吧。

PS：如有年后Base重庆的AI/全栈/FAE岗可PM我

本文从实用角度出发，梦到哪写哪。部分八股文知识就不搬了，这里主要分享一下本人在使用各种云服务及本地部署过程中学到的知识。

这里优先介绍LLM/VLM，暂不涉及音频/视频/Omni相关模型（也可能梦到了以后补一下）

注：文章为本人手写，部分模型介绍搬运自相关官网文档，无任何AI生成内容。如果你觉得AI味很重，那八成是因为我被AI腌入味了，LLM反向Instruct人类这块）

=========通知区=========

26.1.7：累了，请假一天
26.1.9：这两天有点摆烂，总之是在工作日内更了一章，周末有事出门。本来计划昨天写完的，但核对数据花了大量时间精力，so f*ck u NVIDIA
26.1.13 被雾霾袭击，上呼吸道感染了
26.1.14 躺了一天，还是更一章吧。看完的佬友可以发条评论，最近几章的阅读量越来越少，是行文出了问题或是难以理解？还是单纯的帖子被淹没了？
26.1.16 经反馈，决定先把本地部署的部分鸽掉，先写远程调用的部分
26.1.22 最近比较忙，先把大家比较期待的ep.5和ep.6更了，剩下的坑如果想看的人比较多再填吧（而且阅读量越来越少有点没动力了）

=========通知区=========

ep.1 各家模型的特点

ep.1-1 闭源篇

点击阅读

ep.1-2 开源篇

点击阅读

ep.2 如何选择模型

ep.2-1 API篇

点击阅读

ep.2-2 本地部署篇

(待填坑，先看第三章，感觉阅读顺序没组织好)

ep.3 大模型和显卡相关通识（长文）

ep.3-1 认识大语言模型

点击阅读

ep.3-2 认识NVIDIA显卡

点击阅读

ep.3-3 认识NVIDIA驱动、CUDA、Pytorch

点击阅读

ep.3-4 认识常用推理引擎

(待填坑)

ep.4 适合从HomeLab到小型企业的开源模型的各种部署方法

(待填坑)

ep.5 常见API接口规范的介绍及使用

点击阅读

ep.6 Function Call 与 MCP

(待填坑)

ep.7 Embedding、Reranker与向量数据库

(待填坑)

网友解答：

--【壹】--：

感谢分享！！

--【贰】--：

支持大佬干货输出

--【叁】--：

前排插眼，支持一下

--【肆】--：

佬友太强了！

--【伍】--：

这个好支持点赞一键三连

--【陆】--：

学习一下

--【柒】--：

支持大佬

--【捌】--：

感谢佬，很棒的知识梳理
话说帖子打赏功能能出吗，这种好文章不打赏可惜了

--【玖】--：

跟随佬儿的步伐学习，支持佬友！！！

--【拾】--：

先mark为敬

--【拾壹】--：

催更催更

--【拾贰】--：

文章不错，等更新~:

--【拾叁】--：

mark学习一下

--【拾肆】--：

插眼一下

--【拾伍】--：

佬太厉害了，标记学习。

--【拾陆】--：

持续学习中

--【拾柒】--：

mark，持续学习！

--【拾捌】--：

学习一下

--【拾玖】--：

佬友强大

标签：人工智能软件开发

问题描述：

迫于项目被砍，失业赋闲在家，恰好也快过年了不想动了，想了下写点文章回馈下社区吧。

PS：如有年后Base重庆的AI/全栈/FAE岗可PM我

本文从实用角度出发，梦到哪写哪。部分八股文知识就不搬了，这里主要分享一下本人在使用各种云服务及本地部署过程中学到的知识。

这里优先介绍LLM/VLM，暂不涉及音频/视频/Omni相关模型（也可能梦到了以后补一下）

=========通知区=========

ep.1 各家模型的特点

ep.1-1 闭源篇

点击阅读

ep.1-2 开源篇

点击阅读

ep.2 如何选择模型

ep.2-1 API篇

点击阅读

ep.2-2 本地部署篇

(待填坑，先看第三章，感觉阅读顺序没组织好)

ep.3 大模型和显卡相关通识（长文）

ep.3-1 认识大语言模型

点击阅读

ep.3-2 认识NVIDIA显卡

点击阅读

ep.3-3 认识NVIDIA驱动、CUDA、Pytorch

点击阅读

ep.3-4 认识常用推理引擎

(待填坑)

ep.4 适合从HomeLab到小型企业的开源模型的各种部署方法

(待填坑)

ep.5 常见API接口规范的介绍及使用

点击阅读

ep.6 Function Call 与 MCP

(待填坑)

ep.7 Embedding、Reranker与向量数据库

(待填坑)

网友解答：

--【壹】--：

感谢分享！！

--【贰】--：

支持大佬干货输出

--【叁】--：

前排插眼，支持一下

--【肆】--：

佬友太强了！

--【伍】--：

这个好支持点赞一键三连

--【陆】--：

学习一下

--【柒】--：

支持大佬

--【捌】--：

感谢佬，很棒的知识梳理
话说帖子打赏功能能出吗，这种好文章不打赏可惜了

--【玖】--：

跟随佬儿的步伐学习，支持佬友！！！

--【拾】--：

先mark为敬

--【拾壹】--：

催更催更

--【拾贰】--：

文章不错，等更新~:

--【拾叁】--：

mark学习一下

--【拾肆】--：

插眼一下

--【拾伍】--：

佬太厉害了，标记学习。

--【拾陆】--：

持续学习中

--【拾柒】--：

mark，持续学习！

--【拾捌】--：

学习一下

--【拾玖】--：

佬友强大

标签：人工智能软件开发

ep.1 各家模型的特点

ep.1-1 闭源篇

ep.1-2 开源篇

ep.2 如何选择模型

ep.2-1 API篇

ep.2-2 本地部署篇

ep.3 大模型和显卡相关通识（长文）

ep.3-1 认识大语言模型

ep.3-2 认识NVIDIA显卡

ep.3-3 认识NVIDIA驱动、CUDA、Pytorch

ep.3-4 认识常用推理引擎

ep.4 适合从HomeLab到小型企业的开源模型的各种部署方法

ep.5 常见API接口规范的介绍及使用

ep.6 Function Call 与 MCP

ep.7 Embedding、Reranker与向量数据库

相关推荐

ep.1 各家模型的特点

ep.1-1 闭源篇

ep.1-2 开源篇

ep.2 如何选择模型

ep.2-1 API篇

ep.2-2 本地部署篇

ep.3 大模型和显卡相关通识（长文）

ep.3-1 认识大语言模型

ep.3-2 认识NVIDIA显卡

ep.3-3 认识NVIDIA驱动、CUDA、Pytorch

ep.3-4 认识常用推理引擎

ep.4 适合从HomeLab到小型企业的开源模型的各种部署方法

ep.5 常见API接口规范的介绍及使用

ep.6 Function Call 与 MCP

ep.7 Embedding、Reranker与向量数据库

相关推荐