简单易懂的LLM相关知识梳理-ep.1-2 各家模型的特点-开源篇

2026-04-13 12:480阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

目录帖:

简单易懂的LLM相关知识梳理 文档共建
迫于项目被砍,失业赋闲在家,恰好也快过年了不想动了,想了下写点文章回馈下社区吧。 PS:如有年后Base重庆的AI/全栈/FAE岗可PM我 本文从实用角度出发,梦到哪写哪。部分八股文知识就不搬了,这里主要分享一下本人在使用各种云服务及本地部署过程中学到的知识。 这里优先介绍LLM/VLM,暂不涉及音频/视频/Omni相关模型(也可能梦到了以后补一下) 注:文章为本人手写,部分模型介绍搬运自…

本章以开源/闭源模型为划分,介绍一下日常使用及评估的经验。本节可能较为主观,请各位看官也要多多结合自身体感及实际业务体验来评判。

开源模型:百花齐放

如果说商业闭源领域里牢美是老大哥,那牢中就是开源赛道上的扛把子。篇幅所限,本文只讨论2025至今热度最高的几家。当然,Meta的LLaMA也不再讨论,因为LLaMA 4很拉非常拉,只有LLaMa 3世代及其变体有一定的使用价值。

由于开源模型的参数及介绍均可以在Huggingface的Model Card及config.json中找到,这里的表格将不再赘述。

阅读全文
问题描述:

目录帖:

简单易懂的LLM相关知识梳理 文档共建
迫于项目被砍,失业赋闲在家,恰好也快过年了不想动了,想了下写点文章回馈下社区吧。 PS:如有年后Base重庆的AI/全栈/FAE岗可PM我 本文从实用角度出发,梦到哪写哪。部分八股文知识就不搬了,这里主要分享一下本人在使用各种云服务及本地部署过程中学到的知识。 这里优先介绍LLM/VLM,暂不涉及音频/视频/Omni相关模型(也可能梦到了以后补一下) 注:文章为本人手写,部分模型介绍搬运自…

本章以开源/闭源模型为划分,介绍一下日常使用及评估的经验。本节可能较为主观,请各位看官也要多多结合自身体感及实际业务体验来评判。

开源模型:百花齐放

如果说商业闭源领域里牢美是老大哥,那牢中就是开源赛道上的扛把子。篇幅所限,本文只讨论2025至今热度最高的几家。当然,Meta的LLaMA也不再讨论,因为LLaMA 4很拉非常拉,只有LLaMa 3世代及其变体有一定的使用价值。

由于开源模型的参数及介绍均可以在Huggingface的Model Card及config.json中找到,这里的表格将不再赘述。

阅读全文