来发一个dgx spark部署大模型的经验
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
最近公司要做一个本地部署大模型的项目,配了dgx spark,用了一周的时间去尝试了各种模型,踩了各种坑,现在给大家汇报DGX Spark 部署 Qwen3.5 / NVFP4 大模型实战记录
这篇文档记录的是我在 NVIDIA DGX Spark(GB10,128GB unified memory) 上部署 Qwen3.5 系列模型,尤其是 NVFP4 量化模型 的完整踩坑过程、结论和推荐方案。
问题描述:
最近公司要做一个本地部署大模型的项目,配了dgx spark,用了一周的时间去尝试了各种模型,踩了各种坑,现在给大家汇报DGX Spark 部署 Qwen3.5 / NVFP4 大模型实战记录
这篇文档记录的是我在 NVIDIA DGX Spark(GB10,128GB unified memory) 上部署 Qwen3.5 系列模型,尤其是 NVFP4 量化模型 的完整踩坑过程、结论和推荐方案。

