准备搓自己的算力平台 有佬推荐配置么

2026-04-11 15:291阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

RT 模型暂定是qwen 3.5的122b 现在查了下资料暂定配置如下,不知道还有没有提升空间或者可更换的配置
8X H100 SXM
2X AMD EPYC 9754
1.5TB ECC DDR5
NVMe 8TB
双口100GbE
还望各位专业领域的佬指点一下

网友解答:
--【壹】--:

好的感谢佬我去看看


--【贰】--:

那你这太奢侈了吧,都没必要上h100,dgx spark串联一下部署个122b都可以,买四台也就差不多15w不到,128×4的大小


--【叁】--:

H100 没有很差
不过 H20 141G 显存会比较宽裕
只是性能会下降一些,想满血就选 H200

无论如何 qwen 3.5 122b 在这些选项中都可以部署 + 256K
差在吞吐量而已


--【肆】--:

H100讲道理有点落后,能搞B200就搞B200吧


--【伍】--:

你可以去租卡平台先去租几个小时,看看啥配置能跑起来你要的结果


--【陆】--:

要嘛直接 8x
少一个 tp 或 pp 都配不起来


--【柒】--:

剩下的就是你要的上下文窗口和缓存大小了。给你个参考,我们公司现在跑Qwen3.5-35B-A3B-FP8,只用了88g显存,两张L20,264144上下文窗口。所以换算一下感觉H20 141g的两张就能跑满Qwen3.5-122B-A10B-FP8上下文


--【捌】--:

你真要跑起来这个模型,fp8显存的,单张h20 141g也够了Qwen3.5-122B-A10B-FP8


--【玖】--:

了解了 感谢佬


--【拾】--:

是大佬
请下一位指点

话说 H100 为啥是 7x?


--【拾壹】--:

感谢佬 我去看看


--【拾贰】--:

我看了一眼参数 256k要上7x?
image360×257 7.65 KB


--【拾叁】--:

还没买 在拉采购清单 仅用于部署模型用途


--【拾肆】--:

几个问题,你这些东西是买了还是没买,买了之后除了部署模型还有其他用途吗?


--【拾伍】--:

看看H20 141GB这个卡呢


--【拾陆】--:

我是感觉所有仅部署模型的场景性价比都不如dgx spark,3.5w的价格128gb统一内存,还能串联使用


--【拾柒】--:

就是因为不太懂配置所以才发帖问问各位佬


--【拾捌】--:

钱包直接飞天


--【拾玖】--:

一开始拉的清单60w$ 但是看了半天有点不明所以 总感觉钱没花对地方

标签:人工智能
问题描述:

RT 模型暂定是qwen 3.5的122b 现在查了下资料暂定配置如下,不知道还有没有提升空间或者可更换的配置
8X H100 SXM
2X AMD EPYC 9754
1.5TB ECC DDR5
NVMe 8TB
双口100GbE
还望各位专业领域的佬指点一下

网友解答:
--【壹】--:

好的感谢佬我去看看


--【贰】--:

那你这太奢侈了吧,都没必要上h100,dgx spark串联一下部署个122b都可以,买四台也就差不多15w不到,128×4的大小


--【叁】--:

H100 没有很差
不过 H20 141G 显存会比较宽裕
只是性能会下降一些,想满血就选 H200

无论如何 qwen 3.5 122b 在这些选项中都可以部署 + 256K
差在吞吐量而已


--【肆】--:

H100讲道理有点落后,能搞B200就搞B200吧


--【伍】--:

你可以去租卡平台先去租几个小时,看看啥配置能跑起来你要的结果


--【陆】--:

要嘛直接 8x
少一个 tp 或 pp 都配不起来


--【柒】--:

剩下的就是你要的上下文窗口和缓存大小了。给你个参考,我们公司现在跑Qwen3.5-35B-A3B-FP8,只用了88g显存,两张L20,264144上下文窗口。所以换算一下感觉H20 141g的两张就能跑满Qwen3.5-122B-A10B-FP8上下文


--【捌】--:

你真要跑起来这个模型,fp8显存的,单张h20 141g也够了Qwen3.5-122B-A10B-FP8


--【玖】--:

了解了 感谢佬


--【拾】--:

是大佬
请下一位指点

话说 H100 为啥是 7x?


--【拾壹】--:

感谢佬 我去看看


--【拾贰】--:

我看了一眼参数 256k要上7x?
image360×257 7.65 KB


--【拾叁】--:

还没买 在拉采购清单 仅用于部署模型用途


--【拾肆】--:

几个问题,你这些东西是买了还是没买,买了之后除了部署模型还有其他用途吗?


--【拾伍】--:

看看H20 141GB这个卡呢


--【拾陆】--:

我是感觉所有仅部署模型的场景性价比都不如dgx spark,3.5w的价格128gb统一内存,还能串联使用


--【拾柒】--:

就是因为不太懂配置所以才发帖问问各位佬


--【拾捌】--:

钱包直接飞天


--【拾玖】--:

一开始拉的清单60w$ 但是看了半天有点不明所以 总感觉钱没花对地方

标签:人工智能