准备搓自己的算力平台 有佬推荐配置么
- 内容介绍
- 文章标签
- 相关推荐
RT 模型暂定是qwen 3.5的122b 现在查了下资料暂定配置如下,不知道还有没有提升空间或者可更换的配置
8X H100 SXM
2X AMD EPYC 9754
1.5TB ECC DDR5
NVMe 8TB
双口100GbE
还望各位专业领域的佬指点一下
--【壹】--:
好的感谢佬我去看看
--【贰】--:
那你这太奢侈了吧,都没必要上h100,dgx spark串联一下部署个122b都可以,买四台也就差不多15w不到,128×4的大小
--【叁】--:
H100 没有很差
不过 H20 141G 显存会比较宽裕
只是性能会下降一些,想满血就选 H200
无论如何 qwen 3.5 122b 在这些选项中都可以部署 + 256K
差在吞吐量而已
--【肆】--:
H100讲道理有点落后,能搞B200就搞B200吧
--【伍】--:
你可以去租卡平台先去租几个小时,看看啥配置能跑起来你要的结果
--【陆】--:
要嘛直接 8x
少一个 tp 或 pp 都配不起来
--【柒】--:
剩下的就是你要的上下文窗口和缓存大小了。给你个参考,我们公司现在跑Qwen3.5-35B-A3B-FP8,只用了88g显存,两张L20,264144上下文窗口。所以换算一下感觉H20 141g的两张就能跑满Qwen3.5-122B-A10B-FP8上下文
--【捌】--:
你真要跑起来这个模型,fp8显存的,单张h20 141g也够了Qwen3.5-122B-A10B-FP8
--【玖】--:
了解了 感谢佬
--【拾】--:
是大佬
请下一位指点
话说 H100 为啥是 7x?
--【拾壹】--:
感谢佬 我去看看
--【拾贰】--:
我看了一眼参数 256k要上7x?
image360×257 7.65 KB
--【拾叁】--:
还没买 在拉采购清单 仅用于部署模型用途
--【拾肆】--:
几个问题,你这些东西是买了还是没买,买了之后除了部署模型还有其他用途吗?
--【拾伍】--:
看看H20 141GB这个卡呢
--【拾陆】--:
我是感觉所有仅部署模型的场景性价比都不如dgx spark,3.5w的价格128gb统一内存,还能串联使用
--【拾柒】--:
就是因为不太懂配置所以才发帖问问各位佬
--【拾捌】--:
钱包直接飞天
--【拾玖】--:
一开始拉的清单60w$ 但是看了半天有点不明所以 总感觉钱没花对地方
RT 模型暂定是qwen 3.5的122b 现在查了下资料暂定配置如下,不知道还有没有提升空间或者可更换的配置
8X H100 SXM
2X AMD EPYC 9754
1.5TB ECC DDR5
NVMe 8TB
双口100GbE
还望各位专业领域的佬指点一下
--【壹】--:
好的感谢佬我去看看
--【贰】--:
那你这太奢侈了吧,都没必要上h100,dgx spark串联一下部署个122b都可以,买四台也就差不多15w不到,128×4的大小
--【叁】--:
H100 没有很差
不过 H20 141G 显存会比较宽裕
只是性能会下降一些,想满血就选 H200
无论如何 qwen 3.5 122b 在这些选项中都可以部署 + 256K
差在吞吐量而已
--【肆】--:
H100讲道理有点落后,能搞B200就搞B200吧
--【伍】--:
你可以去租卡平台先去租几个小时,看看啥配置能跑起来你要的结果
--【陆】--:
要嘛直接 8x
少一个 tp 或 pp 都配不起来
--【柒】--:
剩下的就是你要的上下文窗口和缓存大小了。给你个参考,我们公司现在跑Qwen3.5-35B-A3B-FP8,只用了88g显存,两张L20,264144上下文窗口。所以换算一下感觉H20 141g的两张就能跑满Qwen3.5-122B-A10B-FP8上下文
--【捌】--:
你真要跑起来这个模型,fp8显存的,单张h20 141g也够了Qwen3.5-122B-A10B-FP8
--【玖】--:
了解了 感谢佬
--【拾】--:
是大佬
请下一位指点
话说 H100 为啥是 7x?
--【拾壹】--:
感谢佬 我去看看
--【拾贰】--:
我看了一眼参数 256k要上7x?
image360×257 7.65 KB
--【拾叁】--:
还没买 在拉采购清单 仅用于部署模型用途
--【拾肆】--:
几个问题,你这些东西是买了还是没买,买了之后除了部署模型还有其他用途吗?
--【拾伍】--:
看看H20 141GB这个卡呢
--【拾陆】--:
我是感觉所有仅部署模型的场景性价比都不如dgx spark,3.5w的价格128gb统一内存,还能串联使用
--【拾柒】--:
就是因为不太懂配置所以才发帖问问各位佬
--【拾捌】--:
钱包直接飞天
--【拾玖】--:
一开始拉的清单60w$ 但是看了半天有点不明所以 总感觉钱没花对地方

