适合个人跑AI的Nvidia显卡汇总(含魔改卡)

2026-04-29 08:383阅读0评论SEO基础
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

背景

论坛里面好像玩这些的人还挺多的,但是缺少统一总结的帖子;恰好我买过2080ti22g,3080 20g,4090d48g。于是来总结一下,希望能对佬友们有帮助


佬们,4080S 32G 这张卡值得买吗 - 搞七捻三 / 搞七捻三, Lv1 - LINUX DO
618有没有跑ai的显卡推荐? - 开发调优 - LINUX DO
课题组采购服务器配置单 - 搞七捻三 / 搞七捻三, Lv1 - LINUX DO


正文,显卡价格汇总,从高到低排序

价格为12.27采集,可能有变动

选取的基本上是大显存(至少16g),或者足够便宜(比如3060 12g,因为70的12g感觉性价比不高)

工作站卡系列

RTX PRO 6000

96G显存

性能上是比5090强10%,但是价格上比5090贵三倍,显存也大三倍

除非特别有钱,一般个人很难考虑了()

闲鱼价格在5.4-5.8万,淘宝在6万出头(2026.1.30已涨价,全部6w起步)

BlackWell架构,部分老的ai软件兼容不太好

image605×807 36.8 KB

RTX PRO 5000

有两种显存版本

48G的2.9w,72g的5.9w

比较贵,如果有这个钱 感觉不如加钱买pro6000

image1036×720 27.2 KB

游戏卡/工作站卡系列

RTX 5090(D)

32G显存

D好像性能差不多,一些up测不出来,Dv2显存和位宽砍太多不推荐

闲鱼在1.8-2万,淘宝在2.1-2.4万;如果是涡轮卡一般都得2.2-2.3万

BlackWell架构,部分老的ai软件兼容不太好

image335×738 17.3 KB

RTX4090(D)

24g/48g(推荐买48g的魔改版)

带D与不带D差价好像在2k左右,非D的版本功耗多25w,核心数量多一点

24g的一般D 1.7w,非D2w

48g的现在带D2.2-2.3w,非D的2.3-2.4w

image790×473 18 KB

RTX 4080

16G/32G

32g的现在闲鱼一般9k,淘宝一般1w出头

40系比30系省电,同时支持bf16,而且40系没有矿好像(30系有矿的风险)

image807×531 19.9 KB

5070ti

16G显存

PDD在6.2-6.5k,优点是正规卡

image152×678 6.45 KB

5060ti 16g

PDD在3.1-3.5k,优点是正规卡

image143×655 6.35 KB

4070ti super

16G显存

PDD在4.8-5k,优点是正规卡

image115×691 6.23 KB

4060ti 16g

淘宝在2.8-3k,优点是正规卡(感觉和5060ti差不多价格就不如买50了)

闲鱼2.5-2.7k,二手卡

image130×684 6.46 KB

RTX 3090

24G

老牌显卡,最后一代支持nvlink的了,但是听说发热比较大

image911×341 14.1 KB

闲鱼一般6k多

RTX 3080

10G/20G

性价比很高,闲鱼20g版一般2.7-3k

比起20系 支持bf16(很多现代llm需要bf16来加速)

比起50,40系,是80和90 cuda核心数量最接近的一次

image937×392 15.8 KB

3060 12G

12G算是部分够用吧,就是3060比较慢

闲鱼在1.3-1.4k

image789×270 12.6 KB

RTX 2080ti

11G/22G

1.7-1.8k 比较便宜,比4060ti跑ai和游戏都效果更好(当然,还是二手那些风险)

不支持bf16

image345×501 10.6 KB

服务器卡

A100

40G/80G

40G好像价格在2.7w,80G价格在4-5w多

服务器卡没有风扇,可能要自己改装散热才能用

一般都是别人无尘机房在吹风

image543×585 27.1 KB

V100

16G闲鱼400-500

32G闲鱼1.8-2k

不支持bf16,其他方面16G的性价比很高,b站很多组4卡8卡v100的

image721×759 40 KB


其他小问题

我对魔改卡的态度

可能大部分人听到魔改卡就很担心水深,认为可能比矿卡还危险。
但是我感觉,只要选好一些咸鱼或者淘宝销量比较高的商家(一般有1-3年质保),问题应该没那么大。因为魔改卡很多都是卖给小企业的,企业对稳定性的容忍可能比个人要高,跑满载的时间也比个人长,如果一个商家可以卖销量比较高,而没有很多差评,那么可以大概率认为这些卡是稳定的

我自己目前三张显卡,2080ti是PDD买的,3080,4090D是闲鱼买的,这些店目前还在,我的卡现在也还没坏,都是跑过ai,也打过游戏

闲鱼和淘宝的区别

淘宝可能更不容易跑路,但是可能跟闲鱼都是有厂家在做的,闲鱼可能手续费低,所以卖的比淘宝一般便宜10%

涡轮卡or风扇卡?

涡轮卡不跑东西的时候噪音还好,打游戏也还好

但是一旦开始训练,在房间里会非常吵,不过关了门在门口其实也听不到()

涡轮卡适合在服务器主板插很多张,游戏的风扇卡则做不到

网友解答:
--【壹】--:

5070ti 有super我好像没看到
今天摸鱼了一天,本来计划在租5070ti和4090试试,等星期一在看看,公司有需求 牛马只能慢慢测哪个效果好咯
看以前佬友的帖子,他用3090ti跑的FaceFunsion


--【贰】--:

不好意思 我记错了
4070才有tisuper
5070只有ti


--【叁】--:

好像这种算力nvidia没有直接公布在官网,需要自己测来着


--【肆】--:

哈哈,因为3060 12g便宜()
5070 12g相对没那么便宜,4070,那些也是


--【伍】--:

Nvidia 介绍新架构的 pdf 会顺带给出显卡数值。忘记录链接了,要去搜一下


--【陆】--:

这种工作站显卡没有风扇的,你可能需要拿些额外的散热来搞,感觉如果不熟悉的话可能有点麻烦


--【柒】--: xy3:

3060 12G

5070也12G()


--【捌】--:

嗯,本来8.6-8,8k的,最近涨价到了9.5k-10k


--【玖】--:

如果是买官方的卡,我个人建议是16GB起步
比如5070ti


--【拾】--:

以前通过官方文档总结的一些理论数值。

显存(GB) 显存速度(GB/sec) 功耗(W) FP16 / BF16 累计 FP32(TFLOPS) FP16 / BF16(TFLOPS)
3080 10 760 320 59.5 119.1
3090 24 936 350 71.2 142.3
A6000 48 936 300 154.8 154.8
4090 24 1008 450 165.2 330.3
6000 Ada 48 1008 300 364 364
5090 32 1792 575 209.5 419
Pro 6000 Max-Q 96 1792 300 438.9 438.9
Pro 6000 96 1792 600 503.8 503.8

--【拾壹】--:

魔改风险高,绕路绕路


--【拾贰】--:

5060ti 16G 大概能跑哪些级别的量化模型啊?会不会算力不够运算比较慢


--【拾叁】--:

40系就馋它的 fp8 支持,用上 torchao 的 convert_to_float8_training 能省下不少显存

哪天要换掉我的 3080 20G,就买块 4080 32G 吧。但这东西好贵目前……


--【拾肆】--:

5070 5070ti怎么样,最近要购买一张显卡来跑AI服务,昨天在vast ai上租了一个5070体验了下,感觉不怎么快,也可能是我选择的模型和参数配置过高了


--【拾伍】--:

14B短上下文应该可以
但是速度可能是比较慢,比较60系列cuda核心不多


--【拾陆】--:

没有 4060 ti 么?感觉这才是消费级显卡


--【拾柒】--:

佬友觉得A100和L40怎么样


--【拾捌】--:

刚刚加了,是正规卡(优点)
但是打不过2080ti魔改卡(缺点)


--【拾玖】--:

其实可以总结一下FP32、FP16、BF16、FP8、INT8、INT4之类的各个精度的算力,我当时看着7900XTX性能貌似挺强选的,但是不支持FP8,在ComfyUI拉完了

问题描述:

背景

论坛里面好像玩这些的人还挺多的,但是缺少统一总结的帖子;恰好我买过2080ti22g,3080 20g,4090d48g。于是来总结一下,希望能对佬友们有帮助


佬们,4080S 32G 这张卡值得买吗 - 搞七捻三 / 搞七捻三, Lv1 - LINUX DO
618有没有跑ai的显卡推荐? - 开发调优 - LINUX DO
课题组采购服务器配置单 - 搞七捻三 / 搞七捻三, Lv1 - LINUX DO


正文,显卡价格汇总,从高到低排序

价格为12.27采集,可能有变动

选取的基本上是大显存(至少16g),或者足够便宜(比如3060 12g,因为70的12g感觉性价比不高)

工作站卡系列

RTX PRO 6000

96G显存

性能上是比5090强10%,但是价格上比5090贵三倍,显存也大三倍

除非特别有钱,一般个人很难考虑了()

闲鱼价格在5.4-5.8万,淘宝在6万出头(2026.1.30已涨价,全部6w起步)

BlackWell架构,部分老的ai软件兼容不太好

image605×807 36.8 KB

RTX PRO 5000

有两种显存版本

48G的2.9w,72g的5.9w

比较贵,如果有这个钱 感觉不如加钱买pro6000

image1036×720 27.2 KB

游戏卡/工作站卡系列

RTX 5090(D)

32G显存

D好像性能差不多,一些up测不出来,Dv2显存和位宽砍太多不推荐

闲鱼在1.8-2万,淘宝在2.1-2.4万;如果是涡轮卡一般都得2.2-2.3万

BlackWell架构,部分老的ai软件兼容不太好

image335×738 17.3 KB

RTX4090(D)

24g/48g(推荐买48g的魔改版)

带D与不带D差价好像在2k左右,非D的版本功耗多25w,核心数量多一点

24g的一般D 1.7w,非D2w

48g的现在带D2.2-2.3w,非D的2.3-2.4w

image790×473 18 KB

RTX 4080

16G/32G

32g的现在闲鱼一般9k,淘宝一般1w出头

40系比30系省电,同时支持bf16,而且40系没有矿好像(30系有矿的风险)

image807×531 19.9 KB

5070ti

16G显存

PDD在6.2-6.5k,优点是正规卡

image152×678 6.45 KB

5060ti 16g

PDD在3.1-3.5k,优点是正规卡

image143×655 6.35 KB

4070ti super

16G显存

PDD在4.8-5k,优点是正规卡

image115×691 6.23 KB

4060ti 16g

淘宝在2.8-3k,优点是正规卡(感觉和5060ti差不多价格就不如买50了)

闲鱼2.5-2.7k,二手卡

image130×684 6.46 KB

RTX 3090

24G

老牌显卡,最后一代支持nvlink的了,但是听说发热比较大

image911×341 14.1 KB

闲鱼一般6k多

RTX 3080

10G/20G

性价比很高,闲鱼20g版一般2.7-3k

比起20系 支持bf16(很多现代llm需要bf16来加速)

比起50,40系,是80和90 cuda核心数量最接近的一次

image937×392 15.8 KB

3060 12G

12G算是部分够用吧,就是3060比较慢

闲鱼在1.3-1.4k

image789×270 12.6 KB

RTX 2080ti

11G/22G

1.7-1.8k 比较便宜,比4060ti跑ai和游戏都效果更好(当然,还是二手那些风险)

不支持bf16

image345×501 10.6 KB

服务器卡

A100

40G/80G

40G好像价格在2.7w,80G价格在4-5w多

服务器卡没有风扇,可能要自己改装散热才能用

一般都是别人无尘机房在吹风

image543×585 27.1 KB

V100

16G闲鱼400-500

32G闲鱼1.8-2k

不支持bf16,其他方面16G的性价比很高,b站很多组4卡8卡v100的

image721×759 40 KB


其他小问题

我对魔改卡的态度

可能大部分人听到魔改卡就很担心水深,认为可能比矿卡还危险。
但是我感觉,只要选好一些咸鱼或者淘宝销量比较高的商家(一般有1-3年质保),问题应该没那么大。因为魔改卡很多都是卖给小企业的,企业对稳定性的容忍可能比个人要高,跑满载的时间也比个人长,如果一个商家可以卖销量比较高,而没有很多差评,那么可以大概率认为这些卡是稳定的

我自己目前三张显卡,2080ti是PDD买的,3080,4090D是闲鱼买的,这些店目前还在,我的卡现在也还没坏,都是跑过ai,也打过游戏

闲鱼和淘宝的区别

淘宝可能更不容易跑路,但是可能跟闲鱼都是有厂家在做的,闲鱼可能手续费低,所以卖的比淘宝一般便宜10%

涡轮卡or风扇卡?

涡轮卡不跑东西的时候噪音还好,打游戏也还好

但是一旦开始训练,在房间里会非常吵,不过关了门在门口其实也听不到()

涡轮卡适合在服务器主板插很多张,游戏的风扇卡则做不到

网友解答:
--【壹】--:

5070ti 有super我好像没看到
今天摸鱼了一天,本来计划在租5070ti和4090试试,等星期一在看看,公司有需求 牛马只能慢慢测哪个效果好咯
看以前佬友的帖子,他用3090ti跑的FaceFunsion


--【贰】--:

不好意思 我记错了
4070才有tisuper
5070只有ti


--【叁】--:

好像这种算力nvidia没有直接公布在官网,需要自己测来着


--【肆】--:

哈哈,因为3060 12g便宜()
5070 12g相对没那么便宜,4070,那些也是


--【伍】--:

Nvidia 介绍新架构的 pdf 会顺带给出显卡数值。忘记录链接了,要去搜一下


--【陆】--:

这种工作站显卡没有风扇的,你可能需要拿些额外的散热来搞,感觉如果不熟悉的话可能有点麻烦


--【柒】--: xy3:

3060 12G

5070也12G()


--【捌】--:

嗯,本来8.6-8,8k的,最近涨价到了9.5k-10k


--【玖】--:

如果是买官方的卡,我个人建议是16GB起步
比如5070ti


--【拾】--:

以前通过官方文档总结的一些理论数值。

显存(GB) 显存速度(GB/sec) 功耗(W) FP16 / BF16 累计 FP32(TFLOPS) FP16 / BF16(TFLOPS)
3080 10 760 320 59.5 119.1
3090 24 936 350 71.2 142.3
A6000 48 936 300 154.8 154.8
4090 24 1008 450 165.2 330.3
6000 Ada 48 1008 300 364 364
5090 32 1792 575 209.5 419
Pro 6000 Max-Q 96 1792 300 438.9 438.9
Pro 6000 96 1792 600 503.8 503.8

--【拾壹】--:

魔改风险高,绕路绕路


--【拾贰】--:

5060ti 16G 大概能跑哪些级别的量化模型啊?会不会算力不够运算比较慢


--【拾叁】--:

40系就馋它的 fp8 支持,用上 torchao 的 convert_to_float8_training 能省下不少显存

哪天要换掉我的 3080 20G,就买块 4080 32G 吧。但这东西好贵目前……


--【拾肆】--:

5070 5070ti怎么样,最近要购买一张显卡来跑AI服务,昨天在vast ai上租了一个5070体验了下,感觉不怎么快,也可能是我选择的模型和参数配置过高了


--【拾伍】--:

14B短上下文应该可以
但是速度可能是比较慢,比较60系列cuda核心不多


--【拾陆】--:

没有 4060 ti 么?感觉这才是消费级显卡


--【拾柒】--:

佬友觉得A100和L40怎么样


--【拾捌】--:

刚刚加了,是正规卡(优点)
但是打不过2080ti魔改卡(缺点)


--【拾玖】--:

其实可以总结一下FP32、FP16、BF16、FP8、INT8、INT4之类的各个精度的算力,我当时看着7900XTX性能貌似挺强选的,但是不支持FP8,在ComfyUI拉完了