适合个人跑AI的Nvidia显卡汇总(含魔改卡)
- 内容介绍
- 文章标签
- 相关推荐
背景
论坛里面好像玩这些的人还挺多的,但是缺少统一总结的帖子;恰好我买过2080ti22g,3080 20g,4090d48g。于是来总结一下,希望能对佬友们有帮助
佬们,4080S 32G 这张卡值得买吗 - 搞七捻三 / 搞七捻三, Lv1 - LINUX DO
618有没有跑ai的显卡推荐? - 开发调优 - LINUX DO
课题组采购服务器配置单 - 搞七捻三 / 搞七捻三, Lv1 - LINUX DO
正文,显卡价格汇总,从高到低排序
价格为12.27采集,可能有变动
选取的基本上是大显存(至少16g),或者足够便宜(比如3060 12g,因为70的12g感觉性价比不高)
工作站卡系列
RTX PRO 6000
96G显存
性能上是比5090强10%,但是价格上比5090贵三倍,显存也大三倍
除非特别有钱,一般个人很难考虑了()
闲鱼价格在5.4-5.8万,淘宝在6万出头(2026.1.30已涨价,全部6w起步)
BlackWell架构,部分老的ai软件兼容不太好
image605×807 36.8 KB
RTX PRO 5000
有两种显存版本
48G的2.9w,72g的5.9w
比较贵,如果有这个钱 感觉不如加钱买pro6000
image1036×720 27.2 KB
游戏卡/工作站卡系列
RTX 5090(D)
32G显存
D好像性能差不多,一些up测不出来,Dv2显存和位宽砍太多不推荐
闲鱼在1.8-2万,淘宝在2.1-2.4万;如果是涡轮卡一般都得2.2-2.3万
BlackWell架构,部分老的ai软件兼容不太好
image335×738 17.3 KB
RTX4090(D)
24g/48g(推荐买48g的魔改版)
带D与不带D差价好像在2k左右,非D的版本功耗多25w,核心数量多一点
24g的一般D 1.7w,非D2w
48g的现在带D2.2-2.3w,非D的2.3-2.4w
image790×473 18 KB
RTX 4080
16G/32G
32g的现在闲鱼一般9k,淘宝一般1w出头
40系比30系省电,同时支持bf16,而且40系没有矿好像(30系有矿的风险)
image807×531 19.9 KB
5070ti
16G显存
PDD在6.2-6.5k,优点是正规卡
image152×678 6.45 KB
5060ti 16g
PDD在3.1-3.5k,优点是正规卡
image143×655 6.35 KB
4070ti super
16G显存
PDD在4.8-5k,优点是正规卡
image115×691 6.23 KB
4060ti 16g
淘宝在2.8-3k,优点是正规卡(感觉和5060ti差不多价格就不如买50了)
闲鱼2.5-2.7k,二手卡
image130×684 6.46 KB
RTX 3090
24G
老牌显卡,最后一代支持nvlink的了,但是听说发热比较大
image911×341 14.1 KB
闲鱼一般6k多
RTX 3080
10G/20G
性价比很高,闲鱼20g版一般2.7-3k
比起20系 支持bf16(很多现代llm需要bf16来加速)
比起50,40系,是80和90 cuda核心数量最接近的一次
image937×392 15.8 KB
3060 12G
12G算是部分够用吧,就是3060比较慢
闲鱼在1.3-1.4k
image789×270 12.6 KB
RTX 2080ti
11G/22G
1.7-1.8k 比较便宜,比4060ti跑ai和游戏都效果更好(当然,还是二手那些风险)
不支持bf16
image345×501 10.6 KB
服务器卡
A100
40G/80G
40G好像价格在2.7w,80G价格在4-5w多
服务器卡没有风扇,可能要自己改装散热才能用
一般都是别人无尘机房在吹风
image543×585 27.1 KB
V100
16G闲鱼400-500
32G闲鱼1.8-2k
不支持bf16,其他方面16G的性价比很高,b站很多组4卡8卡v100的
image721×759 40 KB
其他小问题
我对魔改卡的态度
可能大部分人听到魔改卡就很担心水深,认为可能比矿卡还危险。
但是我感觉,只要选好一些咸鱼或者淘宝销量比较高的商家(一般有1-3年质保),问题应该没那么大。因为魔改卡很多都是卖给小企业的,企业对稳定性的容忍可能比个人要高,跑满载的时间也比个人长,如果一个商家可以卖销量比较高,而没有很多差评,那么可以大概率认为这些卡是稳定的
我自己目前三张显卡,2080ti是PDD买的,3080,4090D是闲鱼买的,这些店目前还在,我的卡现在也还没坏,都是跑过ai,也打过游戏
闲鱼和淘宝的区别
淘宝可能更不容易跑路,但是可能跟闲鱼都是有厂家在做的,闲鱼可能手续费低,所以卖的比淘宝一般便宜10%
涡轮卡or风扇卡?
涡轮卡不跑东西的时候噪音还好,打游戏也还好
但是一旦开始训练,在房间里会非常吵,不过关了门在门口其实也听不到()
涡轮卡适合在服务器主板插很多张,游戏的风扇卡则做不到
网友解答:--【壹】--:
5070ti 有super我好像没看到
今天摸鱼了一天,本来计划在租5070ti和4090试试,等星期一在看看,公司有需求 牛马只能慢慢测哪个效果好咯
看以前佬友的帖子,他用3090ti跑的FaceFunsion
--【贰】--:
不好意思 我记错了
4070才有tisuper
5070只有ti
--【叁】--:
好像这种算力nvidia没有直接公布在官网,需要自己测来着
--【肆】--:
哈哈,因为3060 12g便宜()
5070 12g相对没那么便宜,4070,那些也是
--【伍】--:
Nvidia 介绍新架构的 pdf 会顺带给出显卡数值。忘记录链接了,要去搜一下
--【陆】--:
这种工作站显卡没有风扇的,你可能需要拿些额外的散热来搞,感觉如果不熟悉的话可能有点麻烦
--【柒】--: xy3:
3060 12G
5070也12G()
--【捌】--:
嗯,本来8.6-8,8k的,最近涨价到了9.5k-10k
--【玖】--:
如果是买官方的卡,我个人建议是16GB起步
比如5070ti
--【拾】--:
以前通过官方文档总结的一些理论数值。
| 显存(GB) | 显存速度(GB/sec) | 功耗(W) | FP16 / BF16 累计 FP32(TFLOPS) | FP16 / BF16(TFLOPS) | |
|---|---|---|---|---|---|
| 3080 | 10 | 760 | 320 | 59.5 | 119.1 |
| 3090 | 24 | 936 | 350 | 71.2 | 142.3 |
| A6000 | 48 | 936 | 300 | 154.8 | 154.8 |
| 4090 | 24 | 1008 | 450 | 165.2 | 330.3 |
| 6000 Ada | 48 | 1008 | 300 | 364 | 364 |
| 5090 | 32 | 1792 | 575 | 209.5 | 419 |
| Pro 6000 Max-Q | 96 | 1792 | 300 | 438.9 | 438.9 |
| Pro 6000 | 96 | 1792 | 600 | 503.8 | 503.8 |
--【拾壹】--:
魔改风险高,绕路绕路
--【拾贰】--:
5060ti 16G 大概能跑哪些级别的量化模型啊?会不会算力不够运算比较慢
--【拾叁】--:
40系就馋它的 fp8 支持,用上 torchao 的 convert_to_float8_training 能省下不少显存
哪天要换掉我的 3080 20G,就买块 4080 32G 吧。但这东西好贵目前……
--【拾肆】--:
5070 5070ti怎么样,最近要购买一张显卡来跑AI服务,昨天在vast ai上租了一个5070体验了下,感觉不怎么快,也可能是我选择的模型和参数配置过高了
--【拾伍】--:
14B短上下文应该可以
但是速度可能是比较慢,比较60系列cuda核心不多
--【拾陆】--:
没有 4060 ti 么?感觉这才是消费级显卡
--【拾柒】--:
佬友觉得A100和L40怎么样
--【拾捌】--:
刚刚加了,是正规卡(优点)
但是打不过2080ti魔改卡(缺点)
--【拾玖】--:
其实可以总结一下FP32、FP16、BF16、FP8、INT8、INT4之类的各个精度的算力,我当时看着7900XTX性能貌似挺强选的,但是不支持FP8,在ComfyUI拉完了
背景
论坛里面好像玩这些的人还挺多的,但是缺少统一总结的帖子;恰好我买过2080ti22g,3080 20g,4090d48g。于是来总结一下,希望能对佬友们有帮助
佬们,4080S 32G 这张卡值得买吗 - 搞七捻三 / 搞七捻三, Lv1 - LINUX DO
618有没有跑ai的显卡推荐? - 开发调优 - LINUX DO
课题组采购服务器配置单 - 搞七捻三 / 搞七捻三, Lv1 - LINUX DO
正文,显卡价格汇总,从高到低排序
价格为12.27采集,可能有变动
选取的基本上是大显存(至少16g),或者足够便宜(比如3060 12g,因为70的12g感觉性价比不高)
工作站卡系列
RTX PRO 6000
96G显存
性能上是比5090强10%,但是价格上比5090贵三倍,显存也大三倍
除非特别有钱,一般个人很难考虑了()
闲鱼价格在5.4-5.8万,淘宝在6万出头(2026.1.30已涨价,全部6w起步)
BlackWell架构,部分老的ai软件兼容不太好
image605×807 36.8 KB
RTX PRO 5000
有两种显存版本
48G的2.9w,72g的5.9w
比较贵,如果有这个钱 感觉不如加钱买pro6000
image1036×720 27.2 KB
游戏卡/工作站卡系列
RTX 5090(D)
32G显存
D好像性能差不多,一些up测不出来,Dv2显存和位宽砍太多不推荐
闲鱼在1.8-2万,淘宝在2.1-2.4万;如果是涡轮卡一般都得2.2-2.3万
BlackWell架构,部分老的ai软件兼容不太好
image335×738 17.3 KB
RTX4090(D)
24g/48g(推荐买48g的魔改版)
带D与不带D差价好像在2k左右,非D的版本功耗多25w,核心数量多一点
24g的一般D 1.7w,非D2w
48g的现在带D2.2-2.3w,非D的2.3-2.4w
image790×473 18 KB
RTX 4080
16G/32G
32g的现在闲鱼一般9k,淘宝一般1w出头
40系比30系省电,同时支持bf16,而且40系没有矿好像(30系有矿的风险)
image807×531 19.9 KB
5070ti
16G显存
PDD在6.2-6.5k,优点是正规卡
image152×678 6.45 KB
5060ti 16g
PDD在3.1-3.5k,优点是正规卡
image143×655 6.35 KB
4070ti super
16G显存
PDD在4.8-5k,优点是正规卡
image115×691 6.23 KB
4060ti 16g
淘宝在2.8-3k,优点是正规卡(感觉和5060ti差不多价格就不如买50了)
闲鱼2.5-2.7k,二手卡
image130×684 6.46 KB
RTX 3090
24G
老牌显卡,最后一代支持nvlink的了,但是听说发热比较大
image911×341 14.1 KB
闲鱼一般6k多
RTX 3080
10G/20G
性价比很高,闲鱼20g版一般2.7-3k
比起20系 支持bf16(很多现代llm需要bf16来加速)
比起50,40系,是80和90 cuda核心数量最接近的一次
image937×392 15.8 KB
3060 12G
12G算是部分够用吧,就是3060比较慢
闲鱼在1.3-1.4k
image789×270 12.6 KB
RTX 2080ti
11G/22G
1.7-1.8k 比较便宜,比4060ti跑ai和游戏都效果更好(当然,还是二手那些风险)
不支持bf16
image345×501 10.6 KB
服务器卡
A100
40G/80G
40G好像价格在2.7w,80G价格在4-5w多
服务器卡没有风扇,可能要自己改装散热才能用
一般都是别人无尘机房在吹风
image543×585 27.1 KB
V100
16G闲鱼400-500
32G闲鱼1.8-2k
不支持bf16,其他方面16G的性价比很高,b站很多组4卡8卡v100的
image721×759 40 KB
其他小问题
我对魔改卡的态度
可能大部分人听到魔改卡就很担心水深,认为可能比矿卡还危险。
但是我感觉,只要选好一些咸鱼或者淘宝销量比较高的商家(一般有1-3年质保),问题应该没那么大。因为魔改卡很多都是卖给小企业的,企业对稳定性的容忍可能比个人要高,跑满载的时间也比个人长,如果一个商家可以卖销量比较高,而没有很多差评,那么可以大概率认为这些卡是稳定的
我自己目前三张显卡,2080ti是PDD买的,3080,4090D是闲鱼买的,这些店目前还在,我的卡现在也还没坏,都是跑过ai,也打过游戏
闲鱼和淘宝的区别
淘宝可能更不容易跑路,但是可能跟闲鱼都是有厂家在做的,闲鱼可能手续费低,所以卖的比淘宝一般便宜10%
涡轮卡or风扇卡?
涡轮卡不跑东西的时候噪音还好,打游戏也还好
但是一旦开始训练,在房间里会非常吵,不过关了门在门口其实也听不到()
涡轮卡适合在服务器主板插很多张,游戏的风扇卡则做不到
网友解答:--【壹】--:
5070ti 有super我好像没看到
今天摸鱼了一天,本来计划在租5070ti和4090试试,等星期一在看看,公司有需求 牛马只能慢慢测哪个效果好咯
看以前佬友的帖子,他用3090ti跑的FaceFunsion
--【贰】--:
不好意思 我记错了
4070才有tisuper
5070只有ti
--【叁】--:
好像这种算力nvidia没有直接公布在官网,需要自己测来着
--【肆】--:
哈哈,因为3060 12g便宜()
5070 12g相对没那么便宜,4070,那些也是
--【伍】--:
Nvidia 介绍新架构的 pdf 会顺带给出显卡数值。忘记录链接了,要去搜一下
--【陆】--:
这种工作站显卡没有风扇的,你可能需要拿些额外的散热来搞,感觉如果不熟悉的话可能有点麻烦
--【柒】--: xy3:
3060 12G
5070也12G()
--【捌】--:
嗯,本来8.6-8,8k的,最近涨价到了9.5k-10k
--【玖】--:
如果是买官方的卡,我个人建议是16GB起步
比如5070ti
--【拾】--:
以前通过官方文档总结的一些理论数值。
| 显存(GB) | 显存速度(GB/sec) | 功耗(W) | FP16 / BF16 累计 FP32(TFLOPS) | FP16 / BF16(TFLOPS) | |
|---|---|---|---|---|---|
| 3080 | 10 | 760 | 320 | 59.5 | 119.1 |
| 3090 | 24 | 936 | 350 | 71.2 | 142.3 |
| A6000 | 48 | 936 | 300 | 154.8 | 154.8 |
| 4090 | 24 | 1008 | 450 | 165.2 | 330.3 |
| 6000 Ada | 48 | 1008 | 300 | 364 | 364 |
| 5090 | 32 | 1792 | 575 | 209.5 | 419 |
| Pro 6000 Max-Q | 96 | 1792 | 300 | 438.9 | 438.9 |
| Pro 6000 | 96 | 1792 | 600 | 503.8 | 503.8 |
--【拾壹】--:
魔改风险高,绕路绕路
--【拾贰】--:
5060ti 16G 大概能跑哪些级别的量化模型啊?会不会算力不够运算比较慢
--【拾叁】--:
40系就馋它的 fp8 支持,用上 torchao 的 convert_to_float8_training 能省下不少显存
哪天要换掉我的 3080 20G,就买块 4080 32G 吧。但这东西好贵目前……
--【拾肆】--:
5070 5070ti怎么样,最近要购买一张显卡来跑AI服务,昨天在vast ai上租了一个5070体验了下,感觉不怎么快,也可能是我选择的模型和参数配置过高了
--【拾伍】--:
14B短上下文应该可以
但是速度可能是比较慢,比较60系列cuda核心不多
--【拾陆】--:
没有 4060 ti 么?感觉这才是消费级显卡
--【拾柒】--:
佬友觉得A100和L40怎么样
--【拾捌】--:
刚刚加了,是正规卡(优点)
但是打不过2080ti魔改卡(缺点)
--【拾玖】--:
其实可以总结一下FP32、FP16、BF16、FP8、INT8、INT4之类的各个精度的算力,我当时看着7900XTX性能貌似挺强选的,但是不支持FP8,在ComfyUI拉完了

