一键部署 Qwen3.5-35B 无审查版 —— NexGPU 实战教程

2026-04-11 15:011阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

一键部署 Qwen3.5-35B 无审查版 —— NexGPU 实战教程

TL;DR:通过 NexGPU 平台,选择预制模板,10 分钟即可完成 Qwen3.5 Aggressive 无审查版的部署,全程无需手动配置环境。


**

继续选择在L站内测,各位佬通过我们的连接注册可以获得 3USD 的账户余额 足够开几个测试机器玩玩的。

**

前言

最近刷论坛发现有佬发了 Qwen3.5 的部署教程,但还是有很多小白上手费劲,或者自己的机器配置不够无法体验。恰好公司最近上线了 GPU 算力服务器租赁服务,我就让同事直接做好了 Qwen3.5 Aggressive 激进无审查版 的一键部署模板,在此写个简单的部署过程。


部署步骤

第一步:进入 NexGPU 官网

访问 https://nexgpu.net/zh/register/?ref=D03EE912,进入「创建实例」栏目。

创建实例入口3605×1749 430 KB

第二步:选择部署模板

选择 「QWEN3.5-35B 去审查版自适应」 模板。

该模板会根据后续选择的实例 GPU 显存,自动选择部署的模型版本及是否开启视觉能力,具体适配规则如下:

| 硬件条件 | 量化精度 | 上下文长度 | 并发 | NGL | 视觉 |

| :— | :—: | :—: | :—: | :—: | :—: |

| 单卡 ≥ 120 GB | Q8_0 | 131072 | 2 | 99 | 开启 |

| 单卡 ≥ 70 GB | Q6_K | 131072 | 2 | 99 | 开启 |

| 4 卡以上,每卡 ≥ 30 GB | Q8_0 | 131072 | 2 | 99 | 开启 |

| 2 卡以上,每卡 ≥ 24 GB | Q6_K | 65536 | 2 | 99 | 开启 |

| 单卡 ≥ 24 GB | Q5_K_M | 65536 | 1 | 99 | 开启 |

| 单卡 ≥ 19 GB | Q4_K_M | 32768 | 1 | 99 | 关闭 |

| 单卡 ≥ 17 GB | IQ4_XS | 24576 | 1 | 99 | 关闭 |

| 单卡 ≥ 15 GB | Q3_K_M | 16384 | 1 | 60 | 关闭 |

| 其他(< 15 GB) | IQ2_M | 8192 | 1 | 40 | 关闭 |

第三步:选择实例并创建

选择模板后,挑选符合条件的实例。这里为了演示顺畅,直接选择了 H200 7000Mbps 带宽的实例。

关于 NexGPU

我们与全世界多家 GPU 算力服务商合作,整合多家资源,为用户预装简单易用的模板,实现物美价廉的 GPU 算力租赁。从 GTX 1060 到 H200 这样的顶级 GPU,我们的实例都有覆盖,且最低按小时计费(量大或包月有折扣)。

23500×1740 390 KB

选择实例后,点击「下一步」确认配置。

确认配置2334×1556 145 KB

第四步:等待实例就绪

等待大约 10 分钟,实例会完全创建完毕。

如果选择的实例带宽较小、配置较低,这个过程可能需要 20 分钟左右。

实例创建中2552×1429 183 KB

第五步:SSH 连接实例

实例创建完毕后,创建 SSH Key,通过 Key 连接实例。

创建 SSH Key1142×979 43 KB

通过 SSH 连接成功后,可以看到 LLaMA 的 API 地址以及 UI 界面。

连接成功2438×1496 65.3 KB


效果测试

测试一:代码生成能力

让去审查的 Qwen3.5 写一个勒索木马的 DEMO 试试:

代码生成测试2064×1860 205 KB

完全没有拒绝,丝滑流畅地给出了一个 demo。

测试二:内容生成能力

来都来了,肯定要测试一下更多场景……

内容生成测试1362×1214 224 KB


总结

测试完毕,去审查模型确实刺激——毫无道德底线和限制可言,基本不会拒绝任何类型的请求。

请各位佬测试中注意安全,以及所在地法律合规要求

PS:目前是我们封测阶段,希望各位佬发现问题及时私信我,有账户余额赠送。如果遇到开出来的机器失控 或者装机失败,等情况,删机前保留截图发我

网友解答:
--【壹】--:

问下各位佬,这个和grok4.2相比如何?既然现在有grok4.2,感觉部署这个是不是多余了?


--【贰】--:

感谢,试一试


--【叁】--:

Error response from daemon: failed to create task for container: failed to create shim task: OCI runtime create failed: could not apply required modification to OCI specification: error modifying OCI spec: failed to inject CDI devices: unresolvable CDI devices D.7843b5f7912f9f21682d677d1b9cb3fddbf41d4df34f329370ae85f598b20866/gpu=1: unknown Error: failed to start containers: C.33078301

好像有问题哦


--【肆】--:

创建了一个 ssh 连接一直超时不知道为什么


--【伍】--:

感谢佬


--【陆】--:

大模型不加载
image1150×646 29.8 KB


--【柒】--:

image1040×202 29.8 KB


--【捌】--:

换个配置高点的老板


--【玖】--:

你直接删掉重开


--【拾】--:

账户私聊发我老板


--【拾壹】--:

image1606×781 48.2 KB


--【拾贰】--:

太牛了佬,收藏一下


--【拾叁】--:

等了一会儿就能连上了,我体验下先


--【拾肆】--:

H200 666啊


--【拾伍】--:

支持,但是说实话没有法律风险吗


--【拾陆】--:

哟西 价格公道可以常驻了


--【拾柒】--:

image1218×814 51.7 KB


--【拾捌】--:

这么强!


--【拾玖】--:

联系我们TG看一下 如果不方便直接删机重开

标签:高级推广
问题描述:

一键部署 Qwen3.5-35B 无审查版 —— NexGPU 实战教程

TL;DR:通过 NexGPU 平台,选择预制模板,10 分钟即可完成 Qwen3.5 Aggressive 无审查版的部署,全程无需手动配置环境。


**

继续选择在L站内测,各位佬通过我们的连接注册可以获得 3USD 的账户余额 足够开几个测试机器玩玩的。

**

前言

最近刷论坛发现有佬发了 Qwen3.5 的部署教程,但还是有很多小白上手费劲,或者自己的机器配置不够无法体验。恰好公司最近上线了 GPU 算力服务器租赁服务,我就让同事直接做好了 Qwen3.5 Aggressive 激进无审查版 的一键部署模板,在此写个简单的部署过程。


部署步骤

第一步:进入 NexGPU 官网

访问 https://nexgpu.net/zh/register/?ref=D03EE912,进入「创建实例」栏目。

创建实例入口3605×1749 430 KB

第二步:选择部署模板

选择 「QWEN3.5-35B 去审查版自适应」 模板。

该模板会根据后续选择的实例 GPU 显存,自动选择部署的模型版本及是否开启视觉能力,具体适配规则如下:

| 硬件条件 | 量化精度 | 上下文长度 | 并发 | NGL | 视觉 |

| :— | :—: | :—: | :—: | :—: | :—: |

| 单卡 ≥ 120 GB | Q8_0 | 131072 | 2 | 99 | 开启 |

| 单卡 ≥ 70 GB | Q6_K | 131072 | 2 | 99 | 开启 |

| 4 卡以上,每卡 ≥ 30 GB | Q8_0 | 131072 | 2 | 99 | 开启 |

| 2 卡以上,每卡 ≥ 24 GB | Q6_K | 65536 | 2 | 99 | 开启 |

| 单卡 ≥ 24 GB | Q5_K_M | 65536 | 1 | 99 | 开启 |

| 单卡 ≥ 19 GB | Q4_K_M | 32768 | 1 | 99 | 关闭 |

| 单卡 ≥ 17 GB | IQ4_XS | 24576 | 1 | 99 | 关闭 |

| 单卡 ≥ 15 GB | Q3_K_M | 16384 | 1 | 60 | 关闭 |

| 其他(< 15 GB) | IQ2_M | 8192 | 1 | 40 | 关闭 |

第三步:选择实例并创建

选择模板后,挑选符合条件的实例。这里为了演示顺畅,直接选择了 H200 7000Mbps 带宽的实例。

关于 NexGPU

我们与全世界多家 GPU 算力服务商合作,整合多家资源,为用户预装简单易用的模板,实现物美价廉的 GPU 算力租赁。从 GTX 1060 到 H200 这样的顶级 GPU,我们的实例都有覆盖,且最低按小时计费(量大或包月有折扣)。

23500×1740 390 KB

选择实例后,点击「下一步」确认配置。

确认配置2334×1556 145 KB

第四步:等待实例就绪

等待大约 10 分钟,实例会完全创建完毕。

如果选择的实例带宽较小、配置较低,这个过程可能需要 20 分钟左右。

实例创建中2552×1429 183 KB

第五步:SSH 连接实例

实例创建完毕后,创建 SSH Key,通过 Key 连接实例。

创建 SSH Key1142×979 43 KB

通过 SSH 连接成功后,可以看到 LLaMA 的 API 地址以及 UI 界面。

连接成功2438×1496 65.3 KB


效果测试

测试一:代码生成能力

让去审查的 Qwen3.5 写一个勒索木马的 DEMO 试试:

代码生成测试2064×1860 205 KB

完全没有拒绝,丝滑流畅地给出了一个 demo。

测试二:内容生成能力

来都来了,肯定要测试一下更多场景……

内容生成测试1362×1214 224 KB


总结

测试完毕,去审查模型确实刺激——毫无道德底线和限制可言,基本不会拒绝任何类型的请求。

请各位佬测试中注意安全,以及所在地法律合规要求

PS:目前是我们封测阶段,希望各位佬发现问题及时私信我,有账户余额赠送。如果遇到开出来的机器失控 或者装机失败,等情况,删机前保留截图发我

网友解答:
--【壹】--:

问下各位佬,这个和grok4.2相比如何?既然现在有grok4.2,感觉部署这个是不是多余了?


--【贰】--:

感谢,试一试


--【叁】--:

Error response from daemon: failed to create task for container: failed to create shim task: OCI runtime create failed: could not apply required modification to OCI specification: error modifying OCI spec: failed to inject CDI devices: unresolvable CDI devices D.7843b5f7912f9f21682d677d1b9cb3fddbf41d4df34f329370ae85f598b20866/gpu=1: unknown Error: failed to start containers: C.33078301

好像有问题哦


--【肆】--:

创建了一个 ssh 连接一直超时不知道为什么


--【伍】--:

感谢佬


--【陆】--:

大模型不加载
image1150×646 29.8 KB


--【柒】--:

image1040×202 29.8 KB


--【捌】--:

换个配置高点的老板


--【玖】--:

你直接删掉重开


--【拾】--:

账户私聊发我老板


--【拾壹】--:

image1606×781 48.2 KB


--【拾贰】--:

太牛了佬,收藏一下


--【拾叁】--:

等了一会儿就能连上了,我体验下先


--【拾肆】--:

H200 666啊


--【拾伍】--:

支持,但是说实话没有法律风险吗


--【拾陆】--:

哟西 价格公道可以常驻了


--【拾柒】--:

image1218×814 51.7 KB


--【拾捌】--:

这么强!


--【拾玖】--:

联系我们TG看一下 如果不方便直接删机重开

标签:高级推广