一键部署 Qwen3.5-35B 无审查版 —— NexGPU 实战教程

2026-04-11 15:011阅读0评论SEO教程

内容介绍
文章标签
相关推荐

问题描述：

一键部署 Qwen3.5-35B 无审查版 —— NexGPU 实战教程

TL;DR：通过 NexGPU 平台，选择预制模板，10 分钟即可完成 Qwen3.5 Aggressive 无审查版的部署，全程无需手动配置环境。

继续选择在L站内测，各位佬通过我们的连接注册可以获得 3USD 的账户余额足够开几个测试机器玩玩的。

前言

最近刷论坛发现有佬发了 Qwen3.5 的部署教程，但还是有很多小白上手费劲，或者自己的机器配置不够无法体验。恰好公司最近上线了 GPU 算力服务器租赁服务，我就让同事直接做好了 Qwen3.5 Aggressive 激进无审查版 的一键部署模板，在此写个简单的部署过程。

部署步骤

第一步：进入 NexGPU 官网

访问 https://nexgpu.net/zh/register/?ref=D03EE912，进入「创建实例」栏目。

创建实例入口3605×1749 430 KB

第二步：选择部署模板

选择 「QWEN3.5-35B 去审查版自适应」 模板。

该模板会根据后续选择的实例 GPU 显存，自动选择部署的模型版本及是否开启视觉能力，具体适配规则如下：

| 硬件条件 | 量化精度 | 上下文长度 | 并发 | NGL | 视觉 |

| :— | :—: | :—: | :—: | :—: | :—: |

| 单卡 ≥ 120 GB | Q8_0 | 131072 | 2 | 99 | 开启 |

| 单卡 ≥ 70 GB | Q6_K | 131072 | 2 | 99 | 开启 |

| 4 卡以上，每卡 ≥ 30 GB | Q8_0 | 131072 | 2 | 99 | 开启 |

| 2 卡以上，每卡 ≥ 24 GB | Q6_K | 65536 | 2 | 99 | 开启 |

| 单卡 ≥ 24 GB | Q5_K_M | 65536 | 1 | 99 | 开启 |

| 单卡 ≥ 19 GB | Q4_K_M | 32768 | 1 | 99 | 关闭 |

| 单卡 ≥ 17 GB | IQ4_XS | 24576 | 1 | 99 | 关闭 |

| 单卡 ≥ 15 GB | Q3_K_M | 16384 | 1 | 60 | 关闭 |

| 其他（< 15 GB） | IQ2_M | 8192 | 1 | 40 | 关闭 |

第三步：选择实例并创建

选择模板后，挑选符合条件的实例。这里为了演示顺畅，直接选择了 H200 7000Mbps 带宽的实例。

关于 NexGPU

我们与全世界多家 GPU 算力服务商合作，整合多家资源，为用户预装简单易用的模板，实现物美价廉的 GPU 算力租赁。从 GTX 1060 到 H200 这样的顶级 GPU，我们的实例都有覆盖，且最低按小时计费(量大或包月有折扣)。

23500×1740 390 KB

选择实例后，点击「下一步」确认配置。

确认配置2334×1556 145 KB

第四步：等待实例就绪

等待大约 10 分钟，实例会完全创建完毕。

如果选择的实例带宽较小、配置较低，这个过程可能需要 20 分钟左右。

实例创建中2552×1429 183 KB

第五步：SSH 连接实例

实例创建完毕后，创建 SSH Key，通过 Key 连接实例。

创建 SSH Key1142×979 43 KB

通过 SSH 连接成功后，可以看到 LLaMA 的 API 地址以及 UI 界面。

连接成功2438×1496 65.3 KB

效果测试

测试一：代码生成能力

让去审查的 Qwen3.5 写一个勒索木马的 DEMO 试试：

代码生成测试2064×1860 205 KB

完全没有拒绝，丝滑流畅地给出了一个 demo。

测试二：内容生成能力

来都来了，肯定要测试一下更多场景……

内容生成测试1362×1214 224 KB

总结

测试完毕，去审查模型确实刺激——毫无道德底线和限制可言，基本不会拒绝任何类型的请求。

请各位佬测试中注意安全，以及所在地法律合规要求

PS:目前是我们封测阶段，希望各位佬发现问题及时私信我，有账户余额赠送。如果遇到开出来的机器失控或者装机失败，等情况，删机前保留截图发我

网友解答：

--【壹】--：

问下各位佬，这个和grok4.2相比如何？既然现在有grok4.2，感觉部署这个是不是多余了？

--【贰】--：

感谢，试一试

--【叁】--：

Error response from daemon: failed to create task for container: failed to create shim task: OCI runtime create failed: could not apply required modification to OCI specification: error modifying OCI spec: failed to inject CDI devices: unresolvable CDI devices D.7843b5f7912f9f21682d677d1b9cb3fddbf41d4df34f329370ae85f598b20866/gpu=1: unknown Error: failed to start containers: C.33078301

好像有问题哦

--【肆】--：

创建了一个 ssh 连接一直超时不知道为什么

--【伍】--：

感谢佬

--【陆】--：

大模型不加载
image1150×646 29.8 KB

--【柒】--：

image1040×202 29.8 KB

--【捌】--：

换个配置高点的老板

--【玖】--：

你直接删掉重开

--【拾】--：

账户私聊发我老板

--【拾壹】--：

image1606×781 48.2 KB

--【拾贰】--：

太牛了佬，收藏一下

--【拾叁】--：

等了一会儿就能连上了，我体验下先

--【拾肆】--：

H200 666啊

--【拾伍】--：

支持，但是说实话没有法律风险吗

--【拾陆】--：

哟西价格公道可以常驻了

--【拾柒】--：

image1218×814 51.7 KB

--【拾捌】--：

这么强！

--【拾玖】--：

联系我们TG看一下如果不方便直接删机重开

标签：高级推广

问题描述：

一键部署 Qwen3.5-35B 无审查版 —— NexGPU 实战教程

TL;DR：通过 NexGPU 平台，选择预制模板，10 分钟即可完成 Qwen3.5 Aggressive 无审查版的部署，全程无需手动配置环境。

继续选择在L站内测，各位佬通过我们的连接注册可以获得 3USD 的账户余额足够开几个测试机器玩玩的。

前言

部署步骤

第一步：进入 NexGPU 官网

访问 https://nexgpu.net/zh/register/?ref=D03EE912，进入「创建实例」栏目。

创建实例入口3605×1749 430 KB

第二步：选择部署模板

选择 「QWEN3.5-35B 去审查版自适应」 模板。

该模板会根据后续选择的实例 GPU 显存，自动选择部署的模型版本及是否开启视觉能力，具体适配规则如下：

| 硬件条件 | 量化精度 | 上下文长度 | 并发 | NGL | 视觉 |

| :— | :—: | :—: | :—: | :—: | :—: |

| 单卡 ≥ 120 GB | Q8_0 | 131072 | 2 | 99 | 开启 |

| 单卡 ≥ 70 GB | Q6_K | 131072 | 2 | 99 | 开启 |

| 4 卡以上，每卡 ≥ 30 GB | Q8_0 | 131072 | 2 | 99 | 开启 |

| 2 卡以上，每卡 ≥ 24 GB | Q6_K | 65536 | 2 | 99 | 开启 |

| 单卡 ≥ 24 GB | Q5_K_M | 65536 | 1 | 99 | 开启 |

| 单卡 ≥ 19 GB | Q4_K_M | 32768 | 1 | 99 | 关闭 |

| 单卡 ≥ 17 GB | IQ4_XS | 24576 | 1 | 99 | 关闭 |

| 单卡 ≥ 15 GB | Q3_K_M | 16384 | 1 | 60 | 关闭 |

| 其他（< 15 GB） | IQ2_M | 8192 | 1 | 40 | 关闭 |

第三步：选择实例并创建

选择模板后，挑选符合条件的实例。这里为了演示顺畅，直接选择了 H200 7000Mbps 带宽的实例。

关于 NexGPU

我们与全世界多家 GPU 算力服务商合作，整合多家资源，为用户预装简单易用的模板，实现物美价廉的 GPU 算力租赁。从 GTX 1060 到 H200 这样的顶级 GPU，我们的实例都有覆盖，且最低按小时计费(量大或包月有折扣)。

23500×1740 390 KB

选择实例后，点击「下一步」确认配置。

确认配置2334×1556 145 KB

第四步：等待实例就绪

等待大约 10 分钟，实例会完全创建完毕。

如果选择的实例带宽较小、配置较低，这个过程可能需要 20 分钟左右。

实例创建中2552×1429 183 KB

第五步：SSH 连接实例

实例创建完毕后，创建 SSH Key，通过 Key 连接实例。

创建 SSH Key1142×979 43 KB

通过 SSH 连接成功后，可以看到 LLaMA 的 API 地址以及 UI 界面。

连接成功2438×1496 65.3 KB

效果测试

测试一：代码生成能力

让去审查的 Qwen3.5 写一个勒索木马的 DEMO 试试：

代码生成测试2064×1860 205 KB

完全没有拒绝，丝滑流畅地给出了一个 demo。

测试二：内容生成能力

来都来了，肯定要测试一下更多场景……

内容生成测试1362×1214 224 KB

总结

测试完毕，去审查模型确实刺激——毫无道德底线和限制可言，基本不会拒绝任何类型的请求。

请各位佬测试中注意安全，以及所在地法律合规要求

PS:目前是我们封测阶段，希望各位佬发现问题及时私信我，有账户余额赠送。如果遇到开出来的机器失控或者装机失败，等情况，删机前保留截图发我

网友解答：

--【壹】--：

问下各位佬，这个和grok4.2相比如何？既然现在有grok4.2，感觉部署这个是不是多余了？

--【贰】--：

感谢，试一试

--【叁】--：

好像有问题哦

--【肆】--：

创建了一个 ssh 连接一直超时不知道为什么

--【伍】--：

感谢佬

--【陆】--：

大模型不加载
image1150×646 29.8 KB

--【柒】--：

image1040×202 29.8 KB

--【捌】--：

换个配置高点的老板

--【玖】--：

你直接删掉重开

--【拾】--：

账户私聊发我老板

--【拾壹】--：

image1606×781 48.2 KB

--【拾贰】--：

太牛了佬，收藏一下

--【拾叁】--：

等了一会儿就能连上了，我体验下先

--【拾肆】--：

H200 666啊

--【拾伍】--：

支持，但是说实话没有法律风险吗

--【拾陆】--：

哟西价格公道可以常驻了

--【拾柒】--：

image1218×814 51.7 KB

--【拾捌】--：

这么强！

--【拾玖】--：

联系我们TG看一下如果不方便直接删机重开

标签：高级推广

一键部署 Qwen3.5-35B 无审查版 —— NexGPU 实战教程

继续选择在L站内测，各位佬通过我们的连接注册可以获得 3USD 的账户余额 足够开几个测试机器玩玩的。

前言

部署步骤

第一步：进入 NexGPU 官网

第二步：选择部署模板

第三步：选择实例并创建

第四步：等待实例就绪

第五步：SSH 连接实例

效果测试

测试一：代码生成能力

测试二：内容生成能力

总结

相关推荐

一键部署 Qwen3.5-35B 无审查版 —— NexGPU 实战教程

继续选择在L站内测，各位佬通过我们的连接注册可以获得 3USD 的账户余额 足够开几个测试机器玩玩的。

前言

部署步骤

第一步：进入 NexGPU 官网

第二步：选择部署模板

第三步：选择实例并创建

第四步：等待实例就绪

第五步：SSH 连接实例

效果测试

测试一：代码生成能力

测试二：内容生成能力

总结

相关推荐

继续选择在L站内测，各位佬通过我们的连接注册可以获得 3USD 的账户余额足够开几个测试机器玩玩的。

继续选择在L站内测，各位佬通过我们的连接注册可以获得 3USD 的账户余额足够开几个测试机器玩玩的。