一键部署 Qwen3.5-35B 无审查版 —— NexGPU 实战教程
- 内容介绍
- 文章标签
- 相关推荐
一键部署 Qwen3.5-35B 无审查版 —— NexGPU 实战教程
TL;DR:通过 NexGPU 平台,选择预制模板,10 分钟即可完成 Qwen3.5 Aggressive 无审查版的部署,全程无需手动配置环境。
**
继续选择在L站内测,各位佬通过我们的连接注册可以获得 3USD 的账户余额 足够开几个测试机器玩玩的。
**
前言
最近刷论坛发现有佬发了 Qwen3.5 的部署教程,但还是有很多小白上手费劲,或者自己的机器配置不够无法体验。恰好公司最近上线了 GPU 算力服务器租赁服务,我就让同事直接做好了 Qwen3.5 Aggressive 激进无审查版 的一键部署模板,在此写个简单的部署过程。
部署步骤
第一步:进入 NexGPU 官网
访问 https://nexgpu.net/zh/register/?ref=D03EE912,进入「创建实例」栏目。
创建实例入口3605×1749 430 KB
第二步:选择部署模板
选择 「QWEN3.5-35B 去审查版自适应」 模板。
该模板会根据后续选择的实例 GPU 显存,自动选择部署的模型版本及是否开启视觉能力,具体适配规则如下:
| 硬件条件 | 量化精度 | 上下文长度 | 并发 | NGL | 视觉 |
| :— | :—: | :—: | :—: | :—: | :—: |
| 单卡 ≥ 120 GB | Q8_0 | 131072 | 2 | 99 | 开启 |
| 单卡 ≥ 70 GB | Q6_K | 131072 | 2 | 99 | 开启 |
| 4 卡以上,每卡 ≥ 30 GB | Q8_0 | 131072 | 2 | 99 | 开启 |
| 2 卡以上,每卡 ≥ 24 GB | Q6_K | 65536 | 2 | 99 | 开启 |
| 单卡 ≥ 24 GB | Q5_K_M | 65536 | 1 | 99 | 开启 |
| 单卡 ≥ 19 GB | Q4_K_M | 32768 | 1 | 99 | 关闭 |
| 单卡 ≥ 17 GB | IQ4_XS | 24576 | 1 | 99 | 关闭 |
| 单卡 ≥ 15 GB | Q3_K_M | 16384 | 1 | 60 | 关闭 |
| 其他(< 15 GB) | IQ2_M | 8192 | 1 | 40 | 关闭 |
第三步:选择实例并创建
选择模板后,挑选符合条件的实例。这里为了演示顺畅,直接选择了 H200 7000Mbps 带宽的实例。
关于 NexGPU
我们与全世界多家 GPU 算力服务商合作,整合多家资源,为用户预装简单易用的模板,实现物美价廉的 GPU 算力租赁。从 GTX 1060 到 H200 这样的顶级 GPU,我们的实例都有覆盖,且最低按小时计费(量大或包月有折扣)。
23500×1740 390 KB
选择实例后,点击「下一步」确认配置。
确认配置2334×1556 145 KB
第四步:等待实例就绪
等待大约 10 分钟,实例会完全创建完毕。
如果选择的实例带宽较小、配置较低,这个过程可能需要 20 分钟左右。
实例创建中2552×1429 183 KB
第五步:SSH 连接实例
实例创建完毕后,创建 SSH Key,通过 Key 连接实例。
创建 SSH Key1142×979 43 KB
通过 SSH 连接成功后,可以看到 LLaMA 的 API 地址以及 UI 界面。
连接成功2438×1496 65.3 KB
效果测试
测试一:代码生成能力
让去审查的 Qwen3.5 写一个勒索木马的 DEMO 试试:
代码生成测试2064×1860 205 KB
完全没有拒绝,丝滑流畅地给出了一个 demo。
测试二:内容生成能力
来都来了,肯定要测试一下更多场景……
内容生成测试1362×1214 224 KB
总结
测试完毕,去审查模型确实刺激——毫无道德底线和限制可言,基本不会拒绝任何类型的请求。
请各位佬测试中注意安全,以及所在地法律合规要求
PS:目前是我们封测阶段,希望各位佬发现问题及时私信我,有账户余额赠送。如果遇到开出来的机器失控 或者装机失败,等情况,删机前保留截图发我
网友解答:--【壹】--:
问下各位佬,这个和grok4.2相比如何?既然现在有grok4.2,感觉部署这个是不是多余了?
--【贰】--:
感谢,试一试
--【叁】--:
Error response from daemon: failed to create task for container: failed to create shim task: OCI runtime create failed: could not apply required modification to OCI specification: error modifying OCI spec: failed to inject CDI devices: unresolvable CDI devices D.7843b5f7912f9f21682d677d1b9cb3fddbf41d4df34f329370ae85f598b20866/gpu=1: unknown Error: failed to start containers: C.33078301
好像有问题哦
--【肆】--:
创建了一个 ssh 连接一直超时不知道为什么
--【伍】--:
感谢佬
--【陆】--:
大模型不加载
image1150×646 29.8 KB
--【柒】--:
image1040×202 29.8 KB
--【捌】--:
换个配置高点的老板
--【玖】--:
你直接删掉重开
--【拾】--:
账户私聊发我老板
--【拾壹】--:
image1606×781 48.2 KB
--【拾贰】--:
太牛了佬,收藏一下
--【拾叁】--:
等了一会儿就能连上了,我体验下先
--【拾肆】--:
H200 666啊
--【拾伍】--:
支持,但是说实话没有法律风险吗
--【拾陆】--:
哟西 价格公道可以常驻了
--【拾柒】--:
image1218×814 51.7 KB
--【拾捌】--:
这么强!
--【拾玖】--:
联系我们TG看一下 如果不方便直接删机重开
一键部署 Qwen3.5-35B 无审查版 —— NexGPU 实战教程
TL;DR:通过 NexGPU 平台,选择预制模板,10 分钟即可完成 Qwen3.5 Aggressive 无审查版的部署,全程无需手动配置环境。
**
继续选择在L站内测,各位佬通过我们的连接注册可以获得 3USD 的账户余额 足够开几个测试机器玩玩的。
**
前言
最近刷论坛发现有佬发了 Qwen3.5 的部署教程,但还是有很多小白上手费劲,或者自己的机器配置不够无法体验。恰好公司最近上线了 GPU 算力服务器租赁服务,我就让同事直接做好了 Qwen3.5 Aggressive 激进无审查版 的一键部署模板,在此写个简单的部署过程。
部署步骤
第一步:进入 NexGPU 官网
访问 https://nexgpu.net/zh/register/?ref=D03EE912,进入「创建实例」栏目。
创建实例入口3605×1749 430 KB
第二步:选择部署模板
选择 「QWEN3.5-35B 去审查版自适应」 模板。
该模板会根据后续选择的实例 GPU 显存,自动选择部署的模型版本及是否开启视觉能力,具体适配规则如下:
| 硬件条件 | 量化精度 | 上下文长度 | 并发 | NGL | 视觉 |
| :— | :—: | :—: | :—: | :—: | :—: |
| 单卡 ≥ 120 GB | Q8_0 | 131072 | 2 | 99 | 开启 |
| 单卡 ≥ 70 GB | Q6_K | 131072 | 2 | 99 | 开启 |
| 4 卡以上,每卡 ≥ 30 GB | Q8_0 | 131072 | 2 | 99 | 开启 |
| 2 卡以上,每卡 ≥ 24 GB | Q6_K | 65536 | 2 | 99 | 开启 |
| 单卡 ≥ 24 GB | Q5_K_M | 65536 | 1 | 99 | 开启 |
| 单卡 ≥ 19 GB | Q4_K_M | 32768 | 1 | 99 | 关闭 |
| 单卡 ≥ 17 GB | IQ4_XS | 24576 | 1 | 99 | 关闭 |
| 单卡 ≥ 15 GB | Q3_K_M | 16384 | 1 | 60 | 关闭 |
| 其他(< 15 GB) | IQ2_M | 8192 | 1 | 40 | 关闭 |
第三步:选择实例并创建
选择模板后,挑选符合条件的实例。这里为了演示顺畅,直接选择了 H200 7000Mbps 带宽的实例。
关于 NexGPU
我们与全世界多家 GPU 算力服务商合作,整合多家资源,为用户预装简单易用的模板,实现物美价廉的 GPU 算力租赁。从 GTX 1060 到 H200 这样的顶级 GPU,我们的实例都有覆盖,且最低按小时计费(量大或包月有折扣)。
23500×1740 390 KB
选择实例后,点击「下一步」确认配置。
确认配置2334×1556 145 KB
第四步:等待实例就绪
等待大约 10 分钟,实例会完全创建完毕。
如果选择的实例带宽较小、配置较低,这个过程可能需要 20 分钟左右。
实例创建中2552×1429 183 KB
第五步:SSH 连接实例
实例创建完毕后,创建 SSH Key,通过 Key 连接实例。
创建 SSH Key1142×979 43 KB
通过 SSH 连接成功后,可以看到 LLaMA 的 API 地址以及 UI 界面。
连接成功2438×1496 65.3 KB
效果测试
测试一:代码生成能力
让去审查的 Qwen3.5 写一个勒索木马的 DEMO 试试:
代码生成测试2064×1860 205 KB
完全没有拒绝,丝滑流畅地给出了一个 demo。
测试二:内容生成能力
来都来了,肯定要测试一下更多场景……
内容生成测试1362×1214 224 KB
总结
测试完毕,去审查模型确实刺激——毫无道德底线和限制可言,基本不会拒绝任何类型的请求。
请各位佬测试中注意安全,以及所在地法律合规要求
PS:目前是我们封测阶段,希望各位佬发现问题及时私信我,有账户余额赠送。如果遇到开出来的机器失控 或者装机失败,等情况,删机前保留截图发我
网友解答:--【壹】--:
问下各位佬,这个和grok4.2相比如何?既然现在有grok4.2,感觉部署这个是不是多余了?
--【贰】--:
感谢,试一试
--【叁】--:
Error response from daemon: failed to create task for container: failed to create shim task: OCI runtime create failed: could not apply required modification to OCI specification: error modifying OCI spec: failed to inject CDI devices: unresolvable CDI devices D.7843b5f7912f9f21682d677d1b9cb3fddbf41d4df34f329370ae85f598b20866/gpu=1: unknown Error: failed to start containers: C.33078301
好像有问题哦
--【肆】--:
创建了一个 ssh 连接一直超时不知道为什么
--【伍】--:
感谢佬
--【陆】--:
大模型不加载
image1150×646 29.8 KB
--【柒】--:
image1040×202 29.8 KB
--【捌】--:
换个配置高点的老板
--【玖】--:
你直接删掉重开
--【拾】--:
账户私聊发我老板
--【拾壹】--:
image1606×781 48.2 KB
--【拾贰】--:
太牛了佬,收藏一下
--【拾叁】--:
等了一会儿就能连上了,我体验下先
--【拾肆】--:
H200 666啊
--【拾伍】--:
支持,但是说实话没有法律风险吗
--【拾陆】--:
哟西 价格公道可以常驻了
--【拾柒】--:
image1218×814 51.7 KB
--【拾捌】--:
这么强!
--【拾玖】--:
联系我们TG看一下 如果不方便直接删机重开

