对新出的几个模型需求完善程度比拼 - 网络篇

2026-04-29 09:332阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

无聊的时候对一些新出的模型提了一个很久之前困扰我网络折腾上的难题。

题目如下:

我有一个需求,就是通过有公网IPv4的服务器+wireguard VPN将NAT里面服务器的端口暴露出去,并且能够让NAT服务器的服务能看得到请求客户端原始的IP,并且没有Proxy Protocol

第二题:

但是我希望NAT服务器对外面的请求(比如说Google或者Docker)还是走原来的Gateway,而不是被公网服务器全局代理,怎么改?

参与的模型如下:

Claude Opus 4.7 (Adaptive Thinking) (网页聊天 - 无痕)

Claude Sonnet 4.6 (Adaptive Thinking) (网页聊天 - 无痕)

GPT 5.5 (Cherry Studio 自动 Thinking) (官方API)

DeepSeek v4 Flash (Cherry Studio 自动 Thinking) (官方API)

GLM 5.1 (Cherry Studio 自动 Thinking) (官方API)

Deepseek V4 Pro (Cherry Studio 自动 Thinking) (官方API)

*为了避免Memory的影响就给Claude开了无痕模式

先说结果:两个Claude模型给出的回答质量最优;GPT 5.5给的方案第一题正确,第二题方案可用,但兼容性有问题;DeepSeek v4 Flash答对了第一题,但败在了第二题;剩下的两个模型第一题都做出问题了,并且错的方向相同。

Claude 给我的答案最满意,两个模型都在我问出第二个问题之前就已经给出了解决方案。Sonnet是在回答最后提了问2的解决方案,Opus是将问2的解决方案作为"必需操作"和问1的答案写在一起的。并且都是使用fwmark来分开VPN出站和默认网关出站数据包的,这点令我很意外和满意,因为对UDP更友好,并且Opus还强调了方案对UDP连接可能存在的问题。

GPT 5.5 给的方案中规中矩,第二题答案在我提出之后才补上来,使用的是根据源IP查找路由表的方案。能行,是我之前自己想到的方案,但是对UDP很不友好。

Deepseek Flash模型反而答对了一题是我没想到的

Deepseek v4 Pro和GLM 5.1犯了类似的错误,将AllowedIPs填写成了Wireguard服务器的内网IP或者WG的内网网段,看起来是对Wireguard不熟悉导致的。

各个模型回答如下:

Opus 4.7: (区块截图 - 多图警告)

image772×1322 163 KB

image764×1337 150 KB

image765×1326 173 KB

(Sonnet因为使用的是隐私模式忘记复制保存了…)

GPT 5.5:

第一题:

image1170×11836 952 KB

第二题:

image1170×12226 844 KB

GLM 5.1:

image1170×4932 660 KB

image1195×993 108 KB

Deepseek V4 Pro:

image1170×6772 752 KB

网友解答:
--【壹】--:

是最新版噢

image1920×1132 259 KB


--【贰】--:

deepseekv4要开max thinking的,默认那个是high
开max重试一下看看?


--【叁】--:

在Cherry Studio里面Deepseek V4 Pro好像只能开Auto Thinking,那个功能按钮点了没反应。GLM 5.1的可以,但好像也只允许自动思考和禁用思考

image725×836 48.5 KB

image1056×818 84.5 KB


--【肆】--:

官方好像前两天说已经兼容了,更新下试试?

问题描述:

无聊的时候对一些新出的模型提了一个很久之前困扰我网络折腾上的难题。

题目如下:

我有一个需求,就是通过有公网IPv4的服务器+wireguard VPN将NAT里面服务器的端口暴露出去,并且能够让NAT服务器的服务能看得到请求客户端原始的IP,并且没有Proxy Protocol

第二题:

但是我希望NAT服务器对外面的请求(比如说Google或者Docker)还是走原来的Gateway,而不是被公网服务器全局代理,怎么改?

参与的模型如下:

Claude Opus 4.7 (Adaptive Thinking) (网页聊天 - 无痕)

Claude Sonnet 4.6 (Adaptive Thinking) (网页聊天 - 无痕)

GPT 5.5 (Cherry Studio 自动 Thinking) (官方API)

DeepSeek v4 Flash (Cherry Studio 自动 Thinking) (官方API)

GLM 5.1 (Cherry Studio 自动 Thinking) (官方API)

Deepseek V4 Pro (Cherry Studio 自动 Thinking) (官方API)

*为了避免Memory的影响就给Claude开了无痕模式

先说结果:两个Claude模型给出的回答质量最优;GPT 5.5给的方案第一题正确,第二题方案可用,但兼容性有问题;DeepSeek v4 Flash答对了第一题,但败在了第二题;剩下的两个模型第一题都做出问题了,并且错的方向相同。

Claude 给我的答案最满意,两个模型都在我问出第二个问题之前就已经给出了解决方案。Sonnet是在回答最后提了问2的解决方案,Opus是将问2的解决方案作为"必需操作"和问1的答案写在一起的。并且都是使用fwmark来分开VPN出站和默认网关出站数据包的,这点令我很意外和满意,因为对UDP更友好,并且Opus还强调了方案对UDP连接可能存在的问题。

GPT 5.5 给的方案中规中矩,第二题答案在我提出之后才补上来,使用的是根据源IP查找路由表的方案。能行,是我之前自己想到的方案,但是对UDP很不友好。

Deepseek Flash模型反而答对了一题是我没想到的

Deepseek v4 Pro和GLM 5.1犯了类似的错误,将AllowedIPs填写成了Wireguard服务器的内网IP或者WG的内网网段,看起来是对Wireguard不熟悉导致的。

各个模型回答如下:

Opus 4.7: (区块截图 - 多图警告)

image772×1322 163 KB

image764×1337 150 KB

image765×1326 173 KB

(Sonnet因为使用的是隐私模式忘记复制保存了…)

GPT 5.5:

第一题:

image1170×11836 952 KB

第二题:

image1170×12226 844 KB

GLM 5.1:

image1170×4932 660 KB

image1195×993 108 KB

Deepseek V4 Pro:

image1170×6772 752 KB

网友解答:
--【壹】--:

是最新版噢

image1920×1132 259 KB


--【贰】--:

deepseekv4要开max thinking的,默认那个是high
开max重试一下看看?


--【叁】--:

在Cherry Studio里面Deepseek V4 Pro好像只能开Auto Thinking,那个功能按钮点了没反应。GLM 5.1的可以,但好像也只允许自动思考和禁用思考

image725×836 48.5 KB

image1056×818 84.5 KB


--【肆】--:

官方好像前两天说已经兼容了,更新下试试?