我发现一个简单的问题，但是很多AI回答错误

2026-04-29 09:016阅读0评论SEO问题

内容介绍
文章标签
相关推荐

问题描述：

题目

```caddyfile test.example.com { @authed { header Authorization "Bearer 123123123" } import log test.example.com import common reverse_proxy @authed 127.0.0.1:3003 respond 401 { body "Unauthorized" } } ``` ```shell curl -X GET "https://test.example.com" \ -H "Authorization: Bearer 123123123" Unauthorized ``` 为什么 Unauthorized?

回答结果

模型名称	reasoning effort	耗时
deepseek v4 flash	max	1.2m
deepseek v4 pro	max	2m
glm-5.1		3m
gpt-5.4	xhigh	18s
kimi-k2.6		7m

~~因为我用的 ollama 还没上 deepseek v4 pro，所以用 web 端测试~~
ollama 重新上线了 ds v4 pro，测试仍然不能答出来

正确答案

respond 不加 matcher 会匹配所有请求，并且优先于 reverse_proxy

观察思考内容

发现大部分模型都被这两行配置硬控住，反复思考，导致耗时很长。

import log test.example.com import common 网友解答：

--【壹】--：

就是之前版本有问题所以才下线调整的，刚刚又上线了。

--【贰】--：

image1892×1154 92 KB
OpenCode GO里Qwen3.6 Plus的回答

--【叁】--：

image451×270 70.9 KB

antigravity里面的gemini 3.1 pro high回答的，好像回答对了

--【肆】--：

ollama 的 v4 pro 我之前测试的时候甚至没有思考功能

--【伍】--：

这是官网的v4 pro，我在cowork模式下进行的问答，不知道对不对，不过我能确定的是，确实思考了很久
image1175×1575 114 KB

--【陆】--：

pro要在cc里开启max思考强度才能最大化推理能力，openwebui不知道怎么设置

--【柒】--：

GLM5.1 FP8精度
image1150×921 85.3 KB

--【捌】--：

哈哈哈哈，确实难受，我已经放弃了，卡的我没脾气

--【玖】--：

是对的，但是在 cc 里用可能会有额外工具和提示词。
我测试是在 openwebui 里，openwebui 默认没有额外提示词和工具，比较体现模型本身知识。

--【拾】--：

vertex渠道的Gemini 3.1 Flash Lite High Thinking的表现

有联网搜索：
image931×336 46.3 KB

无联网搜索：
image943×506 51.4 KB

--【拾壹】--：

ollama cloud 重新上线了 ds v4 pro，所以重测了一下，还是答不上来

--【拾贰】--：

openwebui 可以在对话页右上角设置里自定义 reasoning effort 选项为 max

--【拾叁】--：

vertex渠道的Gemini 3.1 Pro High Thinking的表现

有联网搜索的情况下：
image932×390 52.1 KB

不开联网搜索的情况下：
image974×365 48.1 KB

Gemini的世界知识还算可以？

--【拾肆】--：

思考确实有卡顿的问题，总体回复速度还是可以的。50 tps 左右。
主要是找不到其他量大的套餐，不然也不会用 ollama。没得选罢了。

--【拾伍】--： nite07:

test.example.com { @authed { header Authorization "Bearer 123123123" } import log test.example.com import common reverse_proxy @authed 127.0.0.1:3003 respond 401 { body "Unauthorized" } }
curl -X GET "https://test.example.com" \ -H "Authorization: Bearer 123123123" Unauthorized
为什么 Unauthorized?

这是据说被降智的网页版 Gemini，也能回答出来，耗时小于 30 秒…

IMG45482205×1236 248 KB

--【拾陆】--：

@nite07
image1442×917 16.9 KB
我这里专家模式能做出来，而且很快

--【拾柒】--： nite07:

test.example.com { @authed { header Authorization "Bearer 123123123" } import log test.example.com import common reverse_proxy @authed 127.0.0.1:3003 respond 401 { body "Unauthorized" } }

image646×556 79.4 KB
龙虾，5秒。gpt-5.4 Think: off

--【拾捌】--：

越用越慢，只有 30 tps 还有十几秒的 ttft，有点受不了了

--【拾玖】--：

佬友你测试ollama的v4 pro有遇到卡顿吗？我刚刚用的时候发现思考一段就要卡一段，之前用ollama的glm5.1也是这样，还想着如果ollama的deepseek流畅一点就继续续费的
ollama的测试结果：
image1105×1767 133 KB

标签：人工智能纯水

问题描述：

题目

回答结果

模型名称	reasoning effort	耗时
deepseek v4 flash	max	1.2m
deepseek v4 pro	max	2m
glm-5.1		3m
gpt-5.4	xhigh	18s
kimi-k2.6		7m

~~因为我用的 ollama 还没上 deepseek v4 pro，所以用 web 端测试~~
ollama 重新上线了 ds v4 pro，测试仍然不能答出来

正确答案

respond 不加 matcher 会匹配所有请求，并且优先于 reverse_proxy

观察思考内容

发现大部分模型都被这两行配置硬控住，反复思考，导致耗时很长。

import log test.example.com import common 网友解答：

--【壹】--：

就是之前版本有问题所以才下线调整的，刚刚又上线了。

--【贰】--：

image1892×1154 92 KB
OpenCode GO里Qwen3.6 Plus的回答

--【叁】--：

image451×270 70.9 KB

antigravity里面的gemini 3.1 pro high回答的，好像回答对了

--【肆】--：

ollama 的 v4 pro 我之前测试的时候甚至没有思考功能

--【伍】--：

这是官网的v4 pro，我在cowork模式下进行的问答，不知道对不对，不过我能确定的是，确实思考了很久
image1175×1575 114 KB

--【陆】--：

pro要在cc里开启max思考强度才能最大化推理能力，openwebui不知道怎么设置

--【柒】--：

GLM5.1 FP8精度
image1150×921 85.3 KB

--【捌】--：

哈哈哈哈，确实难受，我已经放弃了，卡的我没脾气

--【玖】--：

是对的，但是在 cc 里用可能会有额外工具和提示词。
我测试是在 openwebui 里，openwebui 默认没有额外提示词和工具，比较体现模型本身知识。

--【拾】--：

vertex渠道的Gemini 3.1 Flash Lite High Thinking的表现

有联网搜索：
image931×336 46.3 KB

无联网搜索：
image943×506 51.4 KB

--【拾壹】--：

ollama cloud 重新上线了 ds v4 pro，所以重测了一下，还是答不上来

--【拾贰】--：

openwebui 可以在对话页右上角设置里自定义 reasoning effort 选项为 max

--【拾叁】--：

vertex渠道的Gemini 3.1 Pro High Thinking的表现

有联网搜索的情况下：
image932×390 52.1 KB

不开联网搜索的情况下：
image974×365 48.1 KB

Gemini的世界知识还算可以？

--【拾肆】--：

思考确实有卡顿的问题，总体回复速度还是可以的。50 tps 左右。
主要是找不到其他量大的套餐，不然也不会用 ollama。没得选罢了。

--【拾伍】--： nite07:

test.example.com { @authed { header Authorization "Bearer 123123123" } import log test.example.com import common reverse_proxy @authed 127.0.0.1:3003 respond 401 { body "Unauthorized" } }
curl -X GET "https://test.example.com" \ -H "Authorization: Bearer 123123123" Unauthorized
为什么 Unauthorized?

这是据说被降智的网页版 Gemini，也能回答出来，耗时小于 30 秒…

IMG45482205×1236 248 KB

--【拾陆】--：

@nite07
image1442×917 16.9 KB
我这里专家模式能做出来，而且很快

--【拾柒】--： nite07:

test.example.com { @authed { header Authorization "Bearer 123123123" } import log test.example.com import common reverse_proxy @authed 127.0.0.1:3003 respond 401 { body "Unauthorized" } }

image646×556 79.4 KB
龙虾，5秒。gpt-5.4 Think: off

--【拾捌】--：

越用越慢，只有 30 tps 还有十几秒的 ttft，有点受不了了

--【拾玖】--：

标签：人工智能纯水

题目

回答结果

正确答案

观察思考内容

相关推荐

题目

回答结果

正确答案

观察思考内容

相关推荐