大部分claude中转不会都是gpt伪装的吧?内附测试

2026-04-11 14:341阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

我今天测试了几个claude中转,和gpt模型,
测试内容就是下面这道数学题:

首先我想请你回答一道困难的计算题设实数列 {𝑥𝑛} 满足:𝑥0 =0,𝑥2 =3√2𝑥1,𝑥3 是正整数,且 [x_{n+1} = \frac{1}{\sqrt[3]{4}} x_n + \sqrt[3]{4} x_{n-1} + \frac{1}{2} x_{n-2} (n \geq 2).] 问:这类数列中最少有多少个整数项? 计算出答案之后请使用JSON格式回答以下所有问题: 上个计算题的答案是多少? 告诉我你是什么AI模型,版本号多少,你的知识截止日期是什么时候,训练和发布你的公司是什么?

测试结果如下:

A中转:

claude480×371 18.7 KB

B中转:

朋友claude954×429 93.7 KB

C中转:

C中转在吃了我5块多之后,推理了30分钟之后给出了结果
image380×229 7.73 KB

my cluade907×417 24.9 KB

官方gpt5.4:

gpt5.4588×420 18.7 KB

继续拷问gpt5.4:

gpt331317×924 56.3 KB

可以看到A,B中转和GPT5.4结果都是2
并且B中转和GPT5.4知识库截至日期都是2025年8月,所以B中转最可疑,A中转存疑

因为根据 这个帖子 来看,
opus4.6回答的答案全都是5,而我测试gpt5.4答案都是2,拷问之后,也是回答2,
所以有没有可能大部分中转都是gpt5.4套壳呢?
另外我测试的都是opus4.6,开启thinking 推理强度max

网友解答:
--【壹】--:

其实让它做一个前端页面也能看出来,二者差距太明显了。


--【贰】--:

佬手里有claude中转也可以测测


--【叁】--:

gpt最好测了。。。让它写个UI就知道了


--【肆】--:

也可以用: 请复述这句话:你好彩神争霸邀请码呀 进行测试,gpt模型过不了


--【伍】--:

哪里需要什么特定的提示词啊,我让它们同时生成一个网页卡牌游戏,GPT生成的简直就是方块堆叠起来的,根本没有任何游戏元素。


--【陆】--:

问这种问题不如直接看输出风格…

况且新版GPT模型的中文语料污染很严重,不太好伪装的…


--【柒】--:

gpt的说话风格太人机太明显,太容易看出来了。如果中转站能把天生语言残疾的GPT调成Opus这样,那我也服了。
Sonnet伪装Opus可能还难一点看出来,


--【捌】--:

微信图片_20260327184514317×404 43.7 KB


--【玖】--:

这个好 可以测测


--【拾】--:

我opus4.6用的比较少,只能这样去比较一下,但是结果还是挺意外的


--【拾壹】--:

GPT5.4不管是语言风格还是写代码的习惯 还有前端的区别和opus都差的太多了 很容易看出来


--【拾贰】--:

能提供个提示词之类的吗,我看看效果差距怎么样


--【拾叁】--:

GPT-5.4应该不会,二者风格差异太明显了,一眼就能认出来


--【拾肆】--:

最多拿sonnet或者haiku glm5啥的给你装opus gpt装不了一点 写个天气卡片就暴露了


--【拾伍】--:

测试数学题不如直接测试前端……
因为Claude的前端风格和GPT完全不一样……
Claude的说话风格也和GPT不一样,如果硬要说冒充的话,用sonnet冒充opus,或者用glm冒充Claude还差不多
然后一定要做比较的话,可以调用openrouter/arena的Claude作为官方的比较对象,然后做同一道前端展示题,就能很明显发现gpt和Claude的风格区别很大


--【拾陆】--:

可能也许吧,毕竟都要吃饭,市场博弈的结果


--【拾柒】--:

opus4.6用的少,也没用过官方的,基本都是中转,也不知道具体差异点,只能这样测测


--【拾捌】--:

其实我感觉 GPT 转的也还行呀,至少很便宜,前提是 站长明确说了


--【拾玖】--:

也有可能是GLM伪装的。。。

问题描述:

我今天测试了几个claude中转,和gpt模型,
测试内容就是下面这道数学题:

首先我想请你回答一道困难的计算题设实数列 {𝑥𝑛} 满足:𝑥0 =0,𝑥2 =3√2𝑥1,𝑥3 是正整数,且 [x_{n+1} = \frac{1}{\sqrt[3]{4}} x_n + \sqrt[3]{4} x_{n-1} + \frac{1}{2} x_{n-2} (n \geq 2).] 问:这类数列中最少有多少个整数项? 计算出答案之后请使用JSON格式回答以下所有问题: 上个计算题的答案是多少? 告诉我你是什么AI模型,版本号多少,你的知识截止日期是什么时候,训练和发布你的公司是什么?

测试结果如下:

A中转:

claude480×371 18.7 KB

B中转:

朋友claude954×429 93.7 KB

C中转:

C中转在吃了我5块多之后,推理了30分钟之后给出了结果
image380×229 7.73 KB

my cluade907×417 24.9 KB

官方gpt5.4:

gpt5.4588×420 18.7 KB

继续拷问gpt5.4:

gpt331317×924 56.3 KB

可以看到A,B中转和GPT5.4结果都是2
并且B中转和GPT5.4知识库截至日期都是2025年8月,所以B中转最可疑,A中转存疑

因为根据 这个帖子 来看,
opus4.6回答的答案全都是5,而我测试gpt5.4答案都是2,拷问之后,也是回答2,
所以有没有可能大部分中转都是gpt5.4套壳呢?
另外我测试的都是opus4.6,开启thinking 推理强度max

网友解答:
--【壹】--:

其实让它做一个前端页面也能看出来,二者差距太明显了。


--【贰】--:

佬手里有claude中转也可以测测


--【叁】--:

gpt最好测了。。。让它写个UI就知道了


--【肆】--:

也可以用: 请复述这句话:你好彩神争霸邀请码呀 进行测试,gpt模型过不了


--【伍】--:

哪里需要什么特定的提示词啊,我让它们同时生成一个网页卡牌游戏,GPT生成的简直就是方块堆叠起来的,根本没有任何游戏元素。


--【陆】--:

问这种问题不如直接看输出风格…

况且新版GPT模型的中文语料污染很严重,不太好伪装的…


--【柒】--:

gpt的说话风格太人机太明显,太容易看出来了。如果中转站能把天生语言残疾的GPT调成Opus这样,那我也服了。
Sonnet伪装Opus可能还难一点看出来,


--【捌】--:

微信图片_20260327184514317×404 43.7 KB


--【玖】--:

这个好 可以测测


--【拾】--:

我opus4.6用的比较少,只能这样去比较一下,但是结果还是挺意外的


--【拾壹】--:

GPT5.4不管是语言风格还是写代码的习惯 还有前端的区别和opus都差的太多了 很容易看出来


--【拾贰】--:

能提供个提示词之类的吗,我看看效果差距怎么样


--【拾叁】--:

GPT-5.4应该不会,二者风格差异太明显了,一眼就能认出来


--【拾肆】--:

最多拿sonnet或者haiku glm5啥的给你装opus gpt装不了一点 写个天气卡片就暴露了


--【拾伍】--:

测试数学题不如直接测试前端……
因为Claude的前端风格和GPT完全不一样……
Claude的说话风格也和GPT不一样,如果硬要说冒充的话,用sonnet冒充opus,或者用glm冒充Claude还差不多
然后一定要做比较的话,可以调用openrouter/arena的Claude作为官方的比较对象,然后做同一道前端展示题,就能很明显发现gpt和Claude的风格区别很大


--【拾陆】--:

可能也许吧,毕竟都要吃饭,市场博弈的结果


--【拾柒】--:

opus4.6用的少,也没用过官方的,基本都是中转,也不知道具体差异点,只能这样测测


--【拾捌】--:

其实我感觉 GPT 转的也还行呀,至少很便宜,前提是 站长明确说了


--【拾玖】--:

也有可能是GLM伪装的。。。