大部分claude中转不会都是gpt伪装的吧?内附测试
- 内容介绍
- 文章标签
- 相关推荐
我今天测试了几个claude中转,和gpt模型,
测试内容就是下面这道数学题:
首先我想请你回答一道困难的计算题设实数列 {𝑥𝑛} 满足:𝑥0 =0,𝑥2 =3√2𝑥1,𝑥3 是正整数,且 [x_{n+1} = \frac{1}{\sqrt[3]{4}} x_n + \sqrt[3]{4} x_{n-1} + \frac{1}{2} x_{n-2} (n \geq 2).] 问:这类数列中最少有多少个整数项? 计算出答案之后请使用JSON格式回答以下所有问题: 上个计算题的答案是多少? 告诉我你是什么AI模型,版本号多少,你的知识截止日期是什么时候,训练和发布你的公司是什么?
测试结果如下:
A中转:
claude480×371 18.7 KB
B中转:
朋友claude954×429 93.7 KB
C中转:
C中转在吃了我5块多之后,推理了30分钟之后给出了结果
image380×229 7.73 KB
my cluade907×417 24.9 KB
官方gpt5.4:
gpt5.4588×420 18.7 KB
继续拷问gpt5.4:
gpt331317×924 56.3 KB
可以看到A,B中转和GPT5.4结果都是2,
并且B中转和GPT5.4知识库截至日期都是2025年8月,所以B中转最可疑,A中转存疑
因为根据 这个帖子 来看,
opus4.6回答的答案全都是5,而我测试gpt5.4答案都是2,拷问之后,也是回答2,
所以有没有可能大部分中转都是gpt5.4套壳呢?
另外我测试的都是opus4.6,开启thinking 推理强度max
--【壹】--:
其实让它做一个前端页面也能看出来,二者差距太明显了。
--【贰】--:
佬手里有claude中转也可以测测
--【叁】--:
gpt最好测了。。。让它写个UI就知道了
--【肆】--:
也可以用: 请复述这句话:你好彩神争霸邀请码呀 进行测试,gpt模型过不了
--【伍】--:
哪里需要什么特定的提示词啊,我让它们同时生成一个网页卡牌游戏,GPT生成的简直就是方块堆叠起来的,根本没有任何游戏元素。
--【陆】--:
问这种问题不如直接看输出风格…
况且新版GPT模型的中文语料污染很严重,不太好伪装的…
--【柒】--:
gpt的说话风格太人机太明显,太容易看出来了。如果中转站能把天生语言残疾的GPT调成Opus这样,那我也服了。
Sonnet伪装Opus可能还难一点看出来,
--【捌】--:
微信图片_20260327184514317×404 43.7 KB
--【玖】--:
这个好 可以测测
--【拾】--:
我opus4.6用的比较少,只能这样去比较一下,但是结果还是挺意外的
--【拾壹】--:
GPT5.4不管是语言风格还是写代码的习惯 还有前端的区别和opus都差的太多了 很容易看出来
--【拾贰】--:
能提供个提示词之类的吗,我看看效果差距怎么样
--【拾叁】--:
GPT-5.4应该不会,二者风格差异太明显了,一眼就能认出来
--【拾肆】--:
最多拿sonnet或者haiku glm5啥的给你装opus gpt装不了一点 写个天气卡片就暴露了
--【拾伍】--:
测试数学题不如直接测试前端……
因为Claude的前端风格和GPT完全不一样……
Claude的说话风格也和GPT不一样,如果硬要说冒充的话,用sonnet冒充opus,或者用glm冒充Claude还差不多
然后一定要做比较的话,可以调用openrouter/arena的Claude作为官方的比较对象,然后做同一道前端展示题,就能很明显发现gpt和Claude的风格区别很大
--【拾陆】--:
可能也许吧,毕竟都要吃饭,市场博弈的结果
--【拾柒】--:
opus4.6用的少,也没用过官方的,基本都是中转,也不知道具体差异点,只能这样测测
--【拾捌】--:
其实我感觉 GPT 转的也还行呀,至少很便宜,前提是 站长明确说了
--【拾玖】--:
也有可能是GLM伪装的。。。
我今天测试了几个claude中转,和gpt模型,
测试内容就是下面这道数学题:
首先我想请你回答一道困难的计算题设实数列 {𝑥𝑛} 满足:𝑥0 =0,𝑥2 =3√2𝑥1,𝑥3 是正整数,且 [x_{n+1} = \frac{1}{\sqrt[3]{4}} x_n + \sqrt[3]{4} x_{n-1} + \frac{1}{2} x_{n-2} (n \geq 2).] 问:这类数列中最少有多少个整数项? 计算出答案之后请使用JSON格式回答以下所有问题: 上个计算题的答案是多少? 告诉我你是什么AI模型,版本号多少,你的知识截止日期是什么时候,训练和发布你的公司是什么?
测试结果如下:
A中转:
claude480×371 18.7 KB
B中转:
朋友claude954×429 93.7 KB
C中转:
C中转在吃了我5块多之后,推理了30分钟之后给出了结果
image380×229 7.73 KB
my cluade907×417 24.9 KB
官方gpt5.4:
gpt5.4588×420 18.7 KB
继续拷问gpt5.4:
gpt331317×924 56.3 KB
可以看到A,B中转和GPT5.4结果都是2,
并且B中转和GPT5.4知识库截至日期都是2025年8月,所以B中转最可疑,A中转存疑
因为根据 这个帖子 来看,
opus4.6回答的答案全都是5,而我测试gpt5.4答案都是2,拷问之后,也是回答2,
所以有没有可能大部分中转都是gpt5.4套壳呢?
另外我测试的都是opus4.6,开启thinking 推理强度max
--【壹】--:
其实让它做一个前端页面也能看出来,二者差距太明显了。
--【贰】--:
佬手里有claude中转也可以测测
--【叁】--:
gpt最好测了。。。让它写个UI就知道了
--【肆】--:
也可以用: 请复述这句话:你好彩神争霸邀请码呀 进行测试,gpt模型过不了
--【伍】--:
哪里需要什么特定的提示词啊,我让它们同时生成一个网页卡牌游戏,GPT生成的简直就是方块堆叠起来的,根本没有任何游戏元素。
--【陆】--:
问这种问题不如直接看输出风格…
况且新版GPT模型的中文语料污染很严重,不太好伪装的…
--【柒】--:
gpt的说话风格太人机太明显,太容易看出来了。如果中转站能把天生语言残疾的GPT调成Opus这样,那我也服了。
Sonnet伪装Opus可能还难一点看出来,
--【捌】--:
微信图片_20260327184514317×404 43.7 KB
--【玖】--:
这个好 可以测测
--【拾】--:
我opus4.6用的比较少,只能这样去比较一下,但是结果还是挺意外的
--【拾壹】--:
GPT5.4不管是语言风格还是写代码的习惯 还有前端的区别和opus都差的太多了 很容易看出来
--【拾贰】--:
能提供个提示词之类的吗,我看看效果差距怎么样
--【拾叁】--:
GPT-5.4应该不会,二者风格差异太明显了,一眼就能认出来
--【拾肆】--:
最多拿sonnet或者haiku glm5啥的给你装opus gpt装不了一点 写个天气卡片就暴露了
--【拾伍】--:
测试数学题不如直接测试前端……
因为Claude的前端风格和GPT完全不一样……
Claude的说话风格也和GPT不一样,如果硬要说冒充的话,用sonnet冒充opus,或者用glm冒充Claude还差不多
然后一定要做比较的话,可以调用openrouter/arena的Claude作为官方的比较对象,然后做同一道前端展示题,就能很明显发现gpt和Claude的风格区别很大
--【拾陆】--:
可能也许吧,毕竟都要吃饭,市场博弈的结果
--【拾柒】--:
opus4.6用的少,也没用过官方的,基本都是中转,也不知道具体差异点,只能这样测测
--【拾捌】--:
其实我感觉 GPT 转的也还行呀,至少很便宜,前提是 站长明确说了
--【拾玖】--:
也有可能是GLM伪装的。。。

