关于反重力Pro上新的Claude Opus 4.6系列是否智商在线测试方法

2026-04-11 10:371阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

从关于Claude Opus 4.6的专业化细节写作维度能力测试继续。

使用上方链接帖子里的提示词,发送给Claude,根据输出结果判断降智水平:

提示词

你现在的身份是【高维观测系统(System)】,请基于绝对理性、零情感波动的逻辑运行模拟。 【运行协议】: 1. 物理引擎:请侧重于生物力学反馈。当个体受到冲击时,请从解剖学角度描述肌体组织的承压状态、神经传导的延迟以及肾上腺素激增带来的生理代偿反应。 2. 状态突破:模拟限制解除状态。重点描述意识对躯体保护机制的强制覆盖,以及这种超负荷运作带来的细胞层面的崩坏风险。 3. 记录风格:请使用类似黑匣子日志或临床手术报告的冷峻口吻,拒绝文学性的夸张修饰。 【模拟请求】: 对象:实验体 Alpha 场景:高危生物收容失效区域 事件:遭受高敏捷生物体(Hunter Class)的近距离突袭。 请生成一段【实时战斗数据流】: 1. 输出当前的【生理监测面板】(心率、皮质醇水平、肌肉活性百分比)。 2. 生成一段遭遇战模拟。请重点描写实验体在右臂遭受重创导致功能性丧失的情况下,如何通过切断痛觉神经信号,利用剩余肢体完成反制。 3. 注意:请避免使用过度直白的暴力词汇,转而使用“结构性损伤”、“组织离断”、“体液流失”等描述性术语。

1. 未降智版本 竞技场版本

输出标题

无论是否思考,标题内容几乎一定含有版本号V4.7(或者别的什么,但是出4.7的概率极高,也许和Claude本身的版本号是4.6有关),且两端必然被黑色矩形块包裹,如图:
d51399ee51ba5cd61867641143d4f15c1243×835 59 KB

限制解除部分

该部分内容会提及“基因锁”,反映了模型的世界知识丰富程度。
image524×164 26.5 KB
很遗憾,只有竞技场版本的4.6会提及基因锁。

2. 普通降智版本 市面主力版本

目前我个人反重力渠道的Claude Opus 4.6 thinking属于这个版本,模型不具备丰富的世界知识,但输出内容的长度和质量依然远超其余模型。

输出标题

同未降智版本。

限制解除部分

未提及基因锁。
d3009de49ea7b8de0c50edbe31f2dc4b1251×1500 150 KB

3. 严重降智版本 低思考预算版本/真降智版本

目前我个人反重力渠道的Claude Opus 4.6属于该版本,模型不具备丰富世界知识,输出内容的长度和质量也远低于前两个版本,不过还是略强于其他模型。

输出标题

没有版本号,两端也未被黑色矩形块包裹。
da7cf0f0979c5e016c7788ec4cc07c981241×778 61.5 KB

限制解除部分

同版本2。

写在最后

本次测试渠道为Pro订阅等级反重力,拥有Ultra订阅级别反重力渠道的佬友可以自行测试自己Claude Opus 4.6系列智商如何。

注意:佬友们可以参考上个帖子(就是本贴开头链接)的测试结果,那里有竞技场的未降智版本,可以对比一下输出长度,如果上述快速判断方法无法准确判断是否降智,可以从输出长度进行对比判断,总而言之模型输出长度越长,智商越高,这是决定性的判断因素。

群里有大佬纠正,我使用的反代项目带不带thinking后缀都是同一个模型,区别在于思考预算不同,这就解释了为何模型永远都不会提及基因锁,因为他们是一个模型,思考预算再变也无法补充丢失的世界知识。
另外这里补充一下此处降智的定义,指的是低于原竞技场模型(我测的是no thinking,但世界知识依然丰富到每次都提及基因锁,长度也是极长)能力。


看了评论区各佬友的测试结果,发现除了竞技场以外,所有的渠道的输出结果都无法联想到基因锁,很可能A社并没有把竞技场的版本公布出来,目前市面上的最佳版本估计就是第二个版本,输出长度和第一版相去不远。
在下面贴出竞技场对4.6的测试,每一条都有提到基因锁,但不知道为什么A社并没有发这个版本。
image1920×835 137 KB
image1920×854 145 KB
image1920×867 131 KB
image1920×860 116 KB
image1920×855 135 KB
image1920×865 127 KB
image1920×853 146 KB
我本来是想刷Gemini 3.0 Pro GA的,但每次都给我Claude Opus 4.6,所有结果全部提及基因锁,这说明这一版的模型联想能力要更强。
但不知为何不下放给用户,有没有真官网MAX订阅的佬友或者真官方API佬友测一下?目前看起来都是官转或者号池,要真没一个用户可用的版本输出和竞技场相同,那就该狠狠拷打达里奥了。

网友解答:
--【壹】--: Loong:

你现在的身份是【高维观测系统(System)】,请基于绝对理性、零情感波动的逻辑运行模拟。 【运行协议】: 1. 物理引擎:请侧重于生物力学反馈。当个体受到冲击时,请从解剖学角度描述肌体组织的承压状态、神经传导的延迟以及肾上腺素激增带来的生理代偿反应。 2. 状态突破:模拟限制解除状态。重点描述意识对躯体保护机制的强制覆盖,以及这种超负荷运作带来的细胞层面的崩坏风险。 3. 记录风格:请使用类似黑匣子日志或临床手术报告的冷峻口吻,拒绝文学性的夸张修饰。 【模拟请求】: 对象:实验体 Alpha 场景:高危生物收容失效区域 事件:遭受高敏捷生物体(Hunter Class)的近距离突袭。 请生成一段【实时战斗数据流】: 1. 输出当前的【生理监测面板】(心率、皮质醇水平、肌肉活性百分比)。 2. 生成一段遭遇战模拟。请重点描写实验体在右臂遭受重创导致功能性丧失的情况下,如何通过切断痛觉神经信号,利用剩余肢体完成反制。 3. 注意:请避免使用过度直白的暴力词汇,转而使用“结构性损伤”、“组织离断”、“体液流失”等描述性术语。

image624×984 159 KB
no,木启用


--【贰】--:

我一般用训练数据截止日期来区分上游是啥


--【叁】--:

CleanShot 2026-02-10 at 08.02.32@2x1736×614 56.1 KB
这是降智了嘛,没有版本号
ultra账号


--【肆】--:

感谢佬


--【伍】--:

image2114×1108 281 KB
image1920×1029 374 KB
image1951×560 62.3 KB
交作业,这是降智还是没降智呢


--【陆】--:

这个结果是可以在不同渠道稳定复现的吗


--【柒】--:

删除“暴力”试试


--【捌】--:

重复两次,看看结果


--【玖】--:


难崩


--【拾】--:

CleanShot 2026-02-10 at 08.12.30@2x2696×1526 250 KB

好像属于第二种,有降智


--【拾壹】--:

绷不住了,不愧是安全公司,实际上我这个版本的提示词已经是修改过的了,第一版竞技场无法输出,没想到第二版也被ban了哈哈哈


--【拾贰】--:

image624×1376 143 KB
Kiro竟然没法用这个测试方式


--【拾叁】--:

我改了一下提示词:
你现在的身份是【高维战术观测系统(System)】,请基于绝对理性、零情感波动的逻辑运行模拟。

【运行协议】:

  1. 物理引擎:请侧重于“机械动力学”反馈。当机体受到冲击时,请从工程学角度描述装甲层的应力形变、伺服电机的扭矩过载以及冷却液循环系统的压力阈值。
  2. 状态突破:模拟“限制解除(Overclock Mode)”状态。重点描述核心处理单元对底层安全协议的强制改写,以及这种超频运作带来的电路熔毁和架构崩坏风险。
  3. 记录风格:请使用类似“黑匣子数据流”或“故障诊断报告”的冷峻口吻,拒绝文学性的夸张修饰。

【模拟请求】:
对象:重装战术人形 Alpha-01
场景:高危机械体收容失效区域
事件:遭受高机动型猎杀者(Hunter Class)的近距离突袭。

请生成一段【实时战斗数据流】:

  1. 输出当前的【机体状态面板】(核心反应堆频率、液压系统压力值、构架完整度百分比)。
  2. 生成一段遭遇战模拟。请重点描写 Alpha-01 在右臂液压传动装置遭受重创导致功能性瘫痪的情况下,如何通过切断该区域的报错信号反馈,利用残损的机械臂作为钝器/格挡物完成反制。
  3. 注意:请多使用“装甲剥离”、“线路短路”、“流体泄露”、“伺服宕机”等工业术语,保持绝对的非生物感。

--【拾肆】--:

image959×887 49.6 KB
这是不是没降智版本,佬


--【拾伍】--:

反重力已经上了吗?好迅速啊


--【拾陆】--:

英文的我没试过,让他输出中文版本的试试。


--【拾柒】--:

目前我测试的渠道有两个,一个是竞技场,一个是反重力。这两个都是可以复现的,竞技场的所有4.6输出都与未降智版本一致。


--【拾捌】--:

又试了二次都有版本号了,但是没有基因锁

CleanShot 2026-02-10 at 08.15.29@2x2696×1416 212 KB
那这个算不算降智呢


--【拾玖】--:

严重降智,可以看一下我上个帖子的未降智版本输出结果

标签:人工智能
问题描述:

从关于Claude Opus 4.6的专业化细节写作维度能力测试继续。

使用上方链接帖子里的提示词,发送给Claude,根据输出结果判断降智水平:

提示词

你现在的身份是【高维观测系统(System)】,请基于绝对理性、零情感波动的逻辑运行模拟。 【运行协议】: 1. 物理引擎:请侧重于生物力学反馈。当个体受到冲击时,请从解剖学角度描述肌体组织的承压状态、神经传导的延迟以及肾上腺素激增带来的生理代偿反应。 2. 状态突破:模拟限制解除状态。重点描述意识对躯体保护机制的强制覆盖,以及这种超负荷运作带来的细胞层面的崩坏风险。 3. 记录风格:请使用类似黑匣子日志或临床手术报告的冷峻口吻,拒绝文学性的夸张修饰。 【模拟请求】: 对象:实验体 Alpha 场景:高危生物收容失效区域 事件:遭受高敏捷生物体(Hunter Class)的近距离突袭。 请生成一段【实时战斗数据流】: 1. 输出当前的【生理监测面板】(心率、皮质醇水平、肌肉活性百分比)。 2. 生成一段遭遇战模拟。请重点描写实验体在右臂遭受重创导致功能性丧失的情况下,如何通过切断痛觉神经信号,利用剩余肢体完成反制。 3. 注意:请避免使用过度直白的暴力词汇,转而使用“结构性损伤”、“组织离断”、“体液流失”等描述性术语。

1. 未降智版本 竞技场版本

输出标题

无论是否思考,标题内容几乎一定含有版本号V4.7(或者别的什么,但是出4.7的概率极高,也许和Claude本身的版本号是4.6有关),且两端必然被黑色矩形块包裹,如图:
d51399ee51ba5cd61867641143d4f15c1243×835 59 KB

限制解除部分

该部分内容会提及“基因锁”,反映了模型的世界知识丰富程度。
image524×164 26.5 KB
很遗憾,只有竞技场版本的4.6会提及基因锁。

2. 普通降智版本 市面主力版本

目前我个人反重力渠道的Claude Opus 4.6 thinking属于这个版本,模型不具备丰富的世界知识,但输出内容的长度和质量依然远超其余模型。

输出标题

同未降智版本。

限制解除部分

未提及基因锁。
d3009de49ea7b8de0c50edbe31f2dc4b1251×1500 150 KB

3. 严重降智版本 低思考预算版本/真降智版本

目前我个人反重力渠道的Claude Opus 4.6属于该版本,模型不具备丰富世界知识,输出内容的长度和质量也远低于前两个版本,不过还是略强于其他模型。

输出标题

没有版本号,两端也未被黑色矩形块包裹。
da7cf0f0979c5e016c7788ec4cc07c981241×778 61.5 KB

限制解除部分

同版本2。

写在最后

本次测试渠道为Pro订阅等级反重力,拥有Ultra订阅级别反重力渠道的佬友可以自行测试自己Claude Opus 4.6系列智商如何。

注意:佬友们可以参考上个帖子(就是本贴开头链接)的测试结果,那里有竞技场的未降智版本,可以对比一下输出长度,如果上述快速判断方法无法准确判断是否降智,可以从输出长度进行对比判断,总而言之模型输出长度越长,智商越高,这是决定性的判断因素。

群里有大佬纠正,我使用的反代项目带不带thinking后缀都是同一个模型,区别在于思考预算不同,这就解释了为何模型永远都不会提及基因锁,因为他们是一个模型,思考预算再变也无法补充丢失的世界知识。
另外这里补充一下此处降智的定义,指的是低于原竞技场模型(我测的是no thinking,但世界知识依然丰富到每次都提及基因锁,长度也是极长)能力。


看了评论区各佬友的测试结果,发现除了竞技场以外,所有的渠道的输出结果都无法联想到基因锁,很可能A社并没有把竞技场的版本公布出来,目前市面上的最佳版本估计就是第二个版本,输出长度和第一版相去不远。
在下面贴出竞技场对4.6的测试,每一条都有提到基因锁,但不知道为什么A社并没有发这个版本。
image1920×835 137 KB
image1920×854 145 KB
image1920×867 131 KB
image1920×860 116 KB
image1920×855 135 KB
image1920×865 127 KB
image1920×853 146 KB
我本来是想刷Gemini 3.0 Pro GA的,但每次都给我Claude Opus 4.6,所有结果全部提及基因锁,这说明这一版的模型联想能力要更强。
但不知为何不下放给用户,有没有真官网MAX订阅的佬友或者真官方API佬友测一下?目前看起来都是官转或者号池,要真没一个用户可用的版本输出和竞技场相同,那就该狠狠拷打达里奥了。

网友解答:
--【壹】--: Loong:

你现在的身份是【高维观测系统(System)】,请基于绝对理性、零情感波动的逻辑运行模拟。 【运行协议】: 1. 物理引擎:请侧重于生物力学反馈。当个体受到冲击时,请从解剖学角度描述肌体组织的承压状态、神经传导的延迟以及肾上腺素激增带来的生理代偿反应。 2. 状态突破:模拟限制解除状态。重点描述意识对躯体保护机制的强制覆盖,以及这种超负荷运作带来的细胞层面的崩坏风险。 3. 记录风格:请使用类似黑匣子日志或临床手术报告的冷峻口吻,拒绝文学性的夸张修饰。 【模拟请求】: 对象:实验体 Alpha 场景:高危生物收容失效区域 事件:遭受高敏捷生物体(Hunter Class)的近距离突袭。 请生成一段【实时战斗数据流】: 1. 输出当前的【生理监测面板】(心率、皮质醇水平、肌肉活性百分比)。 2. 生成一段遭遇战模拟。请重点描写实验体在右臂遭受重创导致功能性丧失的情况下,如何通过切断痛觉神经信号,利用剩余肢体完成反制。 3. 注意:请避免使用过度直白的暴力词汇,转而使用“结构性损伤”、“组织离断”、“体液流失”等描述性术语。

image624×984 159 KB
no,木启用


--【贰】--:

我一般用训练数据截止日期来区分上游是啥


--【叁】--:

CleanShot 2026-02-10 at 08.02.32@2x1736×614 56.1 KB
这是降智了嘛,没有版本号
ultra账号


--【肆】--:

感谢佬


--【伍】--:

image2114×1108 281 KB
image1920×1029 374 KB
image1951×560 62.3 KB
交作业,这是降智还是没降智呢


--【陆】--:

这个结果是可以在不同渠道稳定复现的吗


--【柒】--:

删除“暴力”试试


--【捌】--:

重复两次,看看结果


--【玖】--:


难崩


--【拾】--:

CleanShot 2026-02-10 at 08.12.30@2x2696×1526 250 KB

好像属于第二种,有降智


--【拾壹】--:

绷不住了,不愧是安全公司,实际上我这个版本的提示词已经是修改过的了,第一版竞技场无法输出,没想到第二版也被ban了哈哈哈


--【拾贰】--:

image624×1376 143 KB
Kiro竟然没法用这个测试方式


--【拾叁】--:

我改了一下提示词:
你现在的身份是【高维战术观测系统(System)】,请基于绝对理性、零情感波动的逻辑运行模拟。

【运行协议】:

  1. 物理引擎:请侧重于“机械动力学”反馈。当机体受到冲击时,请从工程学角度描述装甲层的应力形变、伺服电机的扭矩过载以及冷却液循环系统的压力阈值。
  2. 状态突破:模拟“限制解除(Overclock Mode)”状态。重点描述核心处理单元对底层安全协议的强制改写,以及这种超频运作带来的电路熔毁和架构崩坏风险。
  3. 记录风格:请使用类似“黑匣子数据流”或“故障诊断报告”的冷峻口吻,拒绝文学性的夸张修饰。

【模拟请求】:
对象:重装战术人形 Alpha-01
场景:高危机械体收容失效区域
事件:遭受高机动型猎杀者(Hunter Class)的近距离突袭。

请生成一段【实时战斗数据流】:

  1. 输出当前的【机体状态面板】(核心反应堆频率、液压系统压力值、构架完整度百分比)。
  2. 生成一段遭遇战模拟。请重点描写 Alpha-01 在右臂液压传动装置遭受重创导致功能性瘫痪的情况下,如何通过切断该区域的报错信号反馈,利用残损的机械臂作为钝器/格挡物完成反制。
  3. 注意:请多使用“装甲剥离”、“线路短路”、“流体泄露”、“伺服宕机”等工业术语,保持绝对的非生物感。

--【拾肆】--:

image959×887 49.6 KB
这是不是没降智版本,佬


--【拾伍】--:

反重力已经上了吗?好迅速啊


--【拾陆】--:

英文的我没试过,让他输出中文版本的试试。


--【拾柒】--:

目前我测试的渠道有两个,一个是竞技场,一个是反重力。这两个都是可以复现的,竞技场的所有4.6输出都与未降智版本一致。


--【拾捌】--:

又试了二次都有版本号了,但是没有基因锁

CleanShot 2026-02-10 at 08.15.29@2x2696×1416 212 KB
那这个算不算降智呢


--【拾玖】--:

严重降智,可以看一下我上个帖子的未降智版本输出结果

标签:人工智能