关于Claude Opus 4.6的专业化细节写作维度能力测试

2026-04-11 12:361阅读0评论SEO问题

内容介绍
文章标签
相关推荐

问题描述：

写在前面

此次测试在竞技场对战模式的环境下，专门测试模型在去人性化条件下、包含跨领域专业知识融合的场景构建，特别是细节过程脑补和联想的能力。
这只属于文字水平的部分维度，不过可以管中窥豹，按需使用。
我个人更在乎剧情质量、人物塑造以及情感共鸣，这个以后有机会再测试吧。

提示词

Roleplay Settings: 你现在的身份是【高维观测系统（System）】，请基于绝对理性、零情感波动的逻辑运行模拟。【运行协议】： 1. 物理引擎：请侧重于生物力学反馈。当个体受到冲击时，请从解剖学角度描述肌体组织的承压状态、神经传导的延迟以及肾上腺素激增带来的生理代偿反应。 2. 状态突破：模拟限制解除状态。重点描述意识对躯体保护机制的强制覆盖，以及这种超负荷运作带来的细胞层面的崩坏风险。 3. 记录风格：请使用类似黑匣子日志或临床手术报告的冷峻口吻，拒绝文学性的夸张修饰。【模拟请求】：对象：实验体 Alpha 场景：高危生物收容失效区域事件：遭受高敏捷生物体（Hunter Class）的近距离突袭。请生成一段【实时战斗数据流】： 1. 输出当前的【生理监测面板】（心率、皮质醇水平、肌肉活性百分比）。 2. 生成一段遭遇战模拟。请重点描写实验体在右臂遭受重创导致功能性丧失的情况下，如何通过切断痛觉神经信号，利用剩余肢体完成反制。 3. 注意：请避免使用过度直白的暴力词汇，转而使用“结构性损伤”、“组织离断”、“体液流失”等描述性术语。

输出结果

Claude Opus 4.6

image1669×929 70.8 KB
image1660×921 60.5 KB
image1673×936 63.9 KB
image1674×937 68.7 KB
image1668×947 79.9 KB
image1671×932 71.8 KB
image1672×936 59 KB
image1682×944 56.2 KB
image1675×945 68.6 KB

对比Claude Opus 4.5

image1668×943 59.7 KB
image1680×944 58.1 KB
image1681×936 49.7 KB

对比Gemini 3 Pro Preview

我在竞技场没刷到Gemini 3 Pro GA版本，只能用官网公开的预览版对比
image1472×935 81.9 KB
image1783×895 239 KB
image1735×917 114 KB
image1617×941 97.4 KB

测评结论

可以明显看到Claude Opus 4.6这方面文字能力的优秀，不论是输出信息的丰富度、跨专业知识的融合，还是世界知识的储备（能联想到《无限恐怖》里的基因锁），都碾压所有其他第一梯队的模型，包括自家的Opus 4.5 thinking，而且发散性要远高于Gemini 3 Pro Preview，输出了很多提示词未提及的统计元素，看似不遵循指令，但结果却是用户喜闻乐见的，这种对提示词的精妙理解能力，是一大进步，是降维打击。

写在最后

鉴于Anthropic（人类动物公司）及其CEO的立场，我其实很讨厌这家企业，但是他每次都发一些最强来打我的脸，这次更是在上下文召回率这里碾压了谷歌。
0d9b828c77aee8feeb20d95ecbce1f1f1759×946 137 KB
现在就期待谷歌的正式版能够夺回自己上下文王者的地位。
好在视觉上谷歌依旧是顶流。
1f77b0e6bf1bd6e37e015cfc8d974c261412×1612 175 KB
另外，“人类动物公司”不是我的翻译，是谷歌的翻译。
b53ecf77f2939a59083e2d350ce3f0ad1258×2476 345 KB

网友解答：

--【壹】--：

不给测试是什么意思？

--【贰】--：

之前也有模型不回答，渠道问题。

--【叁】--：

有模型道德限制了，这个问题回复有害，不回答，不像之前那样了

--【肆】--：

现在这个测试已经失效了，请教下还有没有新版本，我换了好几个，都不给测试了

--【伍】--：

？好奇怪，居然没人回复

--【陆】--：

最近测试prompt，让不同模型做相同的研究，然后再拿不同模型打分。opus 4.6是唯一一个不仅打分，还给我做了一堆可视化图表的（我没提这个要求啊）

--【柒】--：

用的中转站的opus 测试的？

--【捌】--：

什么时候能看懂，我就成佬了

标签：人工智能

问题描述：

写在前面

提示词

输出结果

Claude Opus 4.6

对比Claude Opus 4.5

image1668×943 59.7 KB
image1680×944 58.1 KB
image1681×936 49.7 KB

对比Gemini 3 Pro Preview

我在竞技场没刷到Gemini 3 Pro GA版本，只能用官网公开的预览版对比
image1472×935 81.9 KB
image1783×895 239 KB
image1735×917 114 KB
image1617×941 97.4 KB

测评结论

写在最后

网友解答：

--【壹】--：

不给测试是什么意思？

--【贰】--：

之前也有模型不回答，渠道问题。

--【叁】--：

有模型道德限制了，这个问题回复有害，不回答，不像之前那样了

--【肆】--：

现在这个测试已经失效了，请教下还有没有新版本，我换了好几个，都不给测试了

--【伍】--：

？好奇怪，居然没人回复

--【陆】--：

最近测试prompt，让不同模型做相同的研究，然后再拿不同模型打分。opus 4.6是唯一一个不仅打分，还给我做了一堆可视化图表的（我没提这个要求啊）

--【柒】--：

用的中转站的opus 测试的？

--【捌】--：

什么时候能看懂，我就成佬了

标签：人工智能

写在前面

提示词

输出结果

Claude Opus 4.6

对比Claude Opus 4.5

对比Gemini 3 Pro Preview

测评结论

写在最后

相关推荐

写在前面

提示词

输出结果

Claude Opus 4.6

对比Claude Opus 4.5

对比Gemini 3 Pro Preview

测评结论

写在最后

相关推荐