将来最好用的 LLM 是懂得角色扮演的 LLM

2026-04-13 12:571阅读0评论SEO问题

内容介绍
文章标签
相关推荐

问题描述：

突然有感而发，抛砖引玉

首先问一个问题：为什么大家都喜欢和 Claude 聊天而不是 GPT？

我觉得核心原因就一个字——懂。Claude 更懂你在说什么、想要什么、甚至没说出口的那部分意图。这个能力，放到开发场景里，价值会被放大十倍。

最近开发的时候我用了一个工作流：用 Claude Code 做主 Agent，指挥 Codex 干活。

效果出奇地好，解决了一个让我头疼很久的问题——Codex 执行任务时经常中断、跑偏、理解错需求。但当 Claude Code 作为中间层介入之后，这些问题几乎消失了。

为什么？因为 Claude Code 真的更懂用户。给它适当的提示词之后，它几乎就是复制出了一个"你"的人格，然后用你的思维方式去拆解任务、分配给 Codex。Codex 拿到的不再是模糊的用户需求，而是一份经过"翻译"的、具体的任务明细。

我们换个角度想这件事：

如果你是一个非常擅长开发的人，只能用 Codex，你能不能把活干好？当然可以。因为你知道怎么把需求拆成明确的任务描述，Codex 拿到这种级别的指令，执行力是很强的。

问题出在哪？ 出在大多数时候，我们的需求本身就是模糊的。我们脑子里有个大概的方向，但还没细化到可以直接交给执行层的程度。这时候 Codex 就懵了——它是个优秀的执行者，但不是一个好的需求分析师。

所以你需要一个中间角色：一个能模拟用户思维的主 Agent，它能跟你"同频"，理解你真正想要的东西，然后把模糊需求翻译成精确指令，再交给执行层去跑。

Claude Code 恰好就能扮演这个角色。

这也是为什么我说，将来最好用的 LLM，一定是最懂角色扮演的 LLM。

角色扮演不是什么花哨的功能，它的本质是共情能力 + 上下文建模。一个能真正"扮演"用户的模型，意味着它能：

理解你没说清楚的部分
用你的思维方式去拆解问题
像你一样去指挥其他工具和 Agent

这不就是最理想的 AI 协作方式吗？你负责方向，主 Agent 负责理解和翻译，执行 Agent 负责落地。一个三层架构，干净利落。

未来的开发范式，可能不是人直接指挥一群 Agent，而是人调教好一个懂自己的主 Agent，让它去指挥其他 Agent。

你要做的，只是找到那个最懂你的。

网友解答：

--【壹】--：

我也觉得,通人性这一块还是gemini,但是目前的 Gemini 3 pro有一个问题,就是提示词遵循度不是很好,太依赖 Zero Shot 了

--【贰】--：

这是必然的，而且应该就会在2026年和2027年完成

人类应该在有更多创造性的岗位发挥作用–没错，创造性很重要

--【叁】--：

真到了那一步
那感觉，这个岗位上有没有我好像也没差了呀
整个公司里，大部分都可以替换成虚拟员工

--【肆】--：

我特别喜欢claude code的主动提问,而codex往往就是直接闷头干,最后干出一坨我根本不想要的东西

--【伍】--：

小白问一下佬们，这里提到的Claude Code用的model也是Claude家的吗？还是说用Claude Code，接入GPT的model效果也比codex强？

--【陆】--：

是一个skill,之前论坛的佬友发的,我按照我的需求改良了,这种工具一抓一大把，重要的是改造成适合自己的

--【柒】--：

等gemini的编程能力上去了，claude就不好说了。
另外佬友可以了解下CCB CCG，在码力和人味不可兼得的时候，多模型协作可能才是最优解

--【捌】--：

我用ccg最大的问题在于主流程我是用的superpowers，两个工作流有时候会打架
只能强行指定一下

--【玖】--：

共情能力，怎麽做？有没有好的方法，虽然给agent约束各种提示词，但是要达到想要的人设，还是很难达成。

--【拾】--：

请详细讲一下 用 Claude Code 做主 Agent，指挥 Codex 干活 这部分，佬目前用的具体是哪种方案或者框架。基于当前Claude和Codex的能力和特点，这是最理想的工作流程。

--【拾壹】--：

谢谢佬，请问下claude模型现在是不是只能找中转或找卡去官方开两种方式？

--【拾贰】--：

我觉得claude很懂需求，领悟业务很快输出信息准确

--【拾叁】--：

目前这个阶段的话，我只建议去开官方的,然后自己用,用旁路由或者什么的都挺稳的,只要是自己用基本上不会有太大的问题,千万不要分发

用一张国内的信用卡绑 Google Play，然后用 Google 的订阅,虽然要交25%的谷歌税，但是好在比较稳定

现在中转站都巨贵,用起来束手束脚的,根本不尽兴

--【拾肆】--：

和中文语料也有关系，就比如 gemini2.5pro 是除了 opus 以外最好的 rp 模型

--【拾伍】--：

特指 claude 模型,所以标题用了"llm"的描述

这个主要还是模型的区别，工具的区别虽然也有，但是不是主要问题

--【拾陆】--：

太对了程序员有时候接到的需求就是模糊的还有太多可发散思维的skill可用了~

--【拾柒】--：

通过花精力调教一个数字分身来提效，很有趣的想法

--【拾捌】--： zzmk:

你要做的，只是找到那个最懂你的。

这话肯定不是单单在说AI；但是最近CC降智太厉害了，已经不是最懂我的那个了

--【拾玖】--：

老实说claude的开发能力真的远远不如codex,让它写代码我老是想骂人,但是和它聊天真的很舒服,codex则是另一个极端

标签：病友人工智能

问题描述：

突然有感而发，抛砖引玉

首先问一个问题：为什么大家都喜欢和 Claude 聊天而不是 GPT？

我觉得核心原因就一个字——懂。Claude 更懂你在说什么、想要什么、甚至没说出口的那部分意图。这个能力，放到开发场景里，价值会被放大十倍。

最近开发的时候我用了一个工作流：用 Claude Code 做主 Agent，指挥 Codex 干活。

我们换个角度想这件事：

Claude Code 恰好就能扮演这个角色。

这也是为什么我说，将来最好用的 LLM，一定是最懂角色扮演的 LLM。

角色扮演不是什么花哨的功能，它的本质是共情能力 + 上下文建模。一个能真正"扮演"用户的模型，意味着它能：

理解你没说清楚的部分
用你的思维方式去拆解问题
像你一样去指挥其他工具和 Agent

这不就是最理想的 AI 协作方式吗？你负责方向，主 Agent 负责理解和翻译，执行 Agent 负责落地。一个三层架构，干净利落。

未来的开发范式，可能不是人直接指挥一群 Agent，而是人调教好一个懂自己的主 Agent，让它去指挥其他 Agent。

你要做的，只是找到那个最懂你的。

网友解答：

--【壹】--：

我也觉得,通人性这一块还是gemini,但是目前的 Gemini 3 pro有一个问题,就是提示词遵循度不是很好,太依赖 Zero Shot 了

--【贰】--：

这是必然的，而且应该就会在2026年和2027年完成

人类应该在有更多创造性的岗位发挥作用–没错，创造性很重要

--【叁】--：

真到了那一步
那感觉，这个岗位上有没有我好像也没差了呀
整个公司里，大部分都可以替换成虚拟员工

--【肆】--：

我特别喜欢claude code的主动提问,而codex往往就是直接闷头干,最后干出一坨我根本不想要的东西

--【伍】--：

小白问一下佬们，这里提到的Claude Code用的model也是Claude家的吗？还是说用Claude Code，接入GPT的model效果也比codex强？

--【陆】--：

是一个skill,之前论坛的佬友发的,我按照我的需求改良了,这种工具一抓一大把，重要的是改造成适合自己的

--【柒】--：

等gemini的编程能力上去了，claude就不好说了。
另外佬友可以了解下CCB CCG，在码力和人味不可兼得的时候，多模型协作可能才是最优解

--【捌】--：

我用ccg最大的问题在于主流程我是用的superpowers，两个工作流有时候会打架
只能强行指定一下

--【玖】--：

共情能力，怎麽做？有没有好的方法，虽然给agent约束各种提示词，但是要达到想要的人设，还是很难达成。

--【拾】--：

--【拾壹】--：

谢谢佬，请问下claude模型现在是不是只能找中转或找卡去官方开两种方式？

--【拾贰】--：

我觉得claude很懂需求，领悟业务很快输出信息准确

--【拾叁】--：

目前这个阶段的话，我只建议去开官方的,然后自己用,用旁路由或者什么的都挺稳的,只要是自己用基本上不会有太大的问题,千万不要分发

用一张国内的信用卡绑 Google Play，然后用 Google 的订阅,虽然要交25%的谷歌税，但是好在比较稳定

现在中转站都巨贵,用起来束手束脚的,根本不尽兴

--【拾肆】--：

和中文语料也有关系，就比如 gemini2.5pro 是除了 opus 以外最好的 rp 模型

--【拾伍】--：

特指 claude 模型,所以标题用了"llm"的描述

这个主要还是模型的区别，工具的区别虽然也有，但是不是主要问题

--【拾陆】--：

太对了程序员有时候接到的需求就是模糊的还有太多可发散思维的skill可用了~

--【拾柒】--：

通过花精力调教一个数字分身来提效，很有趣的想法

--【拾捌】--： zzmk:

你要做的，只是找到那个最懂你的。

这话肯定不是单单在说AI；但是最近CC降智太厉害了，已经不是最懂我的那个了

--【拾玖】--：

老实说claude的开发能力真的远远不如codex,让它写代码我老是想骂人,但是和它聊天真的很舒服,codex则是另一个极端

标签：病友人工智能

相关推荐

相关推荐