将来最好用的 LLM 是懂得角色扮演的 LLM
- 内容介绍
- 文章标签
- 相关推荐
突然有感而发,抛砖引玉
首先问一个问题:为什么大家都喜欢和 Claude 聊天而不是 GPT?
我觉得核心原因就一个字——懂。Claude 更懂你在说什么、想要什么、甚至没说出口的那部分意图。这个能力,放到开发场景里,价值会被放大十倍。
最近开发的时候我用了一个工作流:用 Claude Code 做主 Agent,指挥 Codex 干活。
效果出奇地好,解决了一个让我头疼很久的问题——Codex 执行任务时经常中断、跑偏、理解错需求。但当 Claude Code 作为中间层介入之后,这些问题几乎消失了。
为什么?因为 Claude Code 真的更懂用户。给它适当的提示词之后,它几乎就是复制出了一个"你"的人格,然后用你的思维方式去拆解任务、分配给 Codex。Codex 拿到的不再是模糊的用户需求,而是一份经过"翻译"的、具体的任务明细。
我们换个角度想这件事:
如果你是一个非常擅长开发的人,只能用 Codex,你能不能把活干好?当然可以。因为你知道怎么把需求拆成明确的任务描述,Codex 拿到这种级别的指令,执行力是很强的。
问题出在哪? 出在大多数时候,我们的需求本身就是模糊的。我们脑子里有个大概的方向,但还没细化到可以直接交给执行层的程度。这时候 Codex 就懵了——它是个优秀的执行者,但不是一个好的需求分析师。
所以你需要一个中间角色:一个能模拟用户思维的主 Agent,它能跟你"同频",理解你真正想要的东西,然后把模糊需求翻译成精确指令,再交给执行层去跑。
Claude Code 恰好就能扮演这个角色。
这也是为什么我说,将来最好用的 LLM,一定是最懂角色扮演的 LLM。
角色扮演不是什么花哨的功能,它的本质是共情能力 + 上下文建模。一个能真正"扮演"用户的模型,意味着它能:
- 理解你没说清楚的部分
- 用你的思维方式去拆解问题
- 像你一样去指挥其他工具和 Agent
这不就是最理想的 AI 协作方式吗?你负责方向,主 Agent 负责理解和翻译,执行 Agent 负责落地。一个三层架构,干净利落。
未来的开发范式,可能不是人直接指挥一群 Agent,而是人调教好一个懂自己的主 Agent,让它去指挥其他 Agent。
你要做的,只是找到那个最懂你的。
网友解答:--【壹】--:
我也觉得,通人性这一块还是gemini,但是目前的 Gemini 3 pro有一个问题,就是提示词遵循度不是很好,太依赖 Zero Shot 了
--【贰】--:
这是必然的,而且应该就会在2026年和2027年完成
人类应该在有更多创造性的岗位发挥作用–没错,创造性很重要
--【叁】--:
真到了那一步
那感觉,这个岗位上有没有我好像也没差了呀
整个公司里,大部分都可以替换成虚拟员工
--【肆】--:
我特别喜欢claude code的主动提问,而codex往往就是直接闷头干,最后干出一坨我根本不想要的东西
--【伍】--:
小白问一下佬们,这里提到的Claude Code用的model也是Claude家的吗?还是说用Claude Code,接入GPT的model效果也比codex强?
--【陆】--:
是一个skill,之前论坛的佬友发的,我按照我的需求改良了,这种工具一抓一大把,重要的是改造成适合自己的
--【柒】--:
等gemini的编程能力上去了,claude就不好说了。
另外佬友可以了解下CCB CCG,在码力和人味不可兼得的时候,多模型协作可能才是最优解
--【捌】--:
我用ccg最大的问题在于主流程我是用的superpowers,两个工作流有时候会打架
只能强行指定一下
--【玖】--:
共情能力,怎麽做?有没有好的方法,虽然给agent约束各种提示词,但是要达到想要的人设,还是很难达成。
--【拾】--:
请详细讲一下 用 Claude Code 做主 Agent,指挥 Codex 干活 这部分,佬目前用的具体是哪种方案或者框架。基于当前Claude和Codex的能力和特点,这是最理想的工作流程。
--【拾壹】--:
谢谢佬,请问下claude模型现在是不是只能找中转 或 找卡去官方开两种方式?
--【拾贰】--:
我觉得claude很懂需求,领悟业务很快 输出信息准确
--【拾叁】--:
目前这个阶段的话,我只建议去开官方的,然后自己用,用旁路由或者什么的都挺稳的,只要是自己用基本上不会有太大的问题,千万不要分发
用一张国内的信用卡绑 Google Play,然后用 Google 的订阅,虽然要交25%的谷歌税,但是好在比较稳定
现在中转站都巨贵,用起来束手束脚的,根本不尽兴
--【拾肆】--:
和中文语料也有关系,就比如 gemini2.5pro 是除了 opus 以外最好的 rp 模型
--【拾伍】--:
特指 claude 模型,所以标题用了"llm"的描述
这个主要还是模型的区别,工具的区别虽然也有,但是不是主要问题
--【拾陆】--:
太对了 程序员有时候接到的需求就是模糊的 还有太多可发散思维的skill可用了~
--【拾柒】--:
通过花精力调教一个数字分身来提效,很有趣的想法
--【拾捌】--: zzmk:
你要做的,只是找到那个最懂你的。
这话肯定不是单单在说AI;但是最近CC降智太厉害了,已经不是最懂我的那个了
--【拾玖】--:
老实说claude的开发能力真的远远不如codex,让它写代码我老是想骂人,但是和它聊天真的很舒服,codex则是另一个极端
突然有感而发,抛砖引玉
首先问一个问题:为什么大家都喜欢和 Claude 聊天而不是 GPT?
我觉得核心原因就一个字——懂。Claude 更懂你在说什么、想要什么、甚至没说出口的那部分意图。这个能力,放到开发场景里,价值会被放大十倍。
最近开发的时候我用了一个工作流:用 Claude Code 做主 Agent,指挥 Codex 干活。
效果出奇地好,解决了一个让我头疼很久的问题——Codex 执行任务时经常中断、跑偏、理解错需求。但当 Claude Code 作为中间层介入之后,这些问题几乎消失了。
为什么?因为 Claude Code 真的更懂用户。给它适当的提示词之后,它几乎就是复制出了一个"你"的人格,然后用你的思维方式去拆解任务、分配给 Codex。Codex 拿到的不再是模糊的用户需求,而是一份经过"翻译"的、具体的任务明细。
我们换个角度想这件事:
如果你是一个非常擅长开发的人,只能用 Codex,你能不能把活干好?当然可以。因为你知道怎么把需求拆成明确的任务描述,Codex 拿到这种级别的指令,执行力是很强的。
问题出在哪? 出在大多数时候,我们的需求本身就是模糊的。我们脑子里有个大概的方向,但还没细化到可以直接交给执行层的程度。这时候 Codex 就懵了——它是个优秀的执行者,但不是一个好的需求分析师。
所以你需要一个中间角色:一个能模拟用户思维的主 Agent,它能跟你"同频",理解你真正想要的东西,然后把模糊需求翻译成精确指令,再交给执行层去跑。
Claude Code 恰好就能扮演这个角色。
这也是为什么我说,将来最好用的 LLM,一定是最懂角色扮演的 LLM。
角色扮演不是什么花哨的功能,它的本质是共情能力 + 上下文建模。一个能真正"扮演"用户的模型,意味着它能:
- 理解你没说清楚的部分
- 用你的思维方式去拆解问题
- 像你一样去指挥其他工具和 Agent
这不就是最理想的 AI 协作方式吗?你负责方向,主 Agent 负责理解和翻译,执行 Agent 负责落地。一个三层架构,干净利落。
未来的开发范式,可能不是人直接指挥一群 Agent,而是人调教好一个懂自己的主 Agent,让它去指挥其他 Agent。
你要做的,只是找到那个最懂你的。
网友解答:--【壹】--:
我也觉得,通人性这一块还是gemini,但是目前的 Gemini 3 pro有一个问题,就是提示词遵循度不是很好,太依赖 Zero Shot 了
--【贰】--:
这是必然的,而且应该就会在2026年和2027年完成
人类应该在有更多创造性的岗位发挥作用–没错,创造性很重要
--【叁】--:
真到了那一步
那感觉,这个岗位上有没有我好像也没差了呀
整个公司里,大部分都可以替换成虚拟员工
--【肆】--:
我特别喜欢claude code的主动提问,而codex往往就是直接闷头干,最后干出一坨我根本不想要的东西
--【伍】--:
小白问一下佬们,这里提到的Claude Code用的model也是Claude家的吗?还是说用Claude Code,接入GPT的model效果也比codex强?
--【陆】--:
是一个skill,之前论坛的佬友发的,我按照我的需求改良了,这种工具一抓一大把,重要的是改造成适合自己的
--【柒】--:
等gemini的编程能力上去了,claude就不好说了。
另外佬友可以了解下CCB CCG,在码力和人味不可兼得的时候,多模型协作可能才是最优解
--【捌】--:
我用ccg最大的问题在于主流程我是用的superpowers,两个工作流有时候会打架
只能强行指定一下
--【玖】--:
共情能力,怎麽做?有没有好的方法,虽然给agent约束各种提示词,但是要达到想要的人设,还是很难达成。
--【拾】--:
请详细讲一下 用 Claude Code 做主 Agent,指挥 Codex 干活 这部分,佬目前用的具体是哪种方案或者框架。基于当前Claude和Codex的能力和特点,这是最理想的工作流程。
--【拾壹】--:
谢谢佬,请问下claude模型现在是不是只能找中转 或 找卡去官方开两种方式?
--【拾贰】--:
我觉得claude很懂需求,领悟业务很快 输出信息准确
--【拾叁】--:
目前这个阶段的话,我只建议去开官方的,然后自己用,用旁路由或者什么的都挺稳的,只要是自己用基本上不会有太大的问题,千万不要分发
用一张国内的信用卡绑 Google Play,然后用 Google 的订阅,虽然要交25%的谷歌税,但是好在比较稳定
现在中转站都巨贵,用起来束手束脚的,根本不尽兴
--【拾肆】--:
和中文语料也有关系,就比如 gemini2.5pro 是除了 opus 以外最好的 rp 模型
--【拾伍】--:
特指 claude 模型,所以标题用了"llm"的描述
这个主要还是模型的区别,工具的区别虽然也有,但是不是主要问题
--【拾陆】--:
太对了 程序员有时候接到的需求就是模糊的 还有太多可发散思维的skill可用了~
--【拾柒】--:
通过花精力调教一个数字分身来提效,很有趣的想法
--【拾捌】--: zzmk:
你要做的,只是找到那个最懂你的。
这话肯定不是单单在说AI;但是最近CC降智太厉害了,已经不是最懂我的那个了
--【拾玖】--:
老实说claude的开发能力真的远远不如codex,让它写代码我老是想骂人,但是和它聊天真的很舒服,codex则是另一个极端

