最近一直在研究如何让codex达到opus的效果
- 内容介绍
- 文章标签
- 相关推荐
用规范指令把 Codex/Gemini 调教成 Opus 的味道——附中转站测试名额
Opus 是真的好用,但贵得离谱,到处开会员扛不住。
写代码一直用 IDE,qcode、Trae、Cursor、VS Code、Antigravity都用过,现在主要在 VS Code 和 Trae 之间来回,这俩都能接自定义 API 中转。于是就开始折腾:怎么在 IDE 里尽量把 Codex 用出 Opus 的感觉。
Codex 让我头疼的几个点
Codex 本身能力不差,但用着就是差口气,主要是这几个问题:
1. 永远在发散,停不下来
“如果你要……下一步可以……”——这个是我最受不了的。几个数据库字段能搞定的事,它能给你扯出几十个方向。任务做完不收手,反复追加建议,越做越大。
2. 分析输出结构乱
Opus 那种从分析到结论、表格、流程整理得清清楚楚的感觉,Codex 基本没有。大段文字糊过来,自己找重点。
3. 指令理解偏差
同样一句话,Opus 能理解到位,Codex 经常差那么一截。理解不到位,后面的最小交付原则也就形同虚设,前两个问题自然就来了。
看过以前帖子的应该知道,我之前分析过 Codex 的规范指令,目标就是想让 Codex、Gemini 尽量向 Opus 的思考方式靠拢。
现在的做法
自己搭了中转站,配合项目规范文件能解决一部分问题。最近换了个新方向:在 API 中转前自己加了一层类似 LiteLLM 的处理逻辑,同时把规范指令文件重新精简了一遍。
自测下来,指令遵循程度大概能到 60%~70% Opus效果左右,用着挺顺手,但因人而异,不同的使用场景效果会有差别。
image901×1150 186 KB
邀请测试,免费提供中转站名额
现在想找人一起测试和提意见,免费提供个人自用中转站月订阅 10 个名额:
- 每日限额:$50
- 每周限额:$300
- 每月限额:$1000
参与要求:
-
主要用 IDE 写代码的优先——这样才有对比感,测试才有意义。需要提供使用过程截图。
-
能认真反馈问题——规范可以继续加,但不保证都能解决,反馈越具体越有价值。
-
严禁在成熟项目或含隐私信息的项目中使用——包括但不限于:生产代码、含密钥的配置、自用 API 等。新建测试项目,这是唯一正确用法。
-
不要白嫖——如果你用的不是 IDE,或者额度消耗极少,我会直接取消订阅。
名额 10 个,满足条件先到先得。因为plus账号目前不多,后续会根据情况补充。
后续想做的几件事
方向有了,能不能跑通还不确定,token 消耗也是个问题,说出来看看大家怎么看:
1. 继续优化全局规范指令
基础盘,持续打磨。
2. 项目规范"自进化"
让指令能在项目开发过程中自动更新规范文件。举个例子:项目里有文件 A 和 B 存在关联,改了 A,AI 能自动知道 B 也要跟着改;新增了功能模块,规范文件里对应补上这个模块的说明和用法。
3. 项目级索引(可能有点鸡肋,但我在用)
我 PHP 项目的做法:生成一个 docs 文件夹,里面记录各模块定义、方法注释、输入输出参数。每次更新关键文件后跑脚本同步,让 AI 始终掌握项目全貌再开发。效果还行,就是维护成本在那里。
有别的想法欢迎说,一起讨论。
暂不考虑开源,现在问题还比较多,搭建流程也麻烦——API 接口不是走 sub2api 那种域名直连,其他组件都要自己搭,很多东西实现得也不确定。
已满已满已满!!!
网友解答:--【壹】--:
参与方式,私信.我会将我的中转站发给你,将账号发给我,给你开通订阅,然后用我发给你的api链接(不要使用中转站api)+key+model名称进行使用
--【贰】--:
感觉还好,参考一下最近 github 流行项目。使用之后感觉挺好的。剩下的架构设计或者需求频繁变动都是我自己的锅
--【叁】--:
对的,私信吧.我将相关信息发给你,先拿来测试.
--【肆】--:
我现在是主力Codex 加一个测试效果!
--【伍】--:
我感觉还好啊,任何大小修改我都让它先给一个方案,我改了方案之后才让它跑
--【陆】--:
能到opus的百分之60就舒服了。我觉得codex还是可以的
--【柒】--:
我也是这样的,就是他输出的内容太发散,然后又长,理解起来有点费脑细胞.稍微压制一下
--【捌】--:
水没关系,我也只是想让他更好用,不代表我写的东西都有用,目前屎山项目几十个.
--【玖】--:
我怎么感觉opus现在反而需要向codex学习呢. 当然除了接住
--【拾】--:
佬 想参与一下 我自建的codex号池 但是codex经常不说人话
--【拾壹】--:
好尝试,mark 了,我一直认为这种行为是模型训练时决定的,靠harness不一定改的了
--【拾贰】--:
佬 加我一个 我重度使用codex 愿意一起参与
--【拾叁】--:
我自己的claude code使用了一个叫paceflow的插件,用的非常顺,最近codex也非常好用,尤其上下文太舒服了,但研究了半天,hook的支持还是有限,没办法用paceflow,成为了我的阻塞。
--【拾肆】--:
重度Codex用户,月均50亿Token,前端后端app都有在使用它来写,报个名!
--【拾伍】--:
已经私信了佬 你看一下 主力codex!
--【拾陆】--:
留给有需要的佬友吧,主要是感觉我自己每天写的项目太水了
--【拾柒】--:
怎么参加测试?私信佬就行了嘛?codex深度使用中
--【拾捌】--:
我私信你了求回复啊,大佬,不知看到没啊哈哈
--【拾玖】--:
能做到一部分,目前自用觉得尚可.完全达到不可能.opus指出chatgpt底层训练逻辑跟他不同.
用规范指令把 Codex/Gemini 调教成 Opus 的味道——附中转站测试名额
Opus 是真的好用,但贵得离谱,到处开会员扛不住。
写代码一直用 IDE,qcode、Trae、Cursor、VS Code、Antigravity都用过,现在主要在 VS Code 和 Trae 之间来回,这俩都能接自定义 API 中转。于是就开始折腾:怎么在 IDE 里尽量把 Codex 用出 Opus 的感觉。
Codex 让我头疼的几个点
Codex 本身能力不差,但用着就是差口气,主要是这几个问题:
1. 永远在发散,停不下来
“如果你要……下一步可以……”——这个是我最受不了的。几个数据库字段能搞定的事,它能给你扯出几十个方向。任务做完不收手,反复追加建议,越做越大。
2. 分析输出结构乱
Opus 那种从分析到结论、表格、流程整理得清清楚楚的感觉,Codex 基本没有。大段文字糊过来,自己找重点。
3. 指令理解偏差
同样一句话,Opus 能理解到位,Codex 经常差那么一截。理解不到位,后面的最小交付原则也就形同虚设,前两个问题自然就来了。
看过以前帖子的应该知道,我之前分析过 Codex 的规范指令,目标就是想让 Codex、Gemini 尽量向 Opus 的思考方式靠拢。
现在的做法
自己搭了中转站,配合项目规范文件能解决一部分问题。最近换了个新方向:在 API 中转前自己加了一层类似 LiteLLM 的处理逻辑,同时把规范指令文件重新精简了一遍。
自测下来,指令遵循程度大概能到 60%~70% Opus效果左右,用着挺顺手,但因人而异,不同的使用场景效果会有差别。
image901×1150 186 KB
邀请测试,免费提供中转站名额
现在想找人一起测试和提意见,免费提供个人自用中转站月订阅 10 个名额:
- 每日限额:$50
- 每周限额:$300
- 每月限额:$1000
参与要求:
-
主要用 IDE 写代码的优先——这样才有对比感,测试才有意义。需要提供使用过程截图。
-
能认真反馈问题——规范可以继续加,但不保证都能解决,反馈越具体越有价值。
-
严禁在成熟项目或含隐私信息的项目中使用——包括但不限于:生产代码、含密钥的配置、自用 API 等。新建测试项目,这是唯一正确用法。
-
不要白嫖——如果你用的不是 IDE,或者额度消耗极少,我会直接取消订阅。
名额 10 个,满足条件先到先得。因为plus账号目前不多,后续会根据情况补充。
后续想做的几件事
方向有了,能不能跑通还不确定,token 消耗也是个问题,说出来看看大家怎么看:
1. 继续优化全局规范指令
基础盘,持续打磨。
2. 项目规范"自进化"
让指令能在项目开发过程中自动更新规范文件。举个例子:项目里有文件 A 和 B 存在关联,改了 A,AI 能自动知道 B 也要跟着改;新增了功能模块,规范文件里对应补上这个模块的说明和用法。
3. 项目级索引(可能有点鸡肋,但我在用)
我 PHP 项目的做法:生成一个 docs 文件夹,里面记录各模块定义、方法注释、输入输出参数。每次更新关键文件后跑脚本同步,让 AI 始终掌握项目全貌再开发。效果还行,就是维护成本在那里。
有别的想法欢迎说,一起讨论。
暂不考虑开源,现在问题还比较多,搭建流程也麻烦——API 接口不是走 sub2api 那种域名直连,其他组件都要自己搭,很多东西实现得也不确定。
已满已满已满!!!
网友解答:--【壹】--:
参与方式,私信.我会将我的中转站发给你,将账号发给我,给你开通订阅,然后用我发给你的api链接(不要使用中转站api)+key+model名称进行使用
--【贰】--:
感觉还好,参考一下最近 github 流行项目。使用之后感觉挺好的。剩下的架构设计或者需求频繁变动都是我自己的锅
--【叁】--:
对的,私信吧.我将相关信息发给你,先拿来测试.
--【肆】--:
我现在是主力Codex 加一个测试效果!
--【伍】--:
我感觉还好啊,任何大小修改我都让它先给一个方案,我改了方案之后才让它跑
--【陆】--:
能到opus的百分之60就舒服了。我觉得codex还是可以的
--【柒】--:
我也是这样的,就是他输出的内容太发散,然后又长,理解起来有点费脑细胞.稍微压制一下
--【捌】--:
水没关系,我也只是想让他更好用,不代表我写的东西都有用,目前屎山项目几十个.
--【玖】--:
我怎么感觉opus现在反而需要向codex学习呢. 当然除了接住
--【拾】--:
佬 想参与一下 我自建的codex号池 但是codex经常不说人话
--【拾壹】--:
好尝试,mark 了,我一直认为这种行为是模型训练时决定的,靠harness不一定改的了
--【拾贰】--:
佬 加我一个 我重度使用codex 愿意一起参与
--【拾叁】--:
我自己的claude code使用了一个叫paceflow的插件,用的非常顺,最近codex也非常好用,尤其上下文太舒服了,但研究了半天,hook的支持还是有限,没办法用paceflow,成为了我的阻塞。
--【拾肆】--:
重度Codex用户,月均50亿Token,前端后端app都有在使用它来写,报个名!
--【拾伍】--:
已经私信了佬 你看一下 主力codex!
--【拾陆】--:
留给有需要的佬友吧,主要是感觉我自己每天写的项目太水了
--【拾柒】--:
怎么参加测试?私信佬就行了嘛?codex深度使用中
--【拾捌】--:
我私信你了求回复啊,大佬,不知看到没啊哈哈
--【拾玖】--:
能做到一部分,目前自用觉得尚可.完全达到不可能.opus指出chatgpt底层训练逻辑跟他不同.

