为什么我的codex这么弱智,是我的要求太高了吗

2026-04-11 13:381阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

背景是这样的,我们是个 Unity 游戏项目,最近公司鼓励 AI 辅助编码,周二刚给分发了 Codex Business 账号。我满怀信心地在 Rider 里装了插件,还专门接了 superpower,准备大干一场。

上来我就给它安排了一个比较有挑战性的大模块:在现有帧同步架构下搞一个僵尸尸潮的效果。

说实话,刚开始的头脑风暴阶段体验非常好。AI 给出的整体规划、类结构和接口设计确实非常清晰,逻辑严密,当时我真的以为这波生产力要彻底解放了。

但真正到了让它落地写业务代码的阶段,直接破防。写出来的代码跑起来后,各种各样奇葩的 Bug 和异常全出来了。最让人崩溃的是修 Bug 的过程:我把报错信息喂给它让它修,结果它补了东墙拆西墙,越修问题越多,最后整个代码逻辑全乱套了。

现在我非常怀疑人生。是我对 AI 的期望值太高了,还是像这种复杂的丶要求极高的核心模块,现阶段根本就不适合让 AI 搞?

网友解答:
--【壹】--:

配置看一下


--【贰】--:

可能一开始给出的规划还不够细致,然后加上jetbrains的mcp辅助代码检查可能会好一点


--【叁】--:

我用这个工作流 规划的确实可以 但是代码质量不太行


--【肆】--:

试试看high 和 xhigh

体感还是差很多的和medium


--【伍】--:

image693×533 30.2 KB
之前大多用的中等,现在用最高的推理了.


--【陆】--:

AI的任务是把你大脑里的想法和规划转换为具体代码,只有想法没有规划,可不就是时速300码的车还没有方向盘吗


--【柒】--:

能接受token疯狂消耗吗?在AGENTS.md里加上一段约束,
大概意思就是事实驱动,无论做什么都要以实际代码为准,干啥之前都要先扫描代码寻找实际代码,只要没看到代码就不干活,

差不多这么个东西,语气强硬一点,禁止xxx,必须xxx 等等

会有一些效果,但不是一定会达到你的要求,需要你自己去调


--【捌】--:

感觉是最近openai算力不太够了,我也是公司分发的key,半个月前开始高强度使用,最开始是可以认认真真完成任务的,这几天开始明显敷衍了,推理开的xhigh,各种方案也都试过了,现在开始人机共创了


--【玖】--:

看你这个截图使用的中等思考,把思考开到 xHigh 试试


--【拾】--:

我吸取一下各位佬的意见,再去试试。


--【拾壹】--:

期待大佬解答大型任务的使用


--【拾贰】--:

也遇到过类似的情况,但是我这里属于业务密集型系统,AI的使用还在一点点挪动中。


--【拾叁】--:

汇报下最新情况,已经使用claude了,感觉claude比codex吊一点


--【拾肆】--:

看对话,思考速度太快了,感觉应该是思考级别不够


--【拾伍】--:

image608×1039 57.1 KB
其实一开始我已经把具体的方案给codex了,不知道是不是我的笨比表述有问题

问题描述:

背景是这样的,我们是个 Unity 游戏项目,最近公司鼓励 AI 辅助编码,周二刚给分发了 Codex Business 账号。我满怀信心地在 Rider 里装了插件,还专门接了 superpower,准备大干一场。

上来我就给它安排了一个比较有挑战性的大模块:在现有帧同步架构下搞一个僵尸尸潮的效果。

说实话,刚开始的头脑风暴阶段体验非常好。AI 给出的整体规划、类结构和接口设计确实非常清晰,逻辑严密,当时我真的以为这波生产力要彻底解放了。

但真正到了让它落地写业务代码的阶段,直接破防。写出来的代码跑起来后,各种各样奇葩的 Bug 和异常全出来了。最让人崩溃的是修 Bug 的过程:我把报错信息喂给它让它修,结果它补了东墙拆西墙,越修问题越多,最后整个代码逻辑全乱套了。

现在我非常怀疑人生。是我对 AI 的期望值太高了,还是像这种复杂的丶要求极高的核心模块,现阶段根本就不适合让 AI 搞?

网友解答:
--【壹】--:

配置看一下


--【贰】--:

可能一开始给出的规划还不够细致,然后加上jetbrains的mcp辅助代码检查可能会好一点


--【叁】--:

我用这个工作流 规划的确实可以 但是代码质量不太行


--【肆】--:

试试看high 和 xhigh

体感还是差很多的和medium


--【伍】--:

image693×533 30.2 KB
之前大多用的中等,现在用最高的推理了.


--【陆】--:

AI的任务是把你大脑里的想法和规划转换为具体代码,只有想法没有规划,可不就是时速300码的车还没有方向盘吗


--【柒】--:

能接受token疯狂消耗吗?在AGENTS.md里加上一段约束,
大概意思就是事实驱动,无论做什么都要以实际代码为准,干啥之前都要先扫描代码寻找实际代码,只要没看到代码就不干活,

差不多这么个东西,语气强硬一点,禁止xxx,必须xxx 等等

会有一些效果,但不是一定会达到你的要求,需要你自己去调


--【捌】--:

感觉是最近openai算力不太够了,我也是公司分发的key,半个月前开始高强度使用,最开始是可以认认真真完成任务的,这几天开始明显敷衍了,推理开的xhigh,各种方案也都试过了,现在开始人机共创了


--【玖】--:

看你这个截图使用的中等思考,把思考开到 xHigh 试试


--【拾】--:

我吸取一下各位佬的意见,再去试试。


--【拾壹】--:

期待大佬解答大型任务的使用


--【拾贰】--:

也遇到过类似的情况,但是我这里属于业务密集型系统,AI的使用还在一点点挪动中。


--【拾叁】--:

汇报下最新情况,已经使用claude了,感觉claude比codex吊一点


--【拾肆】--:

看对话,思考速度太快了,感觉应该是思考级别不够


--【拾伍】--:

image608×1039 57.1 KB
其实一开始我已经把具体的方案给codex了,不知道是不是我的笨比表述有问题