为什么我的codex这么弱智,是我的要求太高了吗
- 内容介绍
- 文章标签
- 相关推荐
背景是这样的,我们是个 Unity 游戏项目,最近公司鼓励 AI 辅助编码,周二刚给分发了 Codex Business 账号。我满怀信心地在 Rider 里装了插件,还专门接了 superpower,准备大干一场。
上来我就给它安排了一个比较有挑战性的大模块:在现有帧同步架构下搞一个僵尸尸潮的效果。
说实话,刚开始的头脑风暴阶段体验非常好。AI 给出的整体规划、类结构和接口设计确实非常清晰,逻辑严密,当时我真的以为这波生产力要彻底解放了。
但真正到了让它落地写业务代码的阶段,直接破防。写出来的代码跑起来后,各种各样奇葩的 Bug 和异常全出来了。最让人崩溃的是修 Bug 的过程:我把报错信息喂给它让它修,结果它补了东墙拆西墙,越修问题越多,最后整个代码逻辑全乱套了。
现在我非常怀疑人生。是我对 AI 的期望值太高了,还是像这种复杂的丶要求极高的核心模块,现阶段根本就不适合让 AI 搞?
网友解答:--【壹】--:
配置看一下
--【贰】--:
可能一开始给出的规划还不够细致,然后加上jetbrains的mcp辅助代码检查可能会好一点
--【叁】--:
我用这个工作流 规划的确实可以 但是代码质量不太行
--【肆】--:
试试看high 和 xhigh
体感还是差很多的和medium
--【伍】--:
image693×533 30.2 KB
之前大多用的中等,现在用最高的推理了.
--【陆】--:
AI的任务是把你大脑里的想法和规划转换为具体代码,只有想法没有规划,可不就是时速300码的车还没有方向盘吗
--【柒】--:
能接受token疯狂消耗吗?在AGENTS.md里加上一段约束,
大概意思就是事实驱动,无论做什么都要以实际代码为准,干啥之前都要先扫描代码寻找实际代码,只要没看到代码就不干活,
差不多这么个东西,语气强硬一点,禁止xxx,必须xxx 等等
会有一些效果,但不是一定会达到你的要求,需要你自己去调
--【捌】--:
感觉是最近openai算力不太够了,我也是公司分发的key,半个月前开始高强度使用,最开始是可以认认真真完成任务的,这几天开始明显敷衍了,推理开的xhigh,各种方案也都试过了,现在开始人机共创了
--【玖】--:
看你这个截图使用的中等思考,把思考开到 xHigh 试试
--【拾】--:
我吸取一下各位佬的意见,再去试试。
--【拾壹】--:
期待大佬解答大型任务的使用
--【拾贰】--:
也遇到过类似的情况,但是我这里属于业务密集型系统,AI的使用还在一点点挪动中。
--【拾叁】--:
汇报下最新情况,已经使用claude了,感觉claude比codex吊一点
--【拾肆】--:
看对话,思考速度太快了,感觉应该是思考级别不够
--【拾伍】--:
image608×1039 57.1 KB
其实一开始我已经把具体的方案给codex了,不知道是不是我的笨比表述有问题
背景是这样的,我们是个 Unity 游戏项目,最近公司鼓励 AI 辅助编码,周二刚给分发了 Codex Business 账号。我满怀信心地在 Rider 里装了插件,还专门接了 superpower,准备大干一场。
上来我就给它安排了一个比较有挑战性的大模块:在现有帧同步架构下搞一个僵尸尸潮的效果。
说实话,刚开始的头脑风暴阶段体验非常好。AI 给出的整体规划、类结构和接口设计确实非常清晰,逻辑严密,当时我真的以为这波生产力要彻底解放了。
但真正到了让它落地写业务代码的阶段,直接破防。写出来的代码跑起来后,各种各样奇葩的 Bug 和异常全出来了。最让人崩溃的是修 Bug 的过程:我把报错信息喂给它让它修,结果它补了东墙拆西墙,越修问题越多,最后整个代码逻辑全乱套了。
现在我非常怀疑人生。是我对 AI 的期望值太高了,还是像这种复杂的丶要求极高的核心模块,现阶段根本就不适合让 AI 搞?
网友解答:--【壹】--:
配置看一下
--【贰】--:
可能一开始给出的规划还不够细致,然后加上jetbrains的mcp辅助代码检查可能会好一点
--【叁】--:
我用这个工作流 规划的确实可以 但是代码质量不太行
--【肆】--:
试试看high 和 xhigh
体感还是差很多的和medium
--【伍】--:
image693×533 30.2 KB
之前大多用的中等,现在用最高的推理了.
--【陆】--:
AI的任务是把你大脑里的想法和规划转换为具体代码,只有想法没有规划,可不就是时速300码的车还没有方向盘吗
--【柒】--:
能接受token疯狂消耗吗?在AGENTS.md里加上一段约束,
大概意思就是事实驱动,无论做什么都要以实际代码为准,干啥之前都要先扫描代码寻找实际代码,只要没看到代码就不干活,
差不多这么个东西,语气强硬一点,禁止xxx,必须xxx 等等
会有一些效果,但不是一定会达到你的要求,需要你自己去调
--【捌】--:
感觉是最近openai算力不太够了,我也是公司分发的key,半个月前开始高强度使用,最开始是可以认认真真完成任务的,这几天开始明显敷衍了,推理开的xhigh,各种方案也都试过了,现在开始人机共创了
--【玖】--:
看你这个截图使用的中等思考,把思考开到 xHigh 试试
--【拾】--:
我吸取一下各位佬的意见,再去试试。
--【拾壹】--:
期待大佬解答大型任务的使用
--【拾贰】--:
也遇到过类似的情况,但是我这里属于业务密集型系统,AI的使用还在一点点挪动中。
--【拾叁】--:
汇报下最新情况,已经使用claude了,感觉claude比codex吊一点
--【拾肆】--:
看对话,思考速度太快了,感觉应该是思考级别不够
--【拾伍】--:
image608×1039 57.1 KB
其实一开始我已经把具体的方案给codex了,不知道是不是我的笨比表述有问题

