个人不严谨盲测:ChatGPT 5.4 Xhigh VS DeepSeek V4 Pro
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
github.com
--【壹】--:
--【贰】--: YKDZ:
叠甲:这是本人第一次尝试横向评估模型能力,测试方式可能有明显的不严谨,仅作为分享,大家看个乐子即可
测试结果
GitHub - YKDZ/v4-vs-5.4: AI 代码能力对比:DeepSeek V4 Pro vs ChatGPT 5.4 xhigh ——...
AI 代码能力对比:DeepSeek V4 Pro vs ChatGPT 5.4 xhigh —— 同一需求文档的全栈实现对比
省流
没有明确的代码规划,在仓库中从零开始自由发挥的情况下,V4 和 5.4 的代码能力有明显可见的差距。
实际上还应测试:
-
有明确规划的情况下,长期遵循规划的能力
-
根据代码库 + 需求编写具体的规划的能力
-
Brainstorm 能力
才能对整体的代码能力有一个准确的评估。
网友解答:--【壹】--:
那v4能和5.2比吗,感觉能比上5.2的话我就不续gemini了
--【贰】--: YKDZ:
省流
你省流了什么: V4 和 5.4 的代码能力有明显可见的差距。 意思是
V4 差的很?
问题描述:
github.com
--【壹】--:
--【贰】--: YKDZ:
叠甲:这是本人第一次尝试横向评估模型能力,测试方式可能有明显的不严谨,仅作为分享,大家看个乐子即可
测试结果
GitHub - YKDZ/v4-vs-5.4: AI 代码能力对比:DeepSeek V4 Pro vs ChatGPT 5.4 xhigh ——...
AI 代码能力对比:DeepSeek V4 Pro vs ChatGPT 5.4 xhigh —— 同一需求文档的全栈实现对比
省流
没有明确的代码规划,在仓库中从零开始自由发挥的情况下,V4 和 5.4 的代码能力有明显可见的差距。
实际上还应测试:
-
有明确规划的情况下,长期遵循规划的能力
-
根据代码库 + 需求编写具体的规划的能力
-
Brainstorm 能力
才能对整体的代码能力有一个准确的评估。
网友解答:--【壹】--:
那v4能和5.2比吗,感觉能比上5.2的话我就不续gemini了
--【贰】--: YKDZ:
省流
你省流了什么: V4 和 5.4 的代码能力有明显可见的差距。 意思是
V4 差的很?

