个人不严谨盲测：ChatGPT 5.4 Xhigh VS DeepSeek V4 Pro

2026-04-29 10:232阅读0评论SEO教程

内容介绍
文章标签
相关推荐

问题描述：

叠甲：这是本人第一次尝试横向评估模型能力，测试方式可能有明显的不严谨，仅作为分享，大家看个乐子即可

测试结果

github.com

GitHub - YKDZ/v4-vs-5.4: AI 代码能力对比：DeepSeek V4 Pro vs ChatGPT 5.4 xhigh ——...

AI 代码能力对比：DeepSeek V4 Pro vs ChatGPT 5.4 xhigh —— 同一需求文档的全栈实现对比

省流

没有明确的代码规划，在仓库中从零开始自由发挥的情况下，V4 和 5.4 的代码能力有明显可见的差距。

实际上还应测试：

有明确规划的情况下，长期遵循规划的能力
根据代码库 + 需求编写具体的规划的能力
Brainstorm 能力

才能对整体的代码能力有一个准确的评估。

网友解答：

--【壹】--：

那v4能和5.2比吗，感觉能比上5.2的话我就不续gemini了

--【贰】--： YKDZ:

省流

你省流了什么： V4 和 5.4 的代码能力有明显可见的差距。意思是

V4 差的很？

标签：人工智能软件开发纯水

问题描述：

叠甲：这是本人第一次尝试横向评估模型能力，测试方式可能有明显的不严谨，仅作为分享，大家看个乐子即可

测试结果

github.com

GitHub - YKDZ/v4-vs-5.4: AI 代码能力对比：DeepSeek V4 Pro vs ChatGPT 5.4 xhigh ——...

AI 代码能力对比：DeepSeek V4 Pro vs ChatGPT 5.4 xhigh —— 同一需求文档的全栈实现对比

省流

没有明确的代码规划，在仓库中从零开始自由发挥的情况下，V4 和 5.4 的代码能力有明显可见的差距。

实际上还应测试：

有明确规划的情况下，长期遵循规划的能力
根据代码库 + 需求编写具体的规划的能力
Brainstorm 能力

才能对整体的代码能力有一个准确的评估。

网友解答：

--【壹】--：

那v4能和5.2比吗，感觉能比上5.2的话我就不续gemini了

--【贰】--： YKDZ:

省流

你省流了什么： V4 和 5.4 的代码能力有明显可见的差距。意思是

V4 差的很？

标签：人工智能软件开发纯水