AI review 到底靠不靠谱？

2026-04-11 14:000阅读0评论SEO资讯

内容介绍
文章标签
相关推荐

问题描述：

在开始回答这个问题前，我们先来做一个实验。

以 GPT-5.4 Xhigh 为例，你只需要打开任意一个你当前的项目，开启计划模式，输入任意需求，等待他生成方案后实施方案，然后进入 AI review 审查阶段，此时新开一个会话，输入下面的提示词

我实施了以下计划： ``` XXX（这里放他生成的实施方案） ``` 请你审查更改diff检查是否全部功能已实现，如果存在遗漏请帮我修复，如果全部已实现，请告知

第一次这么问，AI 大概率能找出一批遗漏并修复。

接下来继续新开一个会话，再把一样的提示词再喂进去，它又能继续找到新的遗漏并继续修。再开一次，还能继续找。这个过程只要你愿意将可以无限循环。

当然，上述情况不止是 GPT-5.4 Xhigh 会出现这样的问题，你换任意 AI 模型都会得到大差不差的结论。

OK，看到这里你现在脑子里念头更符合下面哪个结论？：

AI 真强，可以永远不会疲倦的 review
AI 不可靠，它根本什么都做不好

0 投票人

而我认为：

AI review 的确能发现问题，但它没有能力证明“问题已经被找完了”。

这不是某个模型、某个产品或者某个框架独有的毛病，而是当前大模型的底层缺陷。

一、从底层原理看：它为什么会这样

1. 大模型就是一个概率生成器

今天的大模型，其本质上是 “根据上下文预测下一个最可能 token” 。

标签：人工智能纯水

问题描述：

在开始回答这个问题前，我们先来做一个实验。

以 GPT-5.4 Xhigh 为例，你只需要打开任意一个你当前的项目，开启计划模式，输入任意需求，等待他生成方案后实施方案，然后进入 AI review 审查阶段，此时新开一个会话，输入下面的提示词

我实施了以下计划： ``` XXX（这里放他生成的实施方案） ``` 请你审查更改diff检查是否全部功能已实现，如果存在遗漏请帮我修复，如果全部已实现，请告知

第一次这么问，AI 大概率能找出一批遗漏并修复。

接下来继续新开一个会话，再把一样的提示词再喂进去，它又能继续找到新的遗漏并继续修。再开一次，还能继续找。这个过程只要你愿意将可以无限循环。

当然，上述情况不止是 GPT-5.4 Xhigh 会出现这样的问题，你换任意 AI 模型都会得到大差不差的结论。

OK，看到这里你现在脑子里念头更符合下面哪个结论？：

AI 真强，可以永远不会疲倦的 review
AI 不可靠，它根本什么都做不好

0 投票人

而我认为：

AI review 的确能发现问题，但它没有能力证明“问题已经被找完了”。

这不是某个模型、某个产品或者某个框架独有的毛病，而是当前大模型的底层缺陷。

一、从底层原理看：它为什么会这样

1. 大模型就是一个概率生成器

今天的大模型，其本质上是 “根据上下文预测下一个最可能 token” 。

标签：人工智能纯水