大模型幻觉之 大模型让人产生幻觉

2026-04-11 15:140阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

xdm,关于AI能不能替代人类,我今天突然变得很乐观。

前两天一哥们在x客网私聊我,问要不要加入他的初创团队,做兼职。哥们对自己的项目非常的自信。大意是他做产品,负责调研市场,出方案,我干其中一部分活,做完项目之后挂平台卖,按成交量分成。画了一张非常大的饼:现在有完善的方案,我们只需要每天3-5小时,大概5天就做成一个项目,卖出一单后分成至少1w。

算日薪很高,对不对?

在我看到他的方案之前一切都正常。方案是邮件发给我的,字数还挺多,分工和步骤都挺明确的——好了,这就是全部的优点了。

他熬夜写出来的这个方案的可行性几乎为0。他想要训练一个模型,但市面上根本没数据,他的星期项目团队也当然是没有实验室来获取数据;他想验证模型鲁棒性,但他的假设和领域的常识是相悖的;他预期5天做完,但里面光是现有工具的集成和调试都要花上一两天…诸如此类,他的方案我也没看完,我一开始以为是我才疏学浅,找了其中我非常迷惑的部分,问了三个博士同学,他们也都表示看不懂,不像中文 。

我都能想到他怎么问的。“我想做xx项目,你觉得可行吗?”然后估计是某国产AI说,“你的想法太棒了!这个领域目前完全没有人做过,而且很有市场需求…”于是哥们基于大模型的谄媚性和幻觉,自己也产生了“我上我也行”的幻觉,误以为自己可以随便摇个人,几天搞定一个几十万的项目。

说实话我挺佩服他的行动力和想法,他想借助AI工具,探索自己不太了解的领域,寻求市场需求做一些项目,并招揽人才,而且据我所知,他自己一个人在管5个不同方向的项目组,熬夜写方案 。也是挺拼的。但是哥们,你好歹用好点的模型吧。现在这个方案直接丢给gemini 3 pro,他一下子就能说出至少5个漏洞,你就用这种方案一直跑一直跑,你熬再多的夜,又有什么意义呢?

我并非想讽刺试图用AI做项目调研的人,也并非不看好“一人公司”之类的,但目前看来,鉴于大模型仍然存在大量的幻觉,我们需要有能力评估他的回复。这也是前几天到的Anthropic网课中的4D框架里提到的内容。

阅读全文
问题描述:

xdm,关于AI能不能替代人类,我今天突然变得很乐观。

前两天一哥们在x客网私聊我,问要不要加入他的初创团队,做兼职。哥们对自己的项目非常的自信。大意是他做产品,负责调研市场,出方案,我干其中一部分活,做完项目之后挂平台卖,按成交量分成。画了一张非常大的饼:现在有完善的方案,我们只需要每天3-5小时,大概5天就做成一个项目,卖出一单后分成至少1w。

算日薪很高,对不对?

在我看到他的方案之前一切都正常。方案是邮件发给我的,字数还挺多,分工和步骤都挺明确的——好了,这就是全部的优点了。

他熬夜写出来的这个方案的可行性几乎为0。他想要训练一个模型,但市面上根本没数据,他的星期项目团队也当然是没有实验室来获取数据;他想验证模型鲁棒性,但他的假设和领域的常识是相悖的;他预期5天做完,但里面光是现有工具的集成和调试都要花上一两天…诸如此类,他的方案我也没看完,我一开始以为是我才疏学浅,找了其中我非常迷惑的部分,问了三个博士同学,他们也都表示看不懂,不像中文 。

我都能想到他怎么问的。“我想做xx项目,你觉得可行吗?”然后估计是某国产AI说,“你的想法太棒了!这个领域目前完全没有人做过,而且很有市场需求…”于是哥们基于大模型的谄媚性和幻觉,自己也产生了“我上我也行”的幻觉,误以为自己可以随便摇个人,几天搞定一个几十万的项目。

说实话我挺佩服他的行动力和想法,他想借助AI工具,探索自己不太了解的领域,寻求市场需求做一些项目,并招揽人才,而且据我所知,他自己一个人在管5个不同方向的项目组,熬夜写方案 。也是挺拼的。但是哥们,你好歹用好点的模型吧。现在这个方案直接丢给gemini 3 pro,他一下子就能说出至少5个漏洞,你就用这种方案一直跑一直跑,你熬再多的夜,又有什么意义呢?

我并非想讽刺试图用AI做项目调研的人,也并非不看好“一人公司”之类的,但目前看来,鉴于大模型仍然存在大量的幻觉,我们需要有能力评估他的回复。这也是前几天到的Anthropic网课中的4D框架里提到的内容。

阅读全文