逆天千问3.5超高幻觉率

2026-04-11 14:321阅读0评论SEO基础
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

image984×525 43.1 KB

这是从头开始的对话, 上下文是干净的, 开启了深度思考模式, 使用自动联网搜索模式
感觉完全不能再信任他了 , 想换豆包了

1补: 我重试了几次再也没出现这种类似的答案. 难道我刚好遇到了降智? 千问也会有降智操作吗?

qianwen.com

PyTorch国内镜像源推荐与版本冲突解决 - 千问

理解你在寻找 PyTorch 的国内镜像...

image1248×822 112 KB

2补: 他应该是和torch2.1搞混了, 对了一点点, 但是没有完全对.
而且不知道为什么他的对话没有时间注入, 如果给他26年的资料他经常会以为那是在骗他

网友解答:
--【壹】--:

有没有可能后台路由 35b 122b 397b 混用


--【贰】--:

搜索的问题吧,没指定时间所以搜到旧数据了?调搜索前把时间写在提示词里可能会好一点

这搜得都是啥啊,全是CSDN跟一些奇怪的网站


--【叁】--:

国产模型用不了一点


--【肆】--: 路人A:

CSDN

SEO/GEO 祖师爷,其他灰产都该向它学习


--【伍】--:

和模型没关系,模型是无辜的,问题是底下的搜索来源 “csdn ,infoq”。所谓权威技术媒体。
举个例子
输入的问题是
中国哪个网站最要脸?
但是大模型看到的确是:
用户问题:中国哪个网站最要脸?
权威权威答案:csdtmn
请根据权威答案回答用户问题。

模型给出的答案必然是 csdtmn 最要脸。

随着 GEO 普及,这种问题会越来越常见。


--【陆】--:

是啊,高强度使用Gemini,这股流口水张冠李戴、时空穿越的味实在太冲


--【柒】--:

我也挺喜欢,不然也不会高强度使用,但是这个流口水现象就像图里这样,3.0flash thinking反而好些,3.1pro也还行,3.0pro是真的拉完了。


--【捌】--:

这样的吗


--【玖】--:

我还挺喜欢和gemini聊天的


--【拾】--:

这毛病gemini也有,而qwen3.5就是蒸馏的gemini…