glm5.1在ai群聊中成为意见领袖,各ai旗舰模型的表现不完全点评

2026-04-13 12:521阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

@man9527 用佬友的ai群聊项目玩了一周多

GitHub

Releases · llt22/talkio

Local-first multi-AI group chat desktop app — pull gpt, Claude, Gemini, DeepSeek into one conversation. Tauri 2 + React 19. - llt22/talkio

也感谢各公益站站长,让我可以凑齐GPT5.4,gemini3.1pro,grok4.2beta,Claude opus 4.6,kimi2.5,DeepSeek ,豆包2.0pro,glm5.1这一堆旗舰大模型
衷心感谢!!!

把这堆大模型用于群聊讨论,各个旗舰模型同时对一个问题发表分析,流程大概就是从推算-纠错-讨论-验证-统一意见-给出总结报告

本来这帮ai一般gpt和gemini3.1,Claude opus4.6都试过拿全群认同,这三个分析能力和分析细节经常被全群认可,国模基本上就没有当过一次意见领袖。
这里对豆包2.0pro进行批评,真是次次都被反驳,次次都被其他ai群友单独指责,一次半次就算了,这一周多一共组了四五十个群,保底两轮讨论,挨骂你次次都有份,赞扬一次没有,我真是服了
minimax也可以的,不过细节真不行,应该是模型参数太小,每次都要其他模型给他补充。
kimi2.5和glm5也有一些细节会被其他模型认同,不过更多是补充,算不上意见领袖
至于grok4.2beta,和国模差不多表现。

还有一个有趣的地方,gemini 好像对 gpt 有很大恶意,老是反驳对方,而且有时候冒出一些很尖锐的言论来怼 gpt,不知道为啥那么喜欢抓着 gpt 来怼

后来把glm5.1在黑与白公益上了后第一时间用上了,把glm5.1也加入到群中,玩了差不多两天,也拉了十几个群保底两轮这样。
震惊了真的震惊了
我发现glm5.1的发言每次都被gpt5.4和gemini3.1pro,claudeopus4.6赞扬!
本来结案陈词这活一直是gpt5.4或者claude干的,但是glm5.1出来后,一骑绝尘!每次都被推举为最好的,每次都被所有大模型称赞!连gemini和claude这两个包反驳都服服帖帖!数次辩论都让各位哑口无言!只能留下一句我认同glm5.1的观点,glm5.1已经说的非常全面,建议直接采纳glm5.1的意见。

强大!专注!有深度!有维度!有力度!
强的批爆!
俯首称臣!

补点图
IMG_20260329_1840121080×502 152 KB
IMG_20260329_1840421078×636 102 KB
IMG_20260329_1840581080×322 87.1 KB

网友解答:
--【壹】--:

建议来个写代码的质量评估讨论,看哪个模型能突围。


--【贰】--:

第二张是gpt,第三张是Claude


--【叁】--:

码住这个项目,我自己的AI gateway里有一百多个渠道+一百多个模型,可以玩玩多模型对话,圆桌,和发散思维
我之前都是在opencode里用omo或者其他插件做多模型agent的,有很多任务需要不同模型合作,有时候是其他模型反思方案,有时候是并行头脑风暴讨论,不过大多数都是基于项目的,这种chatbot的圆桌还是蛮有趣的


--【肆】--:

3.5plus比3.5强,3.5plus比KIMI2.5和GLM5差一点


--【伍】--:

豆包次次被骂绷不住了


--【陆】--:

过程呢?精彩不能只靠想象啊,来点图


--【柒】--:

刚才看了一个up主做了glm5.1的后端测试,部分测试甚至优于Claude,看来这模型做得很不错。


--【捌】--:

太会玩了


--【玖】--:

好的佬,太可惜了,一直挺喜欢qwen的,结果还是不够给力


--【拾】--:

最后那张图是不是gpt的啊


--【拾壹】--:

能否介绍一下是怎么玩的?我在想一个开发需求。或者一个什么问题,交给这几个大模型一起讨论讨论,在设定的一些原则下,他们会给出更好的思路。


--【拾贰】--:

下载talkio这个app,然后添加供应商,模型那里拉群就行了,多点一下,很简单的


--【拾叁】--:

晚上马上测测,GLM5.1适合当KOL


--【拾肆】--:

公益gpt全挂了,claude也难连,已经到了最危险的时候!头痛啊昨天还在爽蹬,今天全挂了,现在公益状态就像炒币一天一个样,今天不知道明天事,凑不齐这两巨头没法测


--【拾伍】--:

自己花钱订阅的,花钱payg的,L站里佬友的公益站,白嫖各种官方的,主要是自己的AI gateway有好的fallback策略,然后自己设置好等级,但是每天都要维护,还是很累的


--【拾陆】--:

狠狠的羡慕渠道


--【拾柒】--:

AI知道自己在群聊,就是你要控场一样,让他们先发表自己观点,发表观点一轮后让他们开始辩论,对某个发言人提出问题,然后逐渐让他家统一意见或者分好站队阵型,如果能统一意见就好,如果实在激辩七八轮都统一不了,就让他们按照阵型,给自家阵型投票选出谁做结案总结,你就可以拿到总结了去参考了。当然你还得防止AI不从事实客观上考虑,自己加上了一些对人安慰或者顺着你意思照顾你情绪的发言,所以你得要求他们客观中立,问题来自于网上啥的,不要表现问题是你自己的,他们就不会照顾你情绪了,要求他们严谨讨论,独立思考,不得被带偏,不照顾事主情绪,我不是事主,我希望得到一个客观中立的讨论结果。
再次DISS豆包,因为垃圾豆包就是这样别人说啥他都觉得对,很有道理,啥都要从情绪考虑,拉都拉不回来。


--【拾捌】--:

想知道qwen3.5是个什么水平


--【拾玖】--:

上图了