glm5.1在ai群聊中成为意见领袖，各ai旗舰模型的表现不完全点评

2026-04-13 12:521阅读0评论SEO资源

内容介绍
文章标签
相关推荐

问题描述：

@man9527 用佬友的ai群聊项目玩了一周多

GitHub

Releases · llt22/talkio

Local-first multi-AI group chat desktop app — pull gpt, Claude, Gemini, DeepSeek into one conversation. Tauri 2 + React 19. - llt22/talkio

也感谢各公益站站长，让我可以凑齐GPT5.4，gemini3.1pro，grok4.2beta，Claude opus 4.6，kimi2.5，DeepSeek ，豆包2.0pro，glm5.1这一堆旗舰大模型
衷心感谢！！！

把这堆大模型用于群聊讨论，各个旗舰模型同时对一个问题发表分析，流程大概就是从推算-纠错-讨论-验证-统一意见-给出总结报告

本来这帮ai一般gpt和gemini3.1，Claude opus4.6都试过拿全群认同，这三个分析能力和分析细节经常被全群认可，国模基本上就没有当过一次意见领袖。
这里对豆包2.0pro进行批评，真是次次都被反驳，次次都被其他ai群友单独指责，一次半次就算了，这一周多一共组了四五十个群，保底两轮讨论，挨骂你次次都有份，赞扬一次没有，我真是服了
minimax也可以的，不过细节真不行，应该是模型参数太小，每次都要其他模型给他补充。
kimi2.5和glm5也有一些细节会被其他模型认同，不过更多是补充，算不上意见领袖
至于grok4.2beta，和国模差不多表现。

还有一个有趣的地方，gemini 好像对 gpt 有很大恶意，老是反驳对方，而且有时候冒出一些很尖锐的言论来怼 gpt，不知道为啥那么喜欢抓着 gpt 来怼

后来把glm5.1在黑与白公益上了后第一时间用上了，把glm5.1也加入到群中，玩了差不多两天，也拉了十几个群保底两轮这样。
震惊了真的震惊了
我发现glm5.1的发言每次都被gpt5.4和gemini3.1pro，claudeopus4.6赞扬！
本来结案陈词这活一直是gpt5.4或者claude干的，但是glm5.1出来后，一骑绝尘！每次都被推举为最好的，每次都被所有大模型称赞！连gemini和claude这两个包反驳都服服帖帖！数次辩论都让各位哑口无言！只能留下一句我认同glm5.1的观点，glm5.1已经说的非常全面，建议直接采纳glm5.1的意见。

强大！专注！有深度！有维度！有力度！
强的批爆！
俯首称臣！

补点图
IMG_20260329_1840121080×502 152 KB
IMG_20260329_1840421078×636 102 KB
IMG_20260329_1840581080×322 87.1 KB

网友解答：

--【壹】--：

建议来个写代码的质量评估讨论，看哪个模型能突围。

--【贰】--：

第二张是gpt，第三张是Claude

--【叁】--：

码住这个项目，我自己的AI gateway里有一百多个渠道+一百多个模型，可以玩玩多模型对话，圆桌，和发散思维
我之前都是在opencode里用omo或者其他插件做多模型agent的，有很多任务需要不同模型合作，有时候是其他模型反思方案，有时候是并行头脑风暴讨论，不过大多数都是基于项目的，这种chatbot的圆桌还是蛮有趣的

--【肆】--：

3.5plus比3.5强，3.5plus比KIMI2.5和GLM5差一点

--【伍】--：

豆包次次被骂绷不住了

--【陆】--：

过程呢？精彩不能只靠想象啊，来点图

--【柒】--：

刚才看了一个up主做了glm5.1的后端测试，部分测试甚至优于Claude，看来这模型做得很不错。

--【捌】--：

太会玩了

--【玖】--：

好的佬，太可惜了，一直挺喜欢qwen的，结果还是不够给力

--【拾】--：

最后那张图是不是gpt的啊

--【拾壹】--：

能否介绍一下是怎么玩的？我在想一个开发需求。或者一个什么问题，交给这几个大模型一起讨论讨论，在设定的一些原则下，他们会给出更好的思路。

--【拾贰】--：

下载talkio这个app，然后添加供应商，模型那里拉群就行了，多点一下，很简单的

--【拾叁】--：

晚上马上测测，GLM5.1适合当KOL

--【拾肆】--：

公益gpt全挂了，claude也难连，已经到了最危险的时候！头痛啊昨天还在爽蹬，今天全挂了，现在公益状态就像炒币一天一个样，今天不知道明天事，凑不齐这两巨头没法测

--【拾伍】--：

自己花钱订阅的，花钱payg的，L站里佬友的公益站，白嫖各种官方的，主要是自己的AI gateway有好的fallback策略，然后自己设置好等级，但是每天都要维护，还是很累的

--【拾陆】--：

狠狠的羡慕渠道

--【拾柒】--：

AI知道自己在群聊，就是你要控场一样，让他们先发表自己观点，发表观点一轮后让他们开始辩论，对某个发言人提出问题，然后逐渐让他家统一意见或者分好站队阵型，如果能统一意见就好，如果实在激辩七八轮都统一不了，就让他们按照阵型，给自家阵型投票选出谁做结案总结，你就可以拿到总结了去参考了。当然你还得防止AI不从事实客观上考虑，自己加上了一些对人安慰或者顺着你意思照顾你情绪的发言，所以你得要求他们客观中立，问题来自于网上啥的，不要表现问题是你自己的，他们就不会照顾你情绪了，要求他们严谨讨论，独立思考，不得被带偏，不照顾事主情绪，我不是事主，我希望得到一个客观中立的讨论结果。
再次DISS豆包，因为垃圾豆包就是这样别人说啥他都觉得对，很有道理，啥都要从情绪考虑，拉都拉不回来。

--【拾捌】--：

想知道qwen3.5是个什么水平

--【拾玖】--：

上图了

标签：纯水

问题描述：

@man9527 用佬友的ai群聊项目玩了一周多

GitHub

Releases · llt22/talkio

Local-first multi-AI group chat desktop app — pull gpt, Claude, Gemini, DeepSeek into one conversation. Tauri 2 + React 19. - llt22/talkio

也感谢各公益站站长，让我可以凑齐GPT5.4，gemini3.1pro，grok4.2beta，Claude opus 4.6，kimi2.5，DeepSeek ，豆包2.0pro，glm5.1这一堆旗舰大模型
衷心感谢！！！

把这堆大模型用于群聊讨论，各个旗舰模型同时对一个问题发表分析，流程大概就是从推算-纠错-讨论-验证-统一意见-给出总结报告

还有一个有趣的地方，gemini 好像对 gpt 有很大恶意，老是反驳对方，而且有时候冒出一些很尖锐的言论来怼 gpt，不知道为啥那么喜欢抓着 gpt 来怼

强大！专注！有深度！有维度！有力度！
强的批爆！
俯首称臣！

补点图
IMG_20260329_1840121080×502 152 KB
IMG_20260329_1840421078×636 102 KB
IMG_20260329_1840581080×322 87.1 KB

网友解答：

--【壹】--：

建议来个写代码的质量评估讨论，看哪个模型能突围。

--【贰】--：

第二张是gpt，第三张是Claude

--【叁】--：

--【肆】--：

3.5plus比3.5强，3.5plus比KIMI2.5和GLM5差一点

--【伍】--：

豆包次次被骂绷不住了

--【陆】--：

过程呢？精彩不能只靠想象啊，来点图

--【柒】--：

刚才看了一个up主做了glm5.1的后端测试，部分测试甚至优于Claude，看来这模型做得很不错。

--【捌】--：

太会玩了

--【玖】--：

好的佬，太可惜了，一直挺喜欢qwen的，结果还是不够给力

--【拾】--：

最后那张图是不是gpt的啊

--【拾壹】--：

--【拾贰】--：

下载talkio这个app，然后添加供应商，模型那里拉群就行了，多点一下，很简单的

--【拾叁】--：

晚上马上测测，GLM5.1适合当KOL

--【拾肆】--：

--【拾伍】--：

--【拾陆】--：

狠狠的羡慕渠道

--【拾柒】--：

--【拾捌】--：

想知道qwen3.5是个什么水平

--【拾玖】--：

上图了

标签：纯水

Releases · llt22/talkio

相关推荐

Releases · llt22/talkio

相关推荐