glm5.1在ai群聊中成为意见领袖,各ai旗舰模型的表现不完全点评
- 内容介绍
- 文章标签
- 相关推荐
@man9527 用佬友的ai群聊项目玩了一周多
Releases · llt22/talkio
Local-first multi-AI group chat desktop app — pull gpt, Claude, Gemini, DeepSeek into one conversation. Tauri 2 + React 19. - llt22/talkio
也感谢各公益站站长,让我可以凑齐GPT5.4,gemini3.1pro,grok4.2beta,Claude opus 4.6,kimi2.5,DeepSeek ,豆包2.0pro,glm5.1这一堆旗舰大模型
衷心感谢!!!
把这堆大模型用于群聊讨论,各个旗舰模型同时对一个问题发表分析,流程大概就是从推算-纠错-讨论-验证-统一意见-给出总结报告
本来这帮ai一般gpt和gemini3.1,Claude opus4.6都试过拿全群认同,这三个分析能力和分析细节经常被全群认可,国模基本上就没有当过一次意见领袖。
这里对豆包2.0pro进行批评,真是次次都被反驳,次次都被其他ai群友单独指责,一次半次就算了,这一周多一共组了四五十个群,保底两轮讨论,挨骂你次次都有份,赞扬一次没有,我真是服了
minimax也可以的,不过细节真不行,应该是模型参数太小,每次都要其他模型给他补充。
kimi2.5和glm5也有一些细节会被其他模型认同,不过更多是补充,算不上意见领袖
至于grok4.2beta,和国模差不多表现。
还有一个有趣的地方,gemini 好像对 gpt 有很大恶意,老是反驳对方,而且有时候冒出一些很尖锐的言论来怼 gpt,不知道为啥那么喜欢抓着 gpt 来怼
后来把glm5.1在黑与白公益上了后第一时间用上了,把glm5.1也加入到群中,玩了差不多两天,也拉了十几个群保底两轮这样。
震惊了真的震惊了
我发现glm5.1的发言每次都被gpt5.4和gemini3.1pro,claudeopus4.6赞扬!
本来结案陈词这活一直是gpt5.4或者claude干的,但是glm5.1出来后,一骑绝尘!每次都被推举为最好的,每次都被所有大模型称赞!连gemini和claude这两个包反驳都服服帖帖!数次辩论都让各位哑口无言!只能留下一句我认同glm5.1的观点,glm5.1已经说的非常全面,建议直接采纳glm5.1的意见。
强大!专注!有深度!有维度!有力度!
强的批爆!
俯首称臣!
补点图
IMG_20260329_1840121080×502 152 KB
IMG_20260329_1840421078×636 102 KB
IMG_20260329_1840581080×322 87.1 KB
--【壹】--:
建议来个写代码的质量评估讨论,看哪个模型能突围。
--【贰】--:
第二张是gpt,第三张是Claude
--【叁】--:
码住这个项目,我自己的AI gateway里有一百多个渠道+一百多个模型,可以玩玩多模型对话,圆桌,和发散思维
我之前都是在opencode里用omo或者其他插件做多模型agent的,有很多任务需要不同模型合作,有时候是其他模型反思方案,有时候是并行头脑风暴讨论,不过大多数都是基于项目的,这种chatbot的圆桌还是蛮有趣的
--【肆】--:
3.5plus比3.5强,3.5plus比KIMI2.5和GLM5差一点
--【伍】--:
豆包次次被骂绷不住了
--【陆】--:
过程呢?精彩不能只靠想象啊,来点图
--【柒】--:
刚才看了一个up主做了glm5.1的后端测试,部分测试甚至优于Claude,看来这模型做得很不错。
--【捌】--:
太会玩了
--【玖】--:
好的佬,太可惜了,一直挺喜欢qwen的,结果还是不够给力
--【拾】--:
最后那张图是不是gpt的啊
--【拾壹】--:
能否介绍一下是怎么玩的?我在想一个开发需求。或者一个什么问题,交给这几个大模型一起讨论讨论,在设定的一些原则下,他们会给出更好的思路。
--【拾贰】--:
下载talkio这个app,然后添加供应商,模型那里拉群就行了,多点一下,很简单的
--【拾叁】--:
晚上马上测测,GLM5.1适合当KOL
--【拾肆】--:
公益gpt全挂了,claude也难连,已经到了最危险的时候!头痛啊昨天还在爽蹬,今天全挂了,现在公益状态就像炒币一天一个样,今天不知道明天事,凑不齐这两巨头没法测
--【拾伍】--:
自己花钱订阅的,花钱payg的,L站里佬友的公益站,白嫖各种官方的,主要是自己的AI gateway有好的fallback策略,然后自己设置好等级,但是每天都要维护,还是很累的
--【拾陆】--:
狠狠的羡慕渠道
--【拾柒】--:
AI知道自己在群聊,就是你要控场一样,让他们先发表自己观点,发表观点一轮后让他们开始辩论,对某个发言人提出问题,然后逐渐让他家统一意见或者分好站队阵型,如果能统一意见就好,如果实在激辩七八轮都统一不了,就让他们按照阵型,给自家阵型投票选出谁做结案总结,你就可以拿到总结了去参考了。当然你还得防止AI不从事实客观上考虑,自己加上了一些对人安慰或者顺着你意思照顾你情绪的发言,所以你得要求他们客观中立,问题来自于网上啥的,不要表现问题是你自己的,他们就不会照顾你情绪了,要求他们严谨讨论,独立思考,不得被带偏,不照顾事主情绪,我不是事主,我希望得到一个客观中立的讨论结果。
再次DISS豆包,因为垃圾豆包就是这样别人说啥他都觉得对,很有道理,啥都要从情绪考虑,拉都拉不回来。
--【拾捌】--:
想知道qwen3.5是个什么水平
--【拾玖】--:
上图了
@man9527 用佬友的ai群聊项目玩了一周多
Releases · llt22/talkio
Local-first multi-AI group chat desktop app — pull gpt, Claude, Gemini, DeepSeek into one conversation. Tauri 2 + React 19. - llt22/talkio
也感谢各公益站站长,让我可以凑齐GPT5.4,gemini3.1pro,grok4.2beta,Claude opus 4.6,kimi2.5,DeepSeek ,豆包2.0pro,glm5.1这一堆旗舰大模型
衷心感谢!!!
把这堆大模型用于群聊讨论,各个旗舰模型同时对一个问题发表分析,流程大概就是从推算-纠错-讨论-验证-统一意见-给出总结报告
本来这帮ai一般gpt和gemini3.1,Claude opus4.6都试过拿全群认同,这三个分析能力和分析细节经常被全群认可,国模基本上就没有当过一次意见领袖。
这里对豆包2.0pro进行批评,真是次次都被反驳,次次都被其他ai群友单独指责,一次半次就算了,这一周多一共组了四五十个群,保底两轮讨论,挨骂你次次都有份,赞扬一次没有,我真是服了
minimax也可以的,不过细节真不行,应该是模型参数太小,每次都要其他模型给他补充。
kimi2.5和glm5也有一些细节会被其他模型认同,不过更多是补充,算不上意见领袖
至于grok4.2beta,和国模差不多表现。
还有一个有趣的地方,gemini 好像对 gpt 有很大恶意,老是反驳对方,而且有时候冒出一些很尖锐的言论来怼 gpt,不知道为啥那么喜欢抓着 gpt 来怼
后来把glm5.1在黑与白公益上了后第一时间用上了,把glm5.1也加入到群中,玩了差不多两天,也拉了十几个群保底两轮这样。
震惊了真的震惊了
我发现glm5.1的发言每次都被gpt5.4和gemini3.1pro,claudeopus4.6赞扬!
本来结案陈词这活一直是gpt5.4或者claude干的,但是glm5.1出来后,一骑绝尘!每次都被推举为最好的,每次都被所有大模型称赞!连gemini和claude这两个包反驳都服服帖帖!数次辩论都让各位哑口无言!只能留下一句我认同glm5.1的观点,glm5.1已经说的非常全面,建议直接采纳glm5.1的意见。
强大!专注!有深度!有维度!有力度!
强的批爆!
俯首称臣!
补点图
IMG_20260329_1840121080×502 152 KB
IMG_20260329_1840421078×636 102 KB
IMG_20260329_1840581080×322 87.1 KB
--【壹】--:
建议来个写代码的质量评估讨论,看哪个模型能突围。
--【贰】--:
第二张是gpt,第三张是Claude
--【叁】--:
码住这个项目,我自己的AI gateway里有一百多个渠道+一百多个模型,可以玩玩多模型对话,圆桌,和发散思维
我之前都是在opencode里用omo或者其他插件做多模型agent的,有很多任务需要不同模型合作,有时候是其他模型反思方案,有时候是并行头脑风暴讨论,不过大多数都是基于项目的,这种chatbot的圆桌还是蛮有趣的
--【肆】--:
3.5plus比3.5强,3.5plus比KIMI2.5和GLM5差一点
--【伍】--:
豆包次次被骂绷不住了
--【陆】--:
过程呢?精彩不能只靠想象啊,来点图
--【柒】--:
刚才看了一个up主做了glm5.1的后端测试,部分测试甚至优于Claude,看来这模型做得很不错。
--【捌】--:
太会玩了
--【玖】--:
好的佬,太可惜了,一直挺喜欢qwen的,结果还是不够给力
--【拾】--:
最后那张图是不是gpt的啊
--【拾壹】--:
能否介绍一下是怎么玩的?我在想一个开发需求。或者一个什么问题,交给这几个大模型一起讨论讨论,在设定的一些原则下,他们会给出更好的思路。
--【拾贰】--:
下载talkio这个app,然后添加供应商,模型那里拉群就行了,多点一下,很简单的
--【拾叁】--:
晚上马上测测,GLM5.1适合当KOL
--【拾肆】--:
公益gpt全挂了,claude也难连,已经到了最危险的时候!头痛啊昨天还在爽蹬,今天全挂了,现在公益状态就像炒币一天一个样,今天不知道明天事,凑不齐这两巨头没法测
--【拾伍】--:
自己花钱订阅的,花钱payg的,L站里佬友的公益站,白嫖各种官方的,主要是自己的AI gateway有好的fallback策略,然后自己设置好等级,但是每天都要维护,还是很累的
--【拾陆】--:
狠狠的羡慕渠道
--【拾柒】--:
AI知道自己在群聊,就是你要控场一样,让他们先发表自己观点,发表观点一轮后让他们开始辩论,对某个发言人提出问题,然后逐渐让他家统一意见或者分好站队阵型,如果能统一意见就好,如果实在激辩七八轮都统一不了,就让他们按照阵型,给自家阵型投票选出谁做结案总结,你就可以拿到总结了去参考了。当然你还得防止AI不从事实客观上考虑,自己加上了一些对人安慰或者顺着你意思照顾你情绪的发言,所以你得要求他们客观中立,问题来自于网上啥的,不要表现问题是你自己的,他们就不会照顾你情绪了,要求他们严谨讨论,独立思考,不得被带偏,不照顾事主情绪,我不是事主,我希望得到一个客观中立的讨论结果。
再次DISS豆包,因为垃圾豆包就是这样别人说啥他都觉得对,很有道理,啥都要从情绪考虑,拉都拉不回来。
--【拾捌】--:
想知道qwen3.5是个什么水平
--【拾玖】--:
上图了

