glm5.1在ai群聊中成为意见领袖,各ai旗舰模型的表现不完全点评

2026-04-13 12:520阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

@man9527 用佬友的ai群聊项目玩了一周多

GitHub

Releases · llt22/talkio

Local-first multi-AI group chat desktop app — pull gpt, Claude, Gemini, DeepSeek into one conversation. Tauri 2 + React 19. - llt22/talkio

也感谢各公益站站长,让我可以凑齐GPT5.4,gemini3.1pro,grok4.2beta,Claude opus 4.6,kimi2.5,DeepSeek ,豆包2.0pro,glm5.1这一堆旗舰大模型
衷心感谢!!!

把这堆大模型用于群聊讨论,各个旗舰模型同时对一个问题发表分析,流程大概就是从推算-纠错-讨论-验证-统一意见-给出总结报告

本来这帮ai一般gpt和gemini3.1,Claude opus4.6都试过拿全群认同,这三个分析能力和分析细节经常被全群认可,国模基本上就没有当过一次意见领袖。
这里对豆包2.0pro进行批评,真是次次都被反驳,次次都被其他ai群友单独指责,一次半次就算了,这一周多一共组了四五十个群,保底两轮讨论,挨骂你次次都有份,赞扬一次没有,我真是服了
minimax也可以的,不过细节真不行,应该是模型参数太小,每次都要其他模型给他补充。
kimi2.5和glm5也有一些细节会被其他模型认同,不过更多是补充,算不上意见领袖
至于grok4.2beta,和国模差不多表现。