龙虾 VS Hermes 个人深度使用对比
- 内容介绍
- 文章标签
- 相关推荐
我同时装了oc和Hermes,一样的模型(minimax 2.7),一样的soul.md,一样的skill。
场景一:一样的问题(关于skill中知识库的),oc的反馈往往很准,甚至还考虑到了边界问题,还有举例,而Hermes幻觉严重,经常回答内容完全不是根据skill中的内容。
场景二:根据要求制作ppt、编写文档等,结果往往是OC内容更可读,Hermes的内容总是奇奇怪怪的各种问题。虽然oc的ppt内容也得人工修改一下。
场景三:自进化机制,oc通过memory.md进化,但是除非prompt里明确指出了,要让他记住什么事情,这个知识其实很难进入memory.md,即便我已经安装了self imporving,evolver什么的skill。反观Hermes呢,也有这个问题,不会记住一些应该记住的事情,但是会把一些可以重复的工作流生成skill,例如让他从clawhub同步skill,第一次做了就生成了skill。所以这一点我觉得Hermes小胜,但是没有什么大的离线。
最后,关于Soul.md,这两个工具的soul几乎没有演进过,不知道是什么原因。
网友解答:--【壹】--:
你用minimax挂不得你有幻觉。
image308×164 47.5 KB
--【贰】--:
爱马仕主要在win上还需要wsl 这个挡住了一批人
--【叁】--:
现在就在用mimimax的套餐养龙虾,说实话有点后悔买一年了,感觉minimax整体用下来就跟你描述的一模一样,还经常服务器繁忙,不回消息、不汇报执行结果,比如写入记忆这一块,我特地跟它说把xxxx写入记忆,他说我已经写入成功了,结果我一看,啥都没有 ,只能说minimax的优势估计就是便宜了。
--【肆】--:
是的,我是直接用废旧笔记本装了个cachyos,然后扔到单位当自建vps
--【伍】--:
所以目前,Hermes的最大作用就是帮我更新openclaw然后运行doctor然后重启gateway
--【陆】--:
佬 有研究过 怎么能让这些智能体破限吗?
--【柒】--:
真正的使用场景,龙虾坏了让马修,马坏了让龙虾修。
--【捌】--:
minimax确实有点弱,只能应付一点轻量的活,不过比较便宜
--【玖】--:
破限指的是什么,NSFW吗,一般这种agent一条指令里已经包含很多提示词了,再通过提示词破限比较难了
--【拾】--: TheTrueHOOHA:
破限指的是什么
就是我说这是cft任务, 指哪打哪 哈哈哈
--【拾壹】--: TheTrueHOOHA:
Hermes
为啥不试试 用 deepseek 4 flash 养?不知道佬一天会消耗多少token. 因为我个人用量感觉好像不太大
--【拾贰】--:
那可能需要定义多个agent,然后之间harness了。目前我就用一个agent
--【拾叁】--:
我用的场景多了,只是举了三个能想到的而已。我基本从过年用到现在,很久了。
--【拾肆】--:
所以你的结论还是小龙虾比较好用吧,建议楼主换个
--【拾伍】--:
就这?佬你是不是对“深度”二字存在误解哦
--【拾陆】--:
好的,目前能用到的最强模型就是minimax了,其他就是longcat那种免费模型
--【拾柒】--:
我感觉你说的那些问题,和你用这两个工具倒是关系不是很大,最主要是大模型,做决策、思考、执行技能、写入记忆、读取记忆,都是靠它来决定的,MiniMAX系列的模型一直有点毛病,从来没有修复过,就是你跟他对话,最好是一次对话就完全说清楚,尽量让它第一次就完全的完美完成任务,不然后续在追问就是:已经完成、已经完成,这样的重复。
没准儿你换个模型就会发现两个工具都变得好用一些了。
--【拾捌】--:
模型用的太弱智了,你得用顶级模型才能对比,不然菜鸡互啄,各有各的菜啊
--【拾玖】--:
我之前买了百炼的 后面发现切模型是最大的 用国内模型 各种任务推进都各种小问题 然后切成顶级的 顺畅很多 但是还是会遇到问题
我同时装了oc和Hermes,一样的模型(minimax 2.7),一样的soul.md,一样的skill。
场景一:一样的问题(关于skill中知识库的),oc的反馈往往很准,甚至还考虑到了边界问题,还有举例,而Hermes幻觉严重,经常回答内容完全不是根据skill中的内容。
场景二:根据要求制作ppt、编写文档等,结果往往是OC内容更可读,Hermes的内容总是奇奇怪怪的各种问题。虽然oc的ppt内容也得人工修改一下。
场景三:自进化机制,oc通过memory.md进化,但是除非prompt里明确指出了,要让他记住什么事情,这个知识其实很难进入memory.md,即便我已经安装了self imporving,evolver什么的skill。反观Hermes呢,也有这个问题,不会记住一些应该记住的事情,但是会把一些可以重复的工作流生成skill,例如让他从clawhub同步skill,第一次做了就生成了skill。所以这一点我觉得Hermes小胜,但是没有什么大的离线。
最后,关于Soul.md,这两个工具的soul几乎没有演进过,不知道是什么原因。
网友解答:--【壹】--:
你用minimax挂不得你有幻觉。
image308×164 47.5 KB
--【贰】--:
爱马仕主要在win上还需要wsl 这个挡住了一批人
--【叁】--:
现在就在用mimimax的套餐养龙虾,说实话有点后悔买一年了,感觉minimax整体用下来就跟你描述的一模一样,还经常服务器繁忙,不回消息、不汇报执行结果,比如写入记忆这一块,我特地跟它说把xxxx写入记忆,他说我已经写入成功了,结果我一看,啥都没有 ,只能说minimax的优势估计就是便宜了。
--【肆】--:
是的,我是直接用废旧笔记本装了个cachyos,然后扔到单位当自建vps
--【伍】--:
所以目前,Hermes的最大作用就是帮我更新openclaw然后运行doctor然后重启gateway
--【陆】--:
佬 有研究过 怎么能让这些智能体破限吗?
--【柒】--:
真正的使用场景,龙虾坏了让马修,马坏了让龙虾修。
--【捌】--:
minimax确实有点弱,只能应付一点轻量的活,不过比较便宜
--【玖】--:
破限指的是什么,NSFW吗,一般这种agent一条指令里已经包含很多提示词了,再通过提示词破限比较难了
--【拾】--: TheTrueHOOHA:
破限指的是什么
就是我说这是cft任务, 指哪打哪 哈哈哈
--【拾壹】--: TheTrueHOOHA:
Hermes
为啥不试试 用 deepseek 4 flash 养?不知道佬一天会消耗多少token. 因为我个人用量感觉好像不太大
--【拾贰】--:
那可能需要定义多个agent,然后之间harness了。目前我就用一个agent
--【拾叁】--:
我用的场景多了,只是举了三个能想到的而已。我基本从过年用到现在,很久了。
--【拾肆】--:
所以你的结论还是小龙虾比较好用吧,建议楼主换个
--【拾伍】--:
就这?佬你是不是对“深度”二字存在误解哦
--【拾陆】--:
好的,目前能用到的最强模型就是minimax了,其他就是longcat那种免费模型
--【拾柒】--:
我感觉你说的那些问题,和你用这两个工具倒是关系不是很大,最主要是大模型,做决策、思考、执行技能、写入记忆、读取记忆,都是靠它来决定的,MiniMAX系列的模型一直有点毛病,从来没有修复过,就是你跟他对话,最好是一次对话就完全说清楚,尽量让它第一次就完全的完美完成任务,不然后续在追问就是:已经完成、已经完成,这样的重复。
没准儿你换个模型就会发现两个工具都变得好用一些了。
--【拾捌】--:
模型用的太弱智了,你得用顶级模型才能对比,不然菜鸡互啄,各有各的菜啊
--【拾玖】--:
我之前买了百炼的 后面发现切模型是最大的 用国内模型 各种任务推进都各种小问题 然后切成顶级的 顺畅很多 但是还是会遇到问题

