Hermes agent 缓存命中问题
- 内容介绍
- 文章标签
- 相关推荐
最近在用Hermes agent,在使用过程中发现缓存命中率极低,求问各位佬有没有好的解决方案?
尝试让它自己解决,改了和时间戳、session id相关的东西,但似乎没有效果。
用的模型是中转站api接的gpt-5.4,在codex中能正常命中缓存。
--【壹】--:
如果用中转站的话,直接在控制台使用日志里就能看到
--【贰】--:
求教佬怎么让它走/v1/responses的?我的api支持responses,但在hermes里默认走chat completions
--【叁】--:
image1048×837 54.7 KB
我感觉还可以吧
--【肆】--:
chat completions更适合日常聊天窗口的对话。responses支持多轮推理,工具调用等,适合智能体
--【伍】--:
估计 api 的缓存控制方式不一样。需要确认 LLM Provider 是否适配
我用的 gpt5.4-mini, 反馈很快,感觉应该能命中… ( cpa 中转 codex 的 oauth)
--【陆】--:
啥是缓存命中啊,求问?我感觉我的hermes很爱搜索
--【柒】--:
暂时没有诶,我看当前hermes只支持三种api_mode,只有"chat_completions",“codex_responses”,"anthropic_messages"这三种,似乎不支持responses,不知道会不会是这个原因。
最近在用Hermes agent,在使用过程中发现缓存命中率极低,求问各位佬有没有好的解决方案?
尝试让它自己解决,改了和时间戳、session id相关的东西,但似乎没有效果。
用的模型是中转站api接的gpt-5.4,在codex中能正常命中缓存。
--【壹】--:
如果用中转站的话,直接在控制台使用日志里就能看到
--【贰】--:
求教佬怎么让它走/v1/responses的?我的api支持responses,但在hermes里默认走chat completions
--【叁】--:
image1048×837 54.7 KB
我感觉还可以吧
--【肆】--:
chat completions更适合日常聊天窗口的对话。responses支持多轮推理,工具调用等,适合智能体
--【伍】--:
估计 api 的缓存控制方式不一样。需要确认 LLM Provider 是否适配
我用的 gpt5.4-mini, 反馈很快,感觉应该能命中… ( cpa 中转 codex 的 oauth)
--【陆】--:
啥是缓存命中啊,求问?我感觉我的hermes很爱搜索
--【柒】--:
暂时没有诶,我看当前hermes只支持三种api_mode,只有"chat_completions",“codex_responses”,"anthropic_messages"这三种,似乎不支持responses,不知道会不会是这个原因。

