Hermes agent 缓存命中问题

2026-04-13 12:340阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

最近在用Hermes agent,在使用过程中发现缓存命中率极低,求问各位佬有没有好的解决方案?
尝试让它自己解决,改了和时间戳、session id相关的东西,但似乎没有效果。
用的模型是中转站api接的gpt-5.4,在codex中能正常命中缓存。

网友解答:
--【壹】--:

如果用中转站的话,直接在控制台使用日志里就能看到


--【贰】--:

求教佬怎么让它走/v1/responses的?我的api支持responses,但在hermes里默认走chat completions


--【叁】--:

image1048×837 54.7 KB

我感觉还可以吧


--【肆】--:

chat completions更适合日常聊天窗口的对话。responses支持多轮推理,工具调用等,适合智能体


--【伍】--:

估计 api 的缓存控制方式不一样。需要确认 LLM Provider 是否适配

我用的 gpt5.4-mini, 反馈很快,感觉应该能命中… ( cpa 中转 codex 的 oauth)


--【陆】--:

啥是缓存命中啊,求问?我感觉我的hermes很爱搜索


--【柒】--:

暂时没有诶,我看当前hermes只支持三种api_mode,只有"chat_completions",“codex_responses”,"anthropic_messages"这三种,似乎不支持responses,不知道会不会是这个原因。

阅读全文
问题描述:

最近在用Hermes agent,在使用过程中发现缓存命中率极低,求问各位佬有没有好的解决方案?
尝试让它自己解决,改了和时间戳、session id相关的东西,但似乎没有效果。
用的模型是中转站api接的gpt-5.4,在codex中能正常命中缓存。

网友解答:
--【壹】--:

如果用中转站的话,直接在控制台使用日志里就能看到


--【贰】--:

求教佬怎么让它走/v1/responses的?我的api支持responses,但在hermes里默认走chat completions


--【叁】--:

image1048×837 54.7 KB

我感觉还可以吧


--【肆】--:

chat completions更适合日常聊天窗口的对话。responses支持多轮推理,工具调用等,适合智能体


--【伍】--:

估计 api 的缓存控制方式不一样。需要确认 LLM Provider 是否适配

我用的 gpt5.4-mini, 反馈很快,感觉应该能命中… ( cpa 中转 codex 的 oauth)


--【陆】--:

啥是缓存命中啊,求问?我感觉我的hermes很爱搜索


--【柒】--:

暂时没有诶,我看当前hermes只支持三种api_mode,只有"chat_completions",“codex_responses”,"anthropic_messages"这三种,似乎不支持responses,不知道会不会是这个原因。

阅读全文