HermesAgent本地部署免费吗?隐藏成本和API费用如何计算?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1349个文字,预计阅读时间需要6分钟。
如果您在使用Hermes Agent过程中发现账户余额异常减少、API调用额度快速耗尽或收到第三方服务商的账单,可能是由于以下原因:
一、核查模型推理链路中的付费 provider
Hermes Agent 的大模型调用由 config.yaml 中 model.provider 字段控制,若该字段值为 openai、anthropic、azure、spark、groq(非免费 tier)等,即表示每次对话请求均经由对应云服务商计费接口转发,费用按 token 数、调用次数或时长实时结算,即使未显式配置 API Key,部分 provider 也可能启用带额度限制的试用接口并自动扣费。
1、执行 hermes config list 查看当前生效的 model.provider 与 model.default 值。
2、打开 ~/.hermes/config.yaml 文件,检查 model.provider 字段是否为 openai、anthropic、spark、azure 等商业标识。
3、若确认为商业 provider,立即执行 hermes config set model.provider ollama 或 hermes config set model.provider llama.cpp 切换至本地免密推理后端。
4、运行 hermes config set model.base_url http://localhost:11434/v1(适配 Ollama)或指定本地 GGUF 模型路径,确保请求不再外发。
本文共计1349个文字,预计阅读时间需要6分钟。
如果您在使用Hermes Agent过程中发现账户余额异常减少、API调用额度快速耗尽或收到第三方服务商的账单,可能是由于以下原因:
一、核查模型推理链路中的付费 provider
Hermes Agent 的大模型调用由 config.yaml 中 model.provider 字段控制,若该字段值为 openai、anthropic、azure、spark、groq(非免费 tier)等,即表示每次对话请求均经由对应云服务商计费接口转发,费用按 token 数、调用次数或时长实时结算,即使未显式配置 API Key,部分 provider 也可能启用带额度限制的试用接口并自动扣费。
1、执行 hermes config list 查看当前生效的 model.provider 与 model.default 值。
2、打开 ~/.hermes/config.yaml 文件,检查 model.provider 字段是否为 openai、anthropic、spark、azure 等商业标识。
3、若确认为商业 provider,立即执行 hermes config set model.provider ollama 或 hermes config set model.provider llama.cpp 切换至本地免密推理后端。
4、运行 hermes config set model.base_url http://localhost:11434/v1(适配 Ollama)或指定本地 GGUF 模型路径,确保请求不再外发。

