HermesAgent的四级记忆结构间是如何相互协作运作的?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1825个文字,预计阅读时间需要8分钟。
如果正在研究Hermes Agent的记忆系统,但发现各层功能边界模糊、调用逻辑不清晰,可能是由于未充分优化四层记忆在数据流与生命周期中的分工关系。以下是解析其协同工作机制的步骤:
一、工作记忆:维持当前任务连贯性的环形缓冲区
工作记忆作为最靠近执行层的记忆模块,承担即时上下文管理职责,确保单次会话中工具调用、状态流转与中间变量的一致性。它不参与跨会话知识沉淀,而是通过容量约束与自动轮转机制防止上下文膨胀干扰推理。
1、该层以环形缓冲区实现,仅保留最近90次工具调用的完整输入输出及元数据。
2、每次新工具调用写入时,若缓冲区已满,则最早一条记录被自动覆盖。
3、缓冲区内容全程驻留内存,不落盘、不索引,仅服务于当前会话的实时决策链。
二、情景记忆:基于SQLite+FTS5的持久化交互轨迹库
情景记忆负责跨会话事实存储,将用户指令、项目约定、环境配置等具象交互结果结构化归档,为后续检索提供可验证的历史依据。其核心价值在于支持“按需唤醒”,而非全量加载。
1、所有完成的会话片段经标准化清洗后,写入本地SQLite数据库的episodes表。
2、每条记录同步生成关键词标签与LLM生成的语义摘要,并启用FTS5全文索引。
3、当Agent判断当前任务需历史参考时,触发检索接口,返回Top-3匹配摘要而非原始日志。
三、语义记忆:内存缓存的嵌入向量知识图谱
语义记忆抽象并固化领域通用规则、技术栈规范、业务术语定义等非情境化知识,以向量形式驻留内存,支撑跨文档关联推理与概念泛化。它不依赖具体时间戳或会话ID,而是通过相似性匹配激活。
1、初始语义知识由初始化配置注入,包括技术栈清单、API限制说明、合规条款等。
2、运行中经LLM提炼的新规则(如“该客户禁止使用HTTP明文上传”)被实时编码为嵌入向量。
本文共计1825个文字,预计阅读时间需要8分钟。
如果正在研究Hermes Agent的记忆系统,但发现各层功能边界模糊、调用逻辑不清晰,可能是由于未充分优化四层记忆在数据流与生命周期中的分工关系。以下是解析其协同工作机制的步骤:
一、工作记忆:维持当前任务连贯性的环形缓冲区
工作记忆作为最靠近执行层的记忆模块,承担即时上下文管理职责,确保单次会话中工具调用、状态流转与中间变量的一致性。它不参与跨会话知识沉淀,而是通过容量约束与自动轮转机制防止上下文膨胀干扰推理。
1、该层以环形缓冲区实现,仅保留最近90次工具调用的完整输入输出及元数据。
2、每次新工具调用写入时,若缓冲区已满,则最早一条记录被自动覆盖。
3、缓冲区内容全程驻留内存,不落盘、不索引,仅服务于当前会话的实时决策链。
二、情景记忆:基于SQLite+FTS5的持久化交互轨迹库
情景记忆负责跨会话事实存储,将用户指令、项目约定、环境配置等具象交互结果结构化归档,为后续检索提供可验证的历史依据。其核心价值在于支持“按需唤醒”,而非全量加载。
1、所有完成的会话片段经标准化清洗后,写入本地SQLite数据库的episodes表。
2、每条记录同步生成关键词标签与LLM生成的语义摘要,并启用FTS5全文索引。
3、当Agent判断当前任务需历史参考时,触发检索接口,返回Top-3匹配摘要而非原始日志。
三、语义记忆:内存缓存的嵌入向量知识图谱
语义记忆抽象并固化领域通用规则、技术栈规范、业务术语定义等非情境化知识,以向量形式驻留内存,支撑跨文档关联推理与概念泛化。它不依赖具体时间戳或会话ID,而是通过相似性匹配激活。
1、初始语义知识由初始化配置注入,包括技术栈清单、API限制说明、合规条款等。
2、运行中经LLM提炼的新规则(如“该客户禁止使用HTTP明文上传”)被实时编码为嵌入向量。

