一个关于harness大胆预测
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
最近harness各位是不是很迷茫,上一秒我还在到处跟同事吹SDD,spec-kit,bmad还没缓过来它就一下子跳出来了;harness似乎当下只是一个工程化方法论,至少目前我还没看到一个成熟的体系框架;按照我个人理解,完整harness需要拥有以下的东西,大胆预测以下,未来会不会把下面的东西做成插件,每一个都可以动态加载与替代,毕竟harness是属于工程化的东西,是需要经过实践才知道哪种最好最适合,不是一层不变的。举个例子就是,调度核心可以使用crewAI,工具系统使用daytona,记忆系统可以使用mem0;甚至甚至调度核心里面的任务拆分可以换成不同SDD,例如bmad spec-kit,然后比对不同的方案效果
- 调度核心 任务规划与协调,决策加载什么上下文(包括别的任务记忆),跨任务协作。 例如 CrewAI Temporal
- 工具系统 维护工具动态注册表 (mcp skill hook tool)与工具权限系统 沙箱环境。例如虚拟机沙箱 E2B
- 状态管理 记忆的分层管理,长期记忆 项目记忆 任务过程记忆 任务会话记忆 代码规范 安全规范 架构设计 执行文档 规划文档 产品文档。例如 mem0 Zep
- 可观测和评估 这一个往往是大伙不注重的 包含一个评估任务完成与否的规则与体系和记录观测日志。例如 Arize Phoenix
- 差错恢复 差错恢复的时候是整体任务重新执行还是只是对任务中某个工具调用恢复
对了,对了,对了,各位老友上面都只是我个人对harness的理解,大伙有不同意见的一定要在下面评论。
问题描述:
最近harness各位是不是很迷茫,上一秒我还在到处跟同事吹SDD,spec-kit,bmad还没缓过来它就一下子跳出来了;harness似乎当下只是一个工程化方法论,至少目前我还没看到一个成熟的体系框架;按照我个人理解,完整harness需要拥有以下的东西,大胆预测以下,未来会不会把下面的东西做成插件,每一个都可以动态加载与替代,毕竟harness是属于工程化的东西,是需要经过实践才知道哪种最好最适合,不是一层不变的。举个例子就是,调度核心可以使用crewAI,工具系统使用daytona,记忆系统可以使用mem0;甚至甚至调度核心里面的任务拆分可以换成不同SDD,例如bmad spec-kit,然后比对不同的方案效果
- 调度核心 任务规划与协调,决策加载什么上下文(包括别的任务记忆),跨任务协作。 例如 CrewAI Temporal
- 工具系统 维护工具动态注册表 (mcp skill hook tool)与工具权限系统 沙箱环境。例如虚拟机沙箱 E2B
- 状态管理 记忆的分层管理,长期记忆 项目记忆 任务过程记忆 任务会话记忆 代码规范 安全规范 架构设计 执行文档 规划文档 产品文档。例如 mem0 Zep
- 可观测和评估 这一个往往是大伙不注重的 包含一个评估任务完成与否的规则与体系和记录观测日志。例如 Arize Phoenix
- 差错恢复 差错恢复的时候是整体任务重新执行还是只是对任务中某个工具调用恢复
对了,对了,对了,各位老友上面都只是我个人对harness的理解,大伙有不同意见的一定要在下面评论。

