近期兴起的AI领域热词“harness”
- 内容介绍
- 文章标签
- 相关推荐
近期ai领域又兴起了harness这个名词(在此之前harness似乎和测试框架这类东西绑定更深一些),
但是感觉有些莫名其妙,不像mcp,skill至少对应真实的新出现的技术/概念,harness感觉更像指代claude code之于sonnet,opus或者codex之于gpt的关系,或者说一个广义的agent框架,不知道为什么要新起个名字
网友解答:--【壹】--:
我感觉类似于openspec或者superpowers吧,只是一个面对的是写代码,一个面对的是更通用的Agent和任务?
--【贰】--:
将提示词工程和上下文工程再加上外部Agent编排器打包一下,就是harness Engineering ,一点点外延而已,大部分人跟风吹吹概念,工程落地的少之又少
--【叁】--:
居然还是付费阅读。。。。
--【肆】--:
这东西还好意思开付费
--【伍】--: 翎:
在此之前harness似乎和测试框架这类东西绑定更深一些
其实就是这个引申吧,主要体现一套反馈流程,不过不是很喜欢这个词
--【陆】--:
→ harness 是互联网公司重新发明的新词还是有独特的创新之处?
--【柒】--:
所以,这个单词是什么意思呢
--【捌】--:
cc代码能力公认的第一。除了ai本身强以外,更多的还是cc系统设计的牛逼
--【玖】--:
我理解可能是为了澄清agent,不然到处都是agent,agent应该更多指模型,harness则是为agent配套的环境和工具
--【拾】--:
跟楼主理解的类比关系是不太一样的
--【拾壹】--:
其实就是cc那个里面的流程,只是说比较工业化稳定点的约束,
--【拾贰】--:
Harness Engineering 其实可看作 AI 工程领域提示词工程 、上下文工程之后,第三次迁移的工程重心。
一开始,大家主要靠 Prompt Engineering 提升效果,通过不断打磨提示词,让模型更准确地理解任务、输出更符合预期的结果。后来随着 LLM 能力持续增强,模型对自然语言意图的理解已经足够强,很多时候不再需要特别精细、结构化的 prompt,也能取得不错的效果。
再往后,优化重点逐渐转向 Context Engineering:核心问题变成了,如何在有限的上下文窗口里,更高效地组织信息、调用记忆、补充背景,从而尽可能榨干模型能力。本质上,是在“有限注意力”条件下追求效果最优。现在上下文窗口越来越大,单纯优化 context 带来的收益已经开始接近边际递减。
严格来说,Harness Engineering 并不是什么全新的概念 ,最近Claude Code代码泄露才让这个概念突然有热度。大家开始意识到:LLM 本身能力已经很强,现在最有性价比的优化,不再只是抠 prompt 或 context,而是围绕模型外部的工具、流程、执行框架、反馈闭环等进行系统性设计。
--【拾叁】--:
缰绳……
--【拾肆】--:
中午刚读完相关的内容,玉树兰芝今天上午刚发了一个公众号
“什么是Harness Engineering”,可以看看
近期ai领域又兴起了harness这个名词(在此之前harness似乎和测试框架这类东西绑定更深一些),
但是感觉有些莫名其妙,不像mcp,skill至少对应真实的新出现的技术/概念,harness感觉更像指代claude code之于sonnet,opus或者codex之于gpt的关系,或者说一个广义的agent框架,不知道为什么要新起个名字
网友解答:--【壹】--:
我感觉类似于openspec或者superpowers吧,只是一个面对的是写代码,一个面对的是更通用的Agent和任务?
--【贰】--:
将提示词工程和上下文工程再加上外部Agent编排器打包一下,就是harness Engineering ,一点点外延而已,大部分人跟风吹吹概念,工程落地的少之又少
--【叁】--:
居然还是付费阅读。。。。
--【肆】--:
这东西还好意思开付费
--【伍】--: 翎:
在此之前harness似乎和测试框架这类东西绑定更深一些
其实就是这个引申吧,主要体现一套反馈流程,不过不是很喜欢这个词
--【陆】--:
→ harness 是互联网公司重新发明的新词还是有独特的创新之处?
--【柒】--:
所以,这个单词是什么意思呢
--【捌】--:
cc代码能力公认的第一。除了ai本身强以外,更多的还是cc系统设计的牛逼
--【玖】--:
我理解可能是为了澄清agent,不然到处都是agent,agent应该更多指模型,harness则是为agent配套的环境和工具
--【拾】--:
跟楼主理解的类比关系是不太一样的
--【拾壹】--:
其实就是cc那个里面的流程,只是说比较工业化稳定点的约束,
--【拾贰】--:
Harness Engineering 其实可看作 AI 工程领域提示词工程 、上下文工程之后,第三次迁移的工程重心。
一开始,大家主要靠 Prompt Engineering 提升效果,通过不断打磨提示词,让模型更准确地理解任务、输出更符合预期的结果。后来随着 LLM 能力持续增强,模型对自然语言意图的理解已经足够强,很多时候不再需要特别精细、结构化的 prompt,也能取得不错的效果。
再往后,优化重点逐渐转向 Context Engineering:核心问题变成了,如何在有限的上下文窗口里,更高效地组织信息、调用记忆、补充背景,从而尽可能榨干模型能力。本质上,是在“有限注意力”条件下追求效果最优。现在上下文窗口越来越大,单纯优化 context 带来的收益已经开始接近边际递减。
严格来说,Harness Engineering 并不是什么全新的概念 ,最近Claude Code代码泄露才让这个概念突然有热度。大家开始意识到:LLM 本身能力已经很强,现在最有性价比的优化,不再只是抠 prompt 或 context,而是围绕模型外部的工具、流程、执行框架、反馈闭环等进行系统性设计。
--【拾叁】--:
缰绳……
--【拾肆】--:
中午刚读完相关的内容,玉树兰芝今天上午刚发了一个公众号
“什么是Harness Engineering”,可以看看

