【论文工程落地】Meta-Harness 工程落地实践研究
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
arxiv.org
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
- 我的帖子已经打上 开源推广 标签: 是
- 我的开源项目完整开源,无未开源部分: 是
- 我的开源项目已链接认可 LINUX DO 社区: 是
- 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
- 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
Meta-Harness: End-to-End Optimization of Model Harnesses
偶然了解到了关于Harness的一篇研究论文,斯坦福大学(Stanford University)的研究团队于3月30日提出,其中核心理念是对于Agent编排环境 Harness Engineering 不仅需要搭建,还需要 自动化地搜索、发现和优化整个 harness 代码,使之在目标任务上表现更好。
自己有点想法,于是就有了以下这个开源项目,这几天搓了一个框架出来,目标是建立一个通用的自动化Harness评估框架,旨在能应用在不同领域不同任务中持续优化固定的工作流,举几个场景的例子:
- 应用层的持续优化:openclaw等智能体的日常自动化运营,比如网站爬取或者信息分析,同一目标的不同实现形式,使用的skills不同,工具方式不同,其中的成功率和成本是不一样的,这种情况通过自动化评估框架,给出不同方案的成功率,成本的比对,来持续优化固定的工作流。
问题描述:
arxiv.org
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
- 我的帖子已经打上 开源推广 标签: 是
- 我的开源项目完整开源,无未开源部分: 是
- 我的开源项目已链接认可 LINUX DO 社区: 是
- 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
- 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
Meta-Harness: End-to-End Optimization of Model Harnesses
偶然了解到了关于Harness的一篇研究论文,斯坦福大学(Stanford University)的研究团队于3月30日提出,其中核心理念是对于Agent编排环境 Harness Engineering 不仅需要搭建,还需要 自动化地搜索、发现和优化整个 harness 代码,使之在目标任务上表现更好。
自己有点想法,于是就有了以下这个开源项目,这几天搓了一个框架出来,目标是建立一个通用的自动化Harness评估框架,旨在能应用在不同领域不同任务中持续优化固定的工作流,举几个场景的例子:
- 应用层的持续优化:openclaw等智能体的日常自动化运营,比如网站爬取或者信息分析,同一目标的不同实现形式,使用的skills不同,工具方式不同,其中的成功率和成本是不一样的,这种情况通过自动化评估框架,给出不同方案的成功率,成本的比对,来持续优化固定的工作流。

