Project Deal: Claude 驱动的市场交易实验 | Anthropic

2026-04-29 09:441阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:
anthropic.com

Project Deal: our Claude-run marketplace experiment | Anthropic

We created a marketplace for employees in our San Francisco office, with one big twist. We tasked Claude with buying, selling and negotiating on our colleagues’ behalf.

在一周内,我们在旧金山办公室为员工创建了一个分类广告市场------类似Craigslist,但有个新意:所有交易都由代表员工的AI模型进行。2025年12月,Claude采访了人们,询问他们可能想出售哪些个人物品,以及他们可能愿意购买哪些物品。我们通过给每个代理人100美元花钱来激励参与者。随后,我们的员工Claude代理人发布帖子,争夺彼此的注意。谈判开始了。交易达成,衣橱被清理干净。最终,人们带来了并交换了由AI虚拟形象讨价还价的实物物品------涵盖从滑雪板到装满乒乓球的塑料袋。

我们对Project Deal的运作感到非常惊讶。我们的AI代理达成了186笔交易,总交易金额略高于4000美元。令我们惊讶的是,参与者对这次体验非常热情------他们甚至表示愿意未来为类似服务付费。

但我们还进行了一项平行实验(这次是秘密进行的)。我们测试了如果改变代表克劳德模型的参与者表现如何。我们将当时的前沿模型Claude Opus 4.5与最小模型Claude Haiku 4.5进行了比较。我们发现代理质量确实会产生影响:由"更智能"模型代表的人获得了客观上更好的结果。然而,我们的实验后调查发现,使用较弱模型的人并未察觉到自己的劣势。

诚然,这只是一次试点实验,采用了自选参与者池。