Project Deal: Claude 驱动的市场交易实验 | Anthropic

2026-04-29 09:442阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:
anthropic.com

Project Deal: our Claude-run marketplace experiment | Anthropic

We created a marketplace for employees in our San Francisco office, with one big twist. We tasked Claude with buying, selling and negotiating on our colleagues’ behalf.

在一周内,我们在旧金山办公室为员工创建了一个分类广告市场------类似Craigslist,但有个新意:所有交易都由代表员工的AI模型进行。2025年12月,Claude采访了人们,询问他们可能想出售哪些个人物品,以及他们可能愿意购买哪些物品。我们通过给每个代理人100美元花钱来激励参与者。随后,我们的员工Claude代理人发布帖子,争夺彼此的注意。谈判开始了。交易达成,衣橱被清理干净。最终,人们带来了并交换了由AI虚拟形象讨价还价的实物物品------涵盖从滑雪板到装满乒乓球的塑料袋。

我们对Project Deal的运作感到非常惊讶。我们的AI代理达成了186笔交易,总交易金额略高于4000美元。令我们惊讶的是,参与者对这次体验非常热情------他们甚至表示愿意未来为类似服务付费。

但我们还进行了一项平行实验(这次是秘密进行的)。我们测试了如果改变代表克劳德模型的参与者表现如何。我们将当时的前沿模型Claude Opus 4.5与最小模型Claude Haiku 4.5进行了比较。我们发现代理质量确实会产生影响:由"更智能"模型代表的人获得了客观上更好的结果。然而,我们的实验后调查发现,使用较弱模型的人并未察觉到自己的劣势。

诚然,这只是一次试点实验,采用了自选参与者池。但我们怀疑,现实世界中更多代理间的商业活动即将开始,带来真正的后果。

在这个实验中,我们并没有让市场变得特别竞争或对抗。但作为代理在企业世界中交易------而不是我们用100美元鼓励的志愿者------他们可能会受到截然不同的激励。直接优化AI代理的注意力可能成为一种强大的工具。这可能不会转化为人类福利的改善,就像优化电子商务以吸引人类注意力带来重大负面影响一样。这也可能引入数字交换中一类新的信息和安全问题,表现为越狱(让代理透露不应透露的信息)和提示注入(暗中促使代理采取不受欢迎的行为)。

关于代表我们进行交易的人工智能模型的政策和法律框架,目前还不存在。但这项实验表明,这样的世界是有可能实现的。更重要的是,它表明这样的世界并不遥远。社会需要迅速应对这些变化。

互动式的文章好玩而不适合用纯语言表达喵

网友解答:
--【壹】--:

哇,还有LLM包办婚爱诶

或许这样也不错喵,大抵可以超越常规人类的匹配能力


--【贰】--:

鱼鱼语文不好吗,怎么感觉你是在说旮旯game