Project Deal: Claude 驱动的市场交易实验 | Anthropic

2026-04-29 09:442阅读0评论SEO资源

内容介绍
文章标签
相关推荐

问题描述：

anthropic.com

Project Deal: our Claude-run marketplace experiment | Anthropic

We created a marketplace for employees in our San Francisco office, with one big twist. We tasked Claude with buying, selling and negotiating on our colleagues’ behalf.

在一周内，我们在旧金山办公室为员工创建了一个分类广告市场------类似Craigslist，但有个新意：所有交易都由代表员工的AI模型进行。2025年12月，Claude采访了人们，询问他们可能想出售哪些个人物品，以及他们可能愿意购买哪些物品。我们通过给每个代理人100美元花钱来激励参与者。随后，我们的员工Claude代理人发布帖子，争夺彼此的注意。谈判开始了。交易达成，衣橱被清理干净。最终，人们带来了并交换了由AI虚拟形象讨价还价的实物物品------涵盖从滑雪板到装满乒乓球的塑料袋。

我们对Project Deal的运作感到非常惊讶。我们的AI代理达成了186笔交易，总交易金额略高于4000美元。令我们惊讶的是，参与者对这次体验非常热情------他们甚至表示愿意未来为类似服务付费。

但我们还进行了一项平行实验（这次是秘密进行的）。我们测试了如果改变代表克劳德模型的参与者表现如何。我们将当时的前沿模型Claude Opus 4.5与最小模型Claude Haiku 4.5进行了比较。我们发现代理质量确实会产生影响：由"更智能"模型代表的人获得了客观上更好的结果。然而，我们的实验后调查发现，使用较弱模型的人并未察觉到自己的劣势。

诚然，这只是一次试点实验，采用了自选参与者池。但我们怀疑，现实世界中更多代理间的商业活动即将开始，带来真正的后果。

在这个实验中，我们并没有让市场变得特别竞争或对抗。但作为代理在企业世界中交易------而不是我们用100美元鼓励的志愿者------他们可能会受到截然不同的激励。直接优化AI代理的注意力可能成为一种强大的工具。这可能不会转化为人类福利的改善，就像优化电子商务以吸引人类注意力带来重大负面影响一样。这也可能引入数字交换中一类新的信息和安全问题，表现为越狱（让代理透露不应透露的信息）和提示注入（暗中促使代理采取不受欢迎的行为）。

关于代表我们进行交易的人工智能模型的政策和法律框架，目前还不存在。但这项实验表明，这样的世界是有可能实现的。更重要的是，它表明这样的世界并不遥远。社会需要迅速应对这些变化。

互动式的文章好玩而不适合用纯语言表达喵

网友解答：

--【壹】--：

哇，还有LLM包办婚爱诶

或许这样也不错喵，大抵可以超越常规人类的匹配能力

--【贰】--：

鱼鱼语文不好吗，怎么感觉你是在说旮旯game

标签：转载

问题描述：

anthropic.com

Project Deal: our Claude-run marketplace experiment | Anthropic

We created a marketplace for employees in our San Francisco office, with one big twist. We tasked Claude with buying, selling and negotiating on our colleagues’ behalf.

在一周内，我们在旧金山办公室为员工创建了一个分类广告市场------类似Craigslist，但有个新意：所有交易都由代表员工的AI模型进行。2025年12月，Claude采访了人们，询问他们可能想出售哪些个人物品，以及他们可能愿意购买哪些物品。我们通过给每个代理人100美元花钱来激励参与者。随后，我们的员工Claude代理人发布帖子，争夺彼此的注意。谈判开始了。交易达成，衣橱被清理干净。最终，人们带来了并交换了由AI虚拟形象讨价还价的实物物品------涵盖从滑雪板到装满乒乓球的塑料袋。

我们对Project Deal的运作感到非常惊讶。我们的AI代理达成了186笔交易，总交易金额略高于4000美元。令我们惊讶的是，参与者对这次体验非常热情------他们甚至表示愿意未来为类似服务付费。

但我们还进行了一项平行实验（这次是秘密进行的）。我们测试了如果改变代表克劳德模型的参与者表现如何。我们将当时的前沿模型Claude Opus 4.5与最小模型Claude Haiku 4.5进行了比较。我们发现代理质量确实会产生影响：由"更智能"模型代表的人获得了客观上更好的结果。然而，我们的实验后调查发现，使用较弱模型的人并未察觉到自己的劣势。

诚然，这只是一次试点实验，采用了自选参与者池。但我们怀疑，现实世界中更多代理间的商业活动即将开始，带来真正的后果。

在这个实验中，我们并没有让市场变得特别竞争或对抗。但作为代理在企业世界中交易------而不是我们用100美元鼓励的志愿者------他们可能会受到截然不同的激励。直接优化AI代理的注意力可能成为一种强大的工具。这可能不会转化为人类福利的改善，就像优化电子商务以吸引人类注意力带来重大负面影响一样。这也可能引入数字交换中一类新的信息和安全问题，表现为越狱（让代理透露不应透露的信息）和提示注入（暗中促使代理采取不受欢迎的行为）。

关于代表我们进行交易的人工智能模型的政策和法律框架，目前还不存在。但这项实验表明，这样的世界是有可能实现的。更重要的是，它表明这样的世界并不遥远。社会需要迅速应对这些变化。

互动式的文章好玩而不适合用纯语言表达喵

网友解答：

--【壹】--：

哇，还有LLM包办婚爱诶

或许这样也不错喵，大抵可以超越常规人类的匹配能力

--【贰】--：

鱼鱼语文不好吗，怎么感觉你是在说旮旯game

标签：转载

Project Deal: our Claude-run marketplace experiment | Anthropic

相关推荐

Project Deal: our Claude-run marketplace experiment | Anthropic

相关推荐