【前沿慢讯】Claude Mythos 发布,强到被封印!
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
--【壹】--:
image616×292 12.1 KB
image628×467 21.5 KB
SWE-bench Pro:修bug能力,暴涨24%
SWE-bench Verified:拿严格版又测了一遍,仍有13%的提升。
Terminal-Bench 2.0:电脑操作类Agent能力,提升17%。
Mythos会作为玻璃翼计划(Project Glasswing)的一部分,先向各个合作伙伴开放。暂时不向公众开放。
网友解答:--【壹】--:
所以说,模型是强大,但一般可能用不起。
问题描述:
--【壹】--:
image616×292 12.1 KB
image628×467 21.5 KB
SWE-bench Pro:修bug能力,暴涨24%
SWE-bench Verified:拿严格版又测了一遍,仍有13%的提升。
Terminal-Bench 2.0:电脑操作类Agent能力,提升17%。
Mythos会作为玻璃翼计划(Project Glasswing)的一部分,先向各个合作伙伴开放。暂时不向公众开放。
网友解答:--【壹】--:
所以说,模型是强大,但一般可能用不起。

