🔥【大模型系列31】关于Claude Opus-4.7,你想知道的一切【260418更新LMArena评分】

2026-04-29 10:172阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

基本资料

官方文:https://www.anthropic.com/news/claude-opus-4-7
官方文档:What's new in Claude Opus 4.7 - Claude API Docs
官方模型卡:https://cdn.sanity.io/files/4zrzovbb/website/037f06850df7fbe871e206dad004c3db5fd50340.pdf

价格:输入$5/输出$25与4.6一样
上下文:1m,与4.6一样
最大输出:128k,与4.6一样
输出速度:50tps左右,比4.6快30%
4.7 vs mythos:性能提升但明显不如mythos
切换回4.6的方法:/model claude-opus-4-6[1m]


优点:自主编程能力显著提升

能搞定更难、更长链的任务,还会主动验证输出再汇报。

优点:视觉处理能力显著提升

支持长边最高2576像素,即2.5k,是4.6三倍

新功能:/ultrareview

在线review,额外收费,Pro和Max用户可以免费试用三次

新功能:auto模式,自主决策、连续执行

首次向Max用户开放

新功能:在high和max之间增加xhigh

个人感觉实用性没多大,更多是一种营销策略,用来对用户认知作战,证明max比xhigh(映射codex)大
eb3ef932161795bdd77360f6835198081920×1080 107 KB


缺点:费token

因为分词器调整,4.7比4.6多费Token
来源:来自官方System Card的Claude Opus 4.7牙膏倒吸实证
image593×627 114 KB


中文多费6%,英文多费59%,python多费21%,中国用户也别偷笑,你的代码还是英文的
image332×500 72.6 KB


官方说max会员额度可能有增加,对应分词器问题
来源:为了应对Opus4.7更长的上下文,CC订阅配额永久提升
image587×275 20.1 KB


缺点:长上下文注意力差

MRCR长上下文测试,1m上下文性能比4.6有了大幅下降
来源:https://www.reddit.com/r/ClaudeAI/comments/1sn6eyd/
.来自官方System Card的Claude Opus 4.7牙膏倒吸实证
.opus4.7注意力和gemini3.1pro坐一桌??
image929×487 35.1 KB
image792×409 24.3 KB
image531×500 94.2 KB


缺点:说话风格像GPT

.怎么感觉Opus 4.7 语气有点像GPT


评测

官方自评

image1920×1948 241 KB
image785×486 53.7 KB
image790×232 22.5 KB
image789×324 34.4 KB


LMArena评分

来源:Arena Leaderboard | Compare & Benchmark the Best Frontier AI Models
image511×549 23.6 KB


image513×557 23.5 KB


image810×677 41.6 KB


image1614×1608 211 KB


LiveBench评分

来源:https://livebench.ai
暂无opus-4.7-max
image920×551 29.9 KB


ArtificialAnalysis评分

来源:https://artificialanalysis.ai/
image516×411 33.7 KB


image565×459 37.2 KB


image554×473 38.2 KB


ARC-AGI评分

来源:ARC Prize - Leaderboard
image813×1033 46 KB


Humanity’s Last Exam (HLE)

image787×372 30.8 KB


门萨智商测试,未上线

来源:IQ Test | Tracking AI


vals.ai评分

image1080×767 122 KB


FrontierMath评分

image1008×319 27.4 KB


NYT Word Coonections纽约时报填字游戏

4.7分数只有4.6一半不到
来源:GitHub - lechmazur/nyt-connections: Benchmark that evaluates LLMs using 759 NYT Connections puzzles extended with extra trick words · GitHub
image1182×1084 158 KB


Chat渠道

官网/app已上线

LMArena Driect Chat

估计不会上线,opus系列都没上线

OpenRouter ChatRoom已上线,用自己余额

来源:AI Chat Playground - Compare AI Models Side by Side | OpenRouter

API渠道

官网

OpenRouter已上线

来源:Claude Opus 4.7 - API Pricing & Providers | OpenRouter

Code渠道

Claude Code已上线

同时重置所有会员周限额,从17号起,从0%开始重算1周

Cursor已上线

限时半价

Augment已上线

260430前半价

Windsurf已上线

试用号也能用

droid已上线

倍率1x

Copilot已上线

4.7是7.5x倍率(260430后可能15x),按条数收费,最大medium,上下文200k,需pro+会员($10pro会员没有4.7),参考4.6是3x

Antigravity暂未上线

网友解答:
--【壹】--:

订阅用量重置,每月额度翻倍了。这点倒还行。


--【贰】--: dwqxq1:

pythin 多费 21%

应该是 python 多费 21% 吧?


--【叁】--:

在cc里用4.7xhigh随便测了几次水果题和色盲题,一次没对


--【肆】--:

早晨试了一下,用 4.6 一次可以跑完的任务, 4.7 直接触发 pro 的小时限额。

可见限额跑的太快了。可能在复杂任务有优势,一般任务性价比不高。

另外请问我能否将这篇帖子主要内容注明来源转载到我的个人博客,我感觉内容整理的很好

Frytea

Frytea

原创,优质、有深度、有思考的文章分享。


--【伍】--:

我感觉4.7有点像gpt5.4,开始不说人话了


--【陆】--:

长上下文砍成了这个样子,写代码能行吗?对于工具类和代码类对上下文的要求都比较高吧


--【柒】--:

我擦,只补偿速度吗:Opus 4.7使用了更多计算代币,因此我们提高了所有订阅用户的速率限制以作补偿。祝您使用愉快!


--【捌】--:

蹲蹲期待一下antigravity渠道更新opus4.7,希望体验会变好一点


--【玖】--: dwqxq1:

OpenAI ChatRoom

佬啊……这个是openrouter chatroom,不是openai chatroom吧……吓我一跳,还以为OAI和A\世纪大和解了……


--【拾】--:

谢谢佬友提醒,这里打错字了,我已经已改好了


--【拾壹】--:

claude cli里头是不是还是没有办法切换?
另外周限额现在翻倍了?


--【拾贰】--:

我近期其他帖子

.🔥【大模型系列30】关于Claude Mythos,现在知道的一切【更新244页模型卡】
.【大模型系列29】关于Minimax 2.7,你想知道的一切【底楼更新Arena编程评分】
.【大模型系列28】关于GPT-5.4-thinking和GPT-5.4-pro,你想知道的一切【底楼更新LiveBench登顶】
.【大模型系列27】关于Grok 4.2,你想知道的一切【底楼更新grok-4.2-beta2上线】
.【大模型系列26】关于Gemini 3.1 Pro,你想知道的一切【底楼更新LiveBench评分】
.【大模型系列23】关于Gemini 3.1 Deep Think新版,你想知道的一切

.🔥【省钱系列10】Claude Code Max,Codex Team最新渠道研究
.🔥【省钱系列11】我做的Claude Code Saver,争取做最强CC额度监控+省钱插件【预告贴】
.🔥【省钱系列9】Claude Code Opus额度的秘密:2api的刀,与CC官方刀,此刀非彼刀,又被宰一刀
.【省钱系列8.10】Claude Code Max,Opus4.6,OAuth直连拼车方案的实践研究
.【省钱系列8】Claude Code,Opus-4.6的渠道研究【9k浏览】
.【省钱系列7】常见AI官价/额度,及优惠/羊毛/拼车价汇总【底楼更新闲鱼常见坑】【6k浏览】
.【省钱系列6】L站Google/Antigravity/Gemini Ultra会员拼车经验【6k浏览】

.【提智降智系列1】未预训练内容造成严重降智,与各模型搜索能力研究
.【资料系列2】Reddit所有AI板块大全【手工收集,长期更新】
.【十倍速写作系列10】Typeless:不是另一个语音输入法,而是第一个意图输入法
.【视频】看一遍笑一遍:在我用光ClaudeCode限额后,老板看我手搓代码时的心情

L站opus-4.7相关帖子(从新到老排序)

.看4.7opus评价两极分化,决定测试一下
.Opus 4.7 真的好用吗?L站骂声一片 😂
.Claude Opus 4.7测评:拉完了,达里奥也有自己的G 3 Pro
.Opus 4.7 骂声一片
.opus4.7真无敌了【cursor】
.opus 4.7 (high)cursor里面的,糖果问题和红绿色盲,锐评一下
.感觉这opus 4.7是真贵啊(已恢复)
.https://linux.do/t/topic/1983828/
.opus 4.7 酒馆开倒车,RP倒退,牙膏倒吸是真的吗?
.notion已经上线opus 4.7,体感上可以克服一堆前置垃圾提示词

.https://x.com/dotey/status/2044792782842122412


--【拾叁】--:

本来订阅就是17号重置周限额,这波亏麻了


--【拾肆】--: dwqxq1:

max会员额度可能有增加,对应分词器问题

dwqxq1:

MRCR长上下文测试,1m上下文性能比4.6有了大幅下降

dwqxq1:

缺点:说话风格像GPT

.怎么感觉Opus 4.7 语气有点像GPT

/model claude-opus-4-6[1m]
那这波还是更加开心地蹬opus4.6 1m了,像我这种习惯于一个上下文猛然1m的人,注意力变差不能忍了。


f43883fccf6d1162c15f562afd3eb9d11233×1021 161 KB
其实我更想蹬这个?
/model claude-mythos-preview[1m]


--【拾伍】--:

佬友们,所以现在的最佳实践是切回4.6用是吗,这样可以加大用量,以及避免GPT的文风对吗


--【拾陆】--:

[quote=“焕昭君, post:16, topic:1984117, username:huan”]

f43883fccf6d1162c15f562afd3eb9d11233×1021 161 KB

[/quote]我也是。。
17号重置周限额,结果亏麻了