GitHub Copilot 转用量计费 —— 成本正在倒逼用户思考旗舰模型的必要性
- 内容介绍
- 文章标签
- 相关推荐
经历昨晚 GitHub Copilot 订阅宣布删除 Claude Opus 4.6 / 从 Pro 移除 Opus 有感
Changes to GitHub Copilot plans for individuals - GitHub Changelog
As shared in our recent blog post, we’re making the following changes to Copilot plans for individuals as part of our ongoing efforts to ensure service reliability and a sustainable…
Est. reading time: 2 minutes
About billing for individual GitHub Copilot plans - GitHub Docs
Learn how billing works for Copilot Pro and Copilot Pro+.
Changes to GitHub Copilot Individual plans
We're making these changes to ensure a reliable and predictable experience for existing customers.
Est. reading time: 5 minutes
除此之外,三月中旬到现在各家旗舰模型 / 订阅都在隐式或显式地进行涨价。我觉得这实际上是在向目前不理智地追求用旗舰模型实现一切需求的用户市场问出一个问题:
你真的用得到 GPT 5.4 / Opus 4.6 之类的旗舰模型吗,你目前的用例对于旗舰模型是否是一种浪费?它们是不是实际上可以用 Sonnet / 5.3 Codex / Haiku 替代?以及 brainstorm - plan - implement 工作流中,哪个部分真正需要旗舰模型?
对这些问题的回答的逐渐铺开也是市场进一步转向理智和务实的应用的标志。
另外目前 Copilot 刀法如此狠辣,我猜五月份其实不会转向 Token 计费,那么至少 pro 订阅还是很有价值,单个 Sonnet 驱动的长实施任务跑一两天也是一次请求这一点是不可替代的,一个月 300 次实施也是完全够用的(GPT 5.4 也还在,只是上下文窗口砍过)。只是需要寻找一个更便宜 / 不限制上下文窗口的旗舰模型订阅来完成 brainstorm 工作。
个人认为 Pro+ 订阅用户当务之急是用完额度,然后去把四月份的款退了)
补充:根据上述第四个 blog,目前 Copilot 采取的是 token 周限 + 请求数月限 的模式,达到 token 周限后只能切换到 Auto 才能继续使用(我个人大部分时候随机到 Sonnet 或 GPT 5.3 Codex,说实话也很香,仍能漂亮地完成实施工作)
4.28 更新
省流:从六月一号开始转向全面用量计费,年费用户仍可以按照更高的倍率使用按请求计费直到套餐过期。
个人计算:
按输入输出 4 : 1 算的话 pro+ 的额度(39$)大概就能用 opus 的 4.7 共 346.7万 的输入 token 和 86.7万 的输出 token。缓存率如果按 80% 算那整体再提升 47%。
同理 5.5 无缓大概 312万输入 和 78万 输出,80% 缓提高 40% 左右。
GitHub Copilot is moving to usage-based billing
Starting June 1, your Copilot usage will consume GitHub AI Credits.
Est. reading time: 4 minutes
Models and pricing for GitHub Copilot - GitHub Docs
See per-token pricing for the models available in GitHub Copilot and reference rates for additional usage across plans.
网友解答:--【壹】--:
昨天在 cli 跑了一个 12 小时的没有出现明显的限制,大概要多长时间才能遇到限制呢
也确实只用了一次 request
--【贰】--:
虽然舆论基本都是要转向 token 计费,但是毕竟请求计费是他们唯一的优势,所以是的,基于一种美好的想象和少量的理性分析,我觉得它们不会转到 token 计费,否则用户为什么要转二道手买第三方的 plan(上游是本家)而不去直接订阅本家的 plan。
--【叁】--: YKDZ:
Opus 4.6
b订阅还能用,转投b订阅吧,加个寸止不是美滋滋
--【肆】--:
你想多了,不可能一次任务跑几天,现在是一次任务,如果思考过多,直接断开,提示繁忙, 或者直接计费多次,例如你一个任务消耗太多,直接计费几次,也就是一次任务消耗token有隐含限制的
--【伍】--:
现在有周限了,长实施任务跑一两天后面就只能用 auto 了。
--【陆】--:
对,不让了,绝版套餐。不知道它咋想的离谱
--【柒】--:
学生包刚刚跑codex5.3,跑了3 4次请求就限额了 真恶心吧
--【捌】--:
我的问题没有价钱稳定的Claude渠道啊,API太贵,其他用不了反代,唯有这样把。
我的工作流是GPT Plan+Advise,Qwen 3.6 Plus写code。够了吧
--【玖】--:
我基本上就用5.4,copilot对我来说很够用了
--【拾】--:
我目前复制一下A\的Advisor Tool/Advisor Strategy,把Qwen 3.6 Plus写code加GPT 5.4的智慧来做,觉得很好的了。
真的,这些旗舰模型只是适合brainstorm/plan的阶段中的,implement到用Sonnet/Haiku/Gemini Flash/其他便宜的模型很好了
--【拾壹】--:
直接opus plan gpt work就行了,gpt5.4真不算贵了,没必要再给worker模型省钱了,省那几块钱出点问题后面又要花时间花精力
现在最大的问题是4.7的opus我觉得有点不太能胜任plan模型了,目前暂时回退到4.6plan,但也不知道4.6还能活多久,哎
--【拾贰】--:
VSCode 内的对话和 CLI 对话我怀疑不是同一套系统(没有验证过),相对来说 CLI 更透明一点,可以直接看到请求数 / token 数之类的参数。
--【拾叁】--:
没有,只有pro+有,而且是opus4.7,还是7.5X倍率
--【拾肆】--:
9.9 开上了,也没有 opus 了吧,
--【拾伍】--:
GitHub Copilot 10刀一月值得开吗? 现在不让开了?
--【拾陆】--:
确实没有了,所以价值在于用它们按次计费的特点来用 sonnet 之类的模型做实施工作
--【拾柒】--:
照这样限额 一个月能跑满300次请求吗 不是很理解
--【拾捌】--:
我在vscode跑,正常一次请求是消耗0.6%左右, 使用非ops, 使用ops一次大概1%左右,但是如果上下文太长,然后任务复杂,经常非ops消耗2-3%, ops直接5-8%, 这里%是vscode显示的套餐剩余多少
--【拾玖】--:
那我赶上末班车了算是 刚9.9刀开上了。
经历昨晚 GitHub Copilot 订阅宣布删除 Claude Opus 4.6 / 从 Pro 移除 Opus 有感
Changes to GitHub Copilot plans for individuals - GitHub Changelog
As shared in our recent blog post, we’re making the following changes to Copilot plans for individuals as part of our ongoing efforts to ensure service reliability and a sustainable…
Est. reading time: 2 minutes
About billing for individual GitHub Copilot plans - GitHub Docs
Learn how billing works for Copilot Pro and Copilot Pro+.
Changes to GitHub Copilot Individual plans
We're making these changes to ensure a reliable and predictable experience for existing customers.
Est. reading time: 5 minutes
除此之外,三月中旬到现在各家旗舰模型 / 订阅都在隐式或显式地进行涨价。我觉得这实际上是在向目前不理智地追求用旗舰模型实现一切需求的用户市场问出一个问题:
你真的用得到 GPT 5.4 / Opus 4.6 之类的旗舰模型吗,你目前的用例对于旗舰模型是否是一种浪费?它们是不是实际上可以用 Sonnet / 5.3 Codex / Haiku 替代?以及 brainstorm - plan - implement 工作流中,哪个部分真正需要旗舰模型?
对这些问题的回答的逐渐铺开也是市场进一步转向理智和务实的应用的标志。
另外目前 Copilot 刀法如此狠辣,我猜五月份其实不会转向 Token 计费,那么至少 pro 订阅还是很有价值,单个 Sonnet 驱动的长实施任务跑一两天也是一次请求这一点是不可替代的,一个月 300 次实施也是完全够用的(GPT 5.4 也还在,只是上下文窗口砍过)。只是需要寻找一个更便宜 / 不限制上下文窗口的旗舰模型订阅来完成 brainstorm 工作。
个人认为 Pro+ 订阅用户当务之急是用完额度,然后去把四月份的款退了)
补充:根据上述第四个 blog,目前 Copilot 采取的是 token 周限 + 请求数月限 的模式,达到 token 周限后只能切换到 Auto 才能继续使用(我个人大部分时候随机到 Sonnet 或 GPT 5.3 Codex,说实话也很香,仍能漂亮地完成实施工作)
4.28 更新
省流:从六月一号开始转向全面用量计费,年费用户仍可以按照更高的倍率使用按请求计费直到套餐过期。
个人计算:
按输入输出 4 : 1 算的话 pro+ 的额度(39$)大概就能用 opus 的 4.7 共 346.7万 的输入 token 和 86.7万 的输出 token。缓存率如果按 80% 算那整体再提升 47%。
同理 5.5 无缓大概 312万输入 和 78万 输出,80% 缓提高 40% 左右。
GitHub Copilot is moving to usage-based billing
Starting June 1, your Copilot usage will consume GitHub AI Credits.
Est. reading time: 4 minutes
Models and pricing for GitHub Copilot - GitHub Docs
See per-token pricing for the models available in GitHub Copilot and reference rates for additional usage across plans.
网友解答:--【壹】--:
昨天在 cli 跑了一个 12 小时的没有出现明显的限制,大概要多长时间才能遇到限制呢
也确实只用了一次 request
--【贰】--:
虽然舆论基本都是要转向 token 计费,但是毕竟请求计费是他们唯一的优势,所以是的,基于一种美好的想象和少量的理性分析,我觉得它们不会转到 token 计费,否则用户为什么要转二道手买第三方的 plan(上游是本家)而不去直接订阅本家的 plan。
--【叁】--: YKDZ:
Opus 4.6
b订阅还能用,转投b订阅吧,加个寸止不是美滋滋
--【肆】--:
你想多了,不可能一次任务跑几天,现在是一次任务,如果思考过多,直接断开,提示繁忙, 或者直接计费多次,例如你一个任务消耗太多,直接计费几次,也就是一次任务消耗token有隐含限制的
--【伍】--:
现在有周限了,长实施任务跑一两天后面就只能用 auto 了。
--【陆】--:
对,不让了,绝版套餐。不知道它咋想的离谱
--【柒】--:
学生包刚刚跑codex5.3,跑了3 4次请求就限额了 真恶心吧
--【捌】--:
我的问题没有价钱稳定的Claude渠道啊,API太贵,其他用不了反代,唯有这样把。
我的工作流是GPT Plan+Advise,Qwen 3.6 Plus写code。够了吧
--【玖】--:
我基本上就用5.4,copilot对我来说很够用了
--【拾】--:
我目前复制一下A\的Advisor Tool/Advisor Strategy,把Qwen 3.6 Plus写code加GPT 5.4的智慧来做,觉得很好的了。
真的,这些旗舰模型只是适合brainstorm/plan的阶段中的,implement到用Sonnet/Haiku/Gemini Flash/其他便宜的模型很好了
--【拾壹】--:
直接opus plan gpt work就行了,gpt5.4真不算贵了,没必要再给worker模型省钱了,省那几块钱出点问题后面又要花时间花精力
现在最大的问题是4.7的opus我觉得有点不太能胜任plan模型了,目前暂时回退到4.6plan,但也不知道4.6还能活多久,哎
--【拾贰】--:
VSCode 内的对话和 CLI 对话我怀疑不是同一套系统(没有验证过),相对来说 CLI 更透明一点,可以直接看到请求数 / token 数之类的参数。
--【拾叁】--:
没有,只有pro+有,而且是opus4.7,还是7.5X倍率
--【拾肆】--:
9.9 开上了,也没有 opus 了吧,
--【拾伍】--:
GitHub Copilot 10刀一月值得开吗? 现在不让开了?
--【拾陆】--:
确实没有了,所以价值在于用它们按次计费的特点来用 sonnet 之类的模型做实施工作
--【拾柒】--:
照这样限额 一个月能跑满300次请求吗 不是很理解
--【拾捌】--:
我在vscode跑,正常一次请求是消耗0.6%左右, 使用非ops, 使用ops一次大概1%左右,但是如果上下文太长,然后任务复杂,经常非ops消耗2-3%, ops直接5-8%, 这里%是vscode显示的套餐剩余多少
--【拾玖】--:
那我赶上末班车了算是 刚9.9刀开上了。

