kiro 反封指南
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
项目基于kiro.rs项目
增加以下策略即可防封
防封机制
单账号并发控制
- 单账号并发不要超过5
- 令牌桶机制:每个桶5个令牌,请求开始拿令牌,请求结束归还令牌。不能超额领取
- AI响应时间长,RPM/TPS都不够准确。看任意时间颗粒里面,正在请求的数量不能超过5
单账号退避策略
- 退避基础时间 500ms
- 退避最大时间 3000ms
- 退避倍数 1.5
- suspended 状态退避 1秒
- 退避期间请求会等到到期后再继续
全局冷却机制(429 防护)
收到 429 Too Many Requests 时触发全局冷却,所有账号的新请求暂停,采用分级退避:
- 首次 429:全局暂停 5 秒
- 短时间内第二次 429(120秒内):全局暂停 15 秒
- 第三次及以上 429(120秒内):全局暂停 30-60 秒(随机)
- 超过 120 秒无 429:重置冷却级别为 0
全局冷却期间:
- 已在飞的请求不受影响(它们已持有令牌)
- 新请求在
acquire_context阶段等待冷却到期 - 所有账号统一暂停,避免重试风暴
流量亲和
- 同一个 session 一直在一个号上(session affinity)
负载均衡模式
推荐使用 balanced 模式,将请求分散到多个账号,降低单账号压力。
问题描述:
项目基于kiro.rs项目
增加以下策略即可防封
防封机制
单账号并发控制
- 单账号并发不要超过5
- 令牌桶机制:每个桶5个令牌,请求开始拿令牌,请求结束归还令牌。不能超额领取
- AI响应时间长,RPM/TPS都不够准确。看任意时间颗粒里面,正在请求的数量不能超过5
单账号退避策略
- 退避基础时间 500ms
- 退避最大时间 3000ms
- 退避倍数 1.5
- suspended 状态退避 1秒
- 退避期间请求会等到到期后再继续
全局冷却机制(429 防护)
收到 429 Too Many Requests 时触发全局冷却,所有账号的新请求暂停,采用分级退避:
- 首次 429:全局暂停 5 秒
- 短时间内第二次 429(120秒内):全局暂停 15 秒
- 第三次及以上 429(120秒内):全局暂停 30-60 秒(随机)
- 超过 120 秒无 429:重置冷却级别为 0
全局冷却期间:
- 已在飞的请求不受影响(它们已持有令牌)
- 新请求在
acquire_context阶段等待冷却到期 - 所有账号统一暂停,避免重试风暴
流量亲和
- 同一个 session 一直在一个号上(session affinity)
负载均衡模式
推荐使用 balanced 模式,将请求分散到多个账号,降低单账号压力。

