Kubernetes如何实现高效的分布式限流策略?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1589个文字,预计阅读时间需要7分钟。
作为数据上报系统,随着接入量越来越大,由于API接口无法控制调用行为,当遇到瞬时请求量激增时,会导致接口占用过多服务器资源,使得其他请求响应速度降低或接口占用过多服务器资源,使得其他请求响应速度降低。
做为一个数据上报系统,随着接入量越来越大,由于 API 接口无法控制调用方的行为,因此当遇到瞬时请求量激增时,会导致接口占用过多服务器资源,使得其他请求响应速度降低或是超时,更有甚者可能导致服务器宕机。
一、概念限流(Ratelimiting)指对应用服务的请求进行限制,例如某一接口的请求限制为 100 个每秒,对超过限制的请求则进行快速失败或丢弃。
1.1 使用场景限流可以应对:
- 热点业务带来的突发请求;
- 调用方 bug 导致的突发请求;
- 恶意攻击请求。
对于限流场景,一般需要考虑两个维度的信息:
时间
限流基于某段时间范围或者某个时间点,也就是我们常说的“时间窗口”,比如对每分钟、每秒钟的时间窗口做限定
资源
基于可用资源的限制,比如设定最大访问次数,或最高可用连接数。
限流就是在某个时间窗口对资源访问做限制,比如设定每秒最多100个访问请求。
本文共计1589个文字,预计阅读时间需要7分钟。
作为数据上报系统,随着接入量越来越大,由于API接口无法控制调用行为,当遇到瞬时请求量激增时,会导致接口占用过多服务器资源,使得其他请求响应速度降低或接口占用过多服务器资源,使得其他请求响应速度降低。
做为一个数据上报系统,随着接入量越来越大,由于 API 接口无法控制调用方的行为,因此当遇到瞬时请求量激增时,会导致接口占用过多服务器资源,使得其他请求响应速度降低或是超时,更有甚者可能导致服务器宕机。
一、概念限流(Ratelimiting)指对应用服务的请求进行限制,例如某一接口的请求限制为 100 个每秒,对超过限制的请求则进行快速失败或丢弃。
1.1 使用场景限流可以应对:
- 热点业务带来的突发请求;
- 调用方 bug 导致的突发请求;
- 恶意攻击请求。
对于限流场景,一般需要考虑两个维度的信息:
时间
限流基于某段时间范围或者某个时间点,也就是我们常说的“时间窗口”,比如对每分钟、每秒钟的时间窗口做限定
资源
基于可用资源的限制,比如设定最大访问次数,或最高可用连接数。
限流就是在某个时间窗口对资源访问做限制,比如设定每秒最多100个访问请求。

