如何设计一个高效且全面的系统,实现指标监控和告警的长尾词功能?
- 内容介绍
- 文章标签
- 相关推荐
本文共计4285个文字,预计阅读时间需要18分钟。
在本文中,我们将探讨如何设计一个可扩展的指标监控和报警系统。一个优秀的监控和报警系统应具备对基础设备的可观性、高可用性、可靠性和关键作用。下图为市场上一款XX监控系统的示例。
在本文中,我们将探讨如何设计一个可扩展的指标监控和告警系统。 一个好的监控和告警系统,对基础设施的可观察性,高可用性,可靠性方面发挥着关键作用。
下图显示了市面上一些流行的指标监控和告警服务。
接下来,我们会设计一个类似的服务,可以供大公司内部使用。
设计要求从一个小明去面试的故事开始。
面试官:如果让你设计一个指标监控和告警系统,你会怎么做?
小明:好的,这个系统是为公司内部使用的,还是设计像 Datadog 这种 SaaS 服务?
面试官:很好的问题,目前这个系统只是公司内部使用。
小明:我们想收集哪些指标信息?
面试官:包括操作系统的指标信息,中间件的指标,以及运行的应用服务的 qps 这些指标。
小明:我们用这个系统监控的基础设施的规模是多大的?
面试官:1亿日活跃用户,1000个服务器池,每个池 100 台机器。
小明:指标数据要保存多长时间呢?
面试官:我们想保留一年。
本文共计4285个文字,预计阅读时间需要18分钟。
在本文中,我们将探讨如何设计一个可扩展的指标监控和报警系统。一个优秀的监控和报警系统应具备对基础设备的可观性、高可用性、可靠性和关键作用。下图为市场上一款XX监控系统的示例。
在本文中,我们将探讨如何设计一个可扩展的指标监控和告警系统。 一个好的监控和告警系统,对基础设施的可观察性,高可用性,可靠性方面发挥着关键作用。
下图显示了市面上一些流行的指标监控和告警服务。
接下来,我们会设计一个类似的服务,可以供大公司内部使用。
设计要求从一个小明去面试的故事开始。
面试官:如果让你设计一个指标监控和告警系统,你会怎么做?
小明:好的,这个系统是为公司内部使用的,还是设计像 Datadog 这种 SaaS 服务?
面试官:很好的问题,目前这个系统只是公司内部使用。
小明:我们想收集哪些指标信息?
面试官:包括操作系统的指标信息,中间件的指标,以及运行的应用服务的 qps 这些指标。
小明:我们用这个系统监控的基础设施的规模是多大的?
面试官:1亿日活跃用户,1000个服务器池,每个池 100 台机器。
小明:指标数据要保存多长时间呢?
面试官:我们想保留一年。

