一次 Keepalived 高可用的事故,使我重学了一遍它!

上次我们遇到了一个 MySQL 故障的事故,这次我又遇到了另外一个奇葩的问题: Keepalived 高可用组件的虚拟 IP 持续漂移,导致 MySQL 主从不断切换,进而导致 MySQL 主从数据同步失败。 虽然没能重现 Keepalived 的这个问题,但是我深入研究了下 Keepalived

一次 Keepalived 高可用的事故,使我重学了一遍它!

上次我们遇到了一个 MySQL 故障的事故,这次我又遇到了另外一个奇葩的问题: Keepalived 高可用组件的虚拟 IP 持续漂移,导致 MySQL 主从不断切换,进而导致 MySQL 主从数据同步失败。 虽然没能重现 Keepalived 的这个问题,但是我深入研究了下 Keepalived

迅速上手Thanos 高可用的 Prometheus

在一个成千上万的服务和应用程序部署在多个基础设施中的世界中,在高可用性环境中进行监控已成为每个开发过程的重要组成部分。 在本文中,我将介绍使用Thanos在EKS多集群架构上存储多个集群的Prometheus指标的思考过程和经验教训。 介绍 随着 HiredScore 的