值得使用的Kubernetes日志监控工具
谈到优秀实践,Zebrium最近还帮助Sweetwater将事件跟踪时间从3小时减少到只有几分钟。Zebrium甚至可以发现以前未发现的隐藏问题。这是一项出色的功能,因为它可以帮助在问题影响客户之前发现问题。 那么,什么使Zebrium在竞争中脱颖而出?Zebrium使用人工智能
麻利地排查各类系统故障的运维方法
今天准备谈下对于IT人员面对技术类问题分析和解决的一些思路和实践总结,在很早以前我就谈到过,对于开发人员在后期需要的不是简单的新业务功能的设计和开发能力,而是问题分析和解决能力。这类问题分析和解决本身又包括了两个方面内容: 其一是IT系统运行类
运维:终于不用时刻准备着数万实例的Redis集群了!
1、资源隔离 当前的Redis Cluster部署在物理机集群上,为了提高资源利用率节约成本,多业务线的Redis集群都是混布的。由于没有做CPU的资源隔离,经常出现某Redis节点CPU使用率过高导致其他Redis集群的节点争抢不到CPU资源引起时延抖动。因为不同的集群混布,
Linux中这些优秀命令,每一条都应该掌握!
Linux命令是对Linux系统进行管理的命令。对于Linux系统来说,无论是中央处理器、内存、磁盘驱动器、键盘、鼠标,还是用户等都是文件,Linux系统管理的命令是它正常运行的核心。 线上查询及帮助命令(2个) man:查看命令帮助,命令的词典,更复杂的还有info,
怎样利用NTS保证NTP的稳定
许多计算机使用 网络时间协议 Network Time Protocol (NTP)通过互联网来同步系统时钟。NTP 是少数几个仍在普遍使用的不安全的互联网协议之一。攻击者如果能够观察到客户端和服务器之间的网络流量,就可以向客户端提供虚假的数据,并根据客户端的实现和配置
使用你经常用的编程语言,将基础设施作为代码进行配置
Pulumi 将其状态存储在后端。默认的后端是 Pulumi 的软件即服务(它有一个针对个人用户的免费计划),但在这个例子中,我使用替代的文件后端。文件后端将在你的本地文件系统上创建一个文件来存储状态: pulumi login — local 如果你打算和别人分享这个项目
使用LVM壮大卷空间
LVM 是一个逻辑卷管理工具,包括分配磁盘、条带化、镜像和调整逻辑卷的大
推荐新年这几个新sudo功能
Python 对插件的支持 尽管我不是程序员,但我最喜欢的 sudo 1.9 新特性是 Python 对插件的支持。你可以用 Python 也能使用 C 语言调用大部分 API。幸运的是, sudo 对性能不敏感,所以运行速度相对较慢的 Python 代码对 sudo 来说不是问题。使用 Python 来扩
什么是SRE?这篇文章告诉你SRE运维体系
在任何有一定规模的企业内部,一旦推行起来整个SRE的运维模式,那么对于可观测性系统的建设将变得尤为重要,而在整个可观测性系统中,通常我们会分为如下三个方面: 指标监控:即各种指标监控,比如基础资源指标,服务性能指标,业务的调用指标。 日志:各种
总结:Nginx到底有什么用?
反向代理 反向代理应该是Nginx做的最多的一件事了,什么是反向代理呢?为什么需要反向代理服务器呢? 反向代理(Reverse Proxy)方式是指以代理服务器来接受internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet