一个800万的代价:运维怎样避免面向监狱编程?

事件引发了持续的热议,其中也不乏争议,针对关注度较高的问题,包括防止运维人员的骚操作、如何兼顾运维效率与安全、事件中的甲乙两方存有哪些不足、企业等保工作如何开展和有效落地等,dbaplus社群整理并归总观点如下,希望能给大家今后相关工作的展开和处

重点:IT运维体系与发展新趋势

首先说一下我的个人分享,可能也限于个人的经历和水平,能力有限,视野有限,欢迎大家指正,也只是代表我现在当前的一个观点,另外可能引用网络的图片和内容。 今天分享的内容大概分成五个方面:首先说一下运维定义,做什么,为什么要这么做,我们应该怎么做

别让运维太忙,一文分析 Ansible 的自动化运维

Ansible 工具集包含 Inventory、Modules、Plugins 和 API。 其中:Inventory:用来管理设备列表,可以通过分组实现,对组的调用直接影响组内的所有主机;Modules:是各种执行模块,几乎所有的管理任务都是通过模块执行的;Plugins:提供了各种附加功能;API

云计算运维和传统运维不得不说的故事?

如何快速创建和复制资源模板,有序地对资源模版进行资源配置和更新;如何在云端更加轻松的部署、配置和管理应用。如何利用工具轻松地在云中快速部署和管理应用程序,同时可以自动处理容量预配置、负载均衡、Auto Scaling和应用程序状况监控,这是对运维人员的

万万没想到!智能运维的正确方式:从临场救火到淡然饮茶

万万没想到!智能运维的正确方式:从临场救火到淡然饮茶

啥是智能运维?如此神奇? 谈及智能运维的概念,洋气一些可被称为AIOps,正好是人工智能技术与基础运维能力的完美集合,一句话概括,运用机器学习的方法来提升运维效率。 稍微回顾下运维发展我们就能发现,在历经千锤百炼达成的传统自动化运维体系中,重复性

运维遇上中台,瞬间阵亡?我是这样理解的

从14年底开始,互联网运维理念兴起之后,传统行业也开始日益重视运维平台的建设。甚至按照运维平台的建设情况来划分运维成熟度水平,典型阶段划分如下: 手工运维 以人工作业为主要表现形式的运维,发布、故障处理、巡检等等 脚本化运维 用一些自动化脚本来

PB 级大规模 Elasticsearch 集群运维与调优落地

背景 因为游戏业务本身的日志数据量非常大(写入峰值在 100w qps),在服务客户的几个月中,踩了不少坑,经过数次优化与调整,把客户的 ES 集群调整得比较稳定,避免了在业务高峰时客户集群的读写异常,并且降低了客户的资金成本和使用成本。 场景 1:与客户的

IT运维市场在未来前景分析

1、IT基础设施运维自动化 由于企业要求IT基础设施能够做到高可靠、低延时、大容量、零故障等,那就需要IT运维人员对底层硬件设备进行用心维护,硬件不出故障才能保证上层业务系统的稳定、高效地运行。 2、IT基础设施之上在线业务系统上线 企业在线业务系统是

一文帮你掌握整个SRE运维体系

一文帮你掌握整个SRE运维体系

一整套的可观测系统,它能确保你洞察系统,跟踪系统的健康状态、可用性以及系统内部发生的事情。 对于整个可观测系统的建设,需要注意如下两点: 确定质量标准是什么,并确保系统持续逼近或保持在质量标准极限范围内 系统地关注这项工作而不应该只是随机地查

Nginx 在运维领域中的应用,建议收藏

Nginx 已诞生十余年,其作为一款开源的 Web 服务器软件,因其具有性能稳定、高并发、低内存耗用、高性能的处理能力等特点,被广泛应用到国内外各互联网厂商的实际生产架构中。其主要有如下场景应用: Web 服务应用,可实现静态资源、PHP、Python 等网站的架