基础设施监控:挑战和优秀应用

随着网络越来越复杂,由于设备种类越来越多,以及混合云的出现,网络完整性的重要性随之增长。即使在中小企业内部的基本网络上,也应该对基础设施进行监控,但是对于大型企业的复杂系统,它是运营的重要组成部分。

了解基础设施监控

在日常运营方面,基础设施监控是软件工具的部署,用于自动诊断整个技术堆栈中的性能和可用性问题,以在问题变得严重之前捕获问题。

“整个堆栈”是指硬件、操作系统、虚拟化环境、网络、存储、计算和应用程序。由于大多数大型基础设施跨越多个位置,同时包含公共云和私有云,这就给IT部门带来了更大的挑战,因此,自动化将成为关键。

由于具有复杂性,实现自动化至关重要,原因如下:

自动化可以比人类更快地做出响应。 它可以比等待人工干预更快地处理问题。 假设企业已正确编程响应,自动化可以减少错误。 与人类不同,它可以全天候运行,不需要睡眠。

通过自动化技术,企业可以设置阈值,例如服务器利用率或网络带宽,以及当网络高于或低于设定阈值时的程序响应。如果服务器冻结或停止,它也可以自动重启。

基础设施监控包括在出现问题时添加和删除要监控的设备、性能、运行状况监控、网络和数据移动监控、报告/日志以及警报系统。这些通常是实时的,因为对网络瓶颈的警报在被发现6小时后是毫无意义的。

基础设施监控通常通过仪表板完成,仪表板通过视觉布局(如仪表)在一个位置显示企业的所有信息。它们在屏幕上呈现实时更新,并可以在一段时间内生成报告。

为什么需要基础设施监控

基础设施监控为管理者提供了实时了解基础设施状态所需的数据,以及衡量组织目标进度的能力。通过不断收集和审查有关基础设施的数据,监控允许测量当前状态以及网络的进展情况。

例如,如果管理层已经制定了实现一定级别网络响应的目标,那么监控工具可以显示网络在响应性方面的位置。它可以识别延迟的峰值,也许也可以找出原因。

确保网络以最高效率运行需要企业了解构成IT基础设施的设备,同时还要关注这些设备的健康状况和性能。对企业的IT系统进行主动分析,意味着有更好的机会在导致严重中断之前捕获即将发生的故障。

有很多例子表明,如果没有适当的基础设施管理会出现什么问题。“僵尸服务器”就是这样一个例子,物理服务器处于空闲状态,没有人使用它。由Anthesis Group和斯坦福大学研究人员于2017年进行的一项研究发现,大型数据中心中多达30%的服务器是僵尸服务器,一直开启却没有做任何工作。这是适当监控的失败,因为基础设施监控器会记录这些服务器没有产生任何流量或根本不使用任何周期。

【声明】:芜湖站长网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

相关文章