疫情仍在全世界蔓延,但在我国已得到有效控制,这不仅仅体现了一个国家的综合实力,也体现了我们亿万国民团结一心,才能一次一次的战胜外界看起来不可抗击的力量。国之战神在于民心,团结力量大。
同样的道理,我们做为IT行业运维技术人员,不仅自身要实战技术过硬,项目组组员也都要有质量运维意识,才能一起共同做好线上线下系统运营运维技术保障,做好对众多服务的非功能性、功能性等防控,确保服务的高可用性、高可靠性、高维护性、高稳定性、高安全性等,确保企业业务运营正常。反之,如果组员对服务器上传代码工程包或者安装部署某个服务控件时,不经意间上传了有危害性代码、侵害性程序,会导致系统瘫痪。
在疫情期间,我们自身戴好口罩、强身健体;小区出入做好各种安防、出入证、量体温;社区喷雾杀毒等。这就如同我们服务器设置好防火墙、配置好访问端口、对于每个上传文档做好安全代码扫描、定期做好性能测试等各类非功能指标检验测试等,确保服务器正常运行。但一旦百密一疏,就会导致出问题。例如,这段时间我们某台应用测试服务器就出现CPU高、且无法正常登录现状,具体情况如下:
2月28日下午临近六点时,开发人员突然发了截图给我说187服务器无法登陆,问我是否修改了密码,如下图一:
追根溯源:
发现187确实无法正常登录,但是该提示信息说明该服务器没有被关闭,只是ssh链接被篡改了,这时脑中第一反应,入侵者使用了一个可执行的SSH后门,而且这些组件以服务形式安装来为恶意软件提供驻留。
出于好奇和对刚部署监控工具的可用性,我登录运维服务监控,发现还能收集187服务CPU等资源信息,如下图三,只是CPU使用率偏高,应该是使用了什么恶意软件在为它自己提供服务,但也说明187服务还是可用,只是新建的ssh连接无法链接。