一. 事件背景:
起因是有开发人员报障,程序在发布后无法正常运行,一直处于在重启的状态。一开始我以为是程序本身的问题,但在查看服务日志后,并未发现程序有任何错误。在查看监控系统时,发现该服务器节点CPU 利用率达到了100%,难怪程序已经无法运行。并且,还发现有这种情况的节点不止一个,整个环境中有好几台服务器都是CPU 100%的情况。
二. 查看进程情况
使用Top命令查看进程 ,可以看到CPU的使用率已经跑满。但在进程列表中却未发现有异常进程 。除有个别业务程序占用CPU较多,但关掉后情况并未改善。 三. 查看网络访问
此时,怀疑是机器被入侵了,因此通过下面命令查看网络连接的情况。
在查看几台机器后,发现有问题的机器都有一个外网连接,如下所示。netstat -an |grep ESTABLISHED
虽然每台机器连接的外网IP地址不同,但端口号统一都是 7643,并且查询地址后发现都是国外地址。由于相关的服务器并没有国外的业务,因此可以确定被病毒入侵无疑了。 四. 查看启动项:tcp 0 0 10.12.15.7:39410 86.107.101.103:7643 ESTABLISHED
使用下面命令查看开机启动项
在启动项中,发现有一个名为OOlmeN2R.service 的可疑服务,怀疑就是病毒。(注:该病毒在不同机器的服务名称皆不同,随机的。但特点是乱码,有大小写或数字。)systemctl list-unit-files |grep enabled
通过下面命令,查看服务的启动状态以及启动文件的存放位置。auditd.service enabled
autovt@.service enabled
crond.service enabled
docker.service enabled
OOlmeN2R.service enabled <-------
rhel-autorelabel.service enabled
rhel-configure.service enabled
rhel-dmesg.service enabled
rhel-domainname.service enabled
rhel-import-state.service enabled
rhel-loadmodules.service enabled
rhel-readonly.service enabled
rsyslog.service enabled
sshd.service enabled
接着,找到该启动文件,并查看文件内容。systemctl status OOlmeN2R.service
可以看到,服务在启动时调用了一个/bin/eWqAVtbn 文件,这应该是就病毒的执行文件了。$ cat /usr/lib/systemd/system/OOlmeN2R.service
[Unit]
Description=service
After=network.target
[Service]
Type=simple
ExecStart=/bin/eWqAVtbn
RemainAfterExit=yes
Restart=always
RestartSec=60s
五. 清除病毒
在发现病毒文件后,现在我们可以开始来清除病毒了。
1、停止病毒服务
2、删除相关病毒文件(做删除操作前请做好备份或快照,以免误删文件)systemctl stop OOlmeN2R.service
systemctl disable OOlmeN2R.service
删除完成后,重启服务器。rm /bin/eWqAVtbn #删除执行文件
rm /usr/lib/systemd/system/OOlmeN2R.service # 删除启动文件
完成上述步骤后,再次查看该网络链接,发现该链接已消失。同时,服务器CPU使用率恢复到正常状态 ,病毒被清除了。
六. 总结netstat -an |grep ESTABLISHED
该病毒有可能是挖矿类的病毒,占用机器资源进行任务,因此导致CPU使用率暴涨。同时,病毒较为狡猾,具有以下特点:
- 隐藏自己的进程,无法通过TOP命令来发现。
- 加入开机启动项,保证重启服务器后依然会生效。
- 文件名随机,在不同机器上都不一样,增大了排查难度。
- 目前,通过本文档记录的方法,可以有效清除病毒。已知经过处理后的机器未再出现重复中毒情况。
文章评论 本文章有个评论