谁偷了我的云主机文件?!五大场景避坑指南

发布时间:2023-04-03 04:13:12 作者:cx118 阅读量:4887

在云主机的日常运维工作中,我们的工程师经常会遇到用户上报的文件丢失类问题,原因多种多样,这些问题对用户造成了或大或小的困扰。现将其中较典型的场景梳理出来,希望能够帮助大家规避掉这些风险,防止重复踩坑。

场景一:云主机重启后文件丢失

现象:

用户上报:我的云主机重启后,上面存放的数据怎么没了,是不是云主机有问题啊?!

分析:

与用户沟通后确认,是用户存储在/dev目录下面的文件不见了。很明显,用户数据存储在文件系统类型为tmpfs的/dev目录,tmpfs文件系统默认存储在内存中而非持久化的磁盘,所以重启主机后数据丢失。

解析:

1、何为tmpfs?

tmpfs是一种基于内存的临时文件系统,数据存储在ram中,性能非常好。

2、Linux系统有哪些tmpfs?

/dev、/dev/shm、/sys/fs/cgroup、/run/user/0等,tmpfs文件系统默认为内存总大小的一半。通过df 命令可以看到哪些卷是tmpfs文件系统(Filesystem列显示为tmpfs):

建议:

1、tmpfs只用于程序/应用的缓存;

2、不建议将数据放在tmpfs中(除非可承受数据丢失的风险)。

场景二:误执行rm命令

现象:

用户上报:云主机重启后ping不通,或者系统一些服务启动不了,系统关键文件丢失等等。

分析:

1、通过虚拟化的控制台看到,OS卡在开机界面并且报大量的命令不存在;

2、挂载镜像进入系统后,通过less /root/.bash_history查看用户的操作记录,可能看到rm -rf / 、rm -rf 、rm -rf . /*(点号与斜杠之间有空格)、rm -rf ./ 等之类的命令,导致大量的系统目录及文件被删除掉;

3、执行rpm -Va |grep miss 命令校验丢失的系统文件(对于不是通过rpm包安装的文件无法校验)。

建议:

1、慎重使用rm命令,尤其时带上-r 及-f 参数时; 可以加上-i参数进行删除确认;

2、出现误操作时,要第一次时间停掉磁盘的写入,再想办法恢复,避免被删除文件的磁盘空间被覆盖;

3、对于删除的系统文件,可以从其他正常的系统通过拷贝的方式还原;

4、对于一些系统文件或配置文件,还可以通过yum reinstall 包名/yum update 包名 命令重新安装/升级安装来还原。

场景三:文件系统损坏(FIO)

现象:

用户上报:在云主机上运行的 MySQL数据库异常。

分析:

1、通过监控看到云主机的IOWAIT比较高,怀疑和IO限制有关:

2、放开云主机磁盘限制后,仍然出现异常;MySQL服务不断的在crash,并且备机与主机的现象一样,打印如下日志:

3、DBA定位,反馈 MySQL的数据文件有问题。

4、在备机上发现,mysql 数据文件所在卷的文件系统有异常并且异常比较严重,在该卷上创建创建文件也会失败:

5、通过history命令分析root用户操作记录,发现用户使用fio命令对/dev/vdb磁盘(/data卷所在的磁盘)直接进行压测,压测有随机写、顺序写,而不是写/data目录:

6、MySQL主节点也有执行相同的 fio 操作,由于fio是绕过文件系统层直接对块设备进行操作,磁盘的真实数据已经被覆盖,导致文件已经严重破坏,MySQL数据库无法解析错误的数据文件,从而crash。

7、2台MySQL主机的/data卷数据已经不可靠,需要重新格式化/data卷,并通过备份节点进行恢复数据。

建议:

1、生产环境要慎用 fio 工具,应该在上线前进行压测;

2、使用 fio 命令时,—filename 参数一定不要直接指定块设备(如/dev/sda、/dev/vdb等),而要指定一个普通文件,可以先touch一个空文件,再指定这个文件名。

测试完成后,再删除该文件即可,不然会占用 -size 参数所指定的空间。

场景四:文件系统损坏(DD)

现象:

用户上报:云主机文件访问异常。

分析:

1、云主机数据卷上的文件无访问,并且ls也异常,报【Structure needs cleaning】错误:

2、通过dmesg及 /var/log/messages日志文件看到有大量xfs文件系统的报错:

3、通过history命令分析root用户操作记录,发现root用户有使用dd 命令对 /dev/vdb 磁盘(/data卷所在的磁盘)直接进行压测,对/dev/vdb磁盘写零:

建议:

1、生产环境要慎用 dd 工具,应该在上线前进行压测;

2、使用 dd 命令时 of 参数一定不要直接指定块设备(如/dev/sda、/dev/vdb等)要指定一个普通文件。

如下:

场景五:数据盘被误删除

现象:

用户上报:云磁盘被误删除。

分析:

1、登录云门户查看云磁盘的删除时间,由于云资源是延迟一段时间再删除的,短时间内还可以找回被删除的资源:

2、在虚拟化控制台,确认磁盘是否已经删除(State状态要为Ready):

3、如果尚未删除,可以将云磁盘重新attach到主机;

4、在云门户同步云磁盘信息。

建议:

1、云磁盘的删除操作请谨慎,误删后数据真得无法恢复;

2、删除操作前先确认:

A. 在主机上通过lsof -n、df -h、lvs/pvs/vgs、lsblk等工具确认磁盘是否在使用、是否用于扩容的卷;

B. 对于非用于扩容的卷,确认后,先umount卷、并且清除/etc/fstab中挂载点的信息;

C. 用于扩容的卷无法直接删除,删除会导致原卷出现异常;

3、出现误操作时,要第一时间联系恢复,否则磁盘会被物理清理。

***本网站图片,文字之类版权申明,因为网站可以由注册用户自行上传图片或文字,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。

我要评论

网友评论


评论时间:2023-08-24 18:30:02

风险提示:宏观经济下行影响下游企业IT支出;市场竞争云主机有哪些行业 加剧虚拟主机和vps的区别 险提示:宏观经济下行影响下游企业IT支出;市场竞争加剧导致利润率下降等

最新文章

 2023-04-21 20:28:29   admin

活动发布区版规

 2023-04-11 19:07:00   沐浴阳光

2020年Kubernetes即...

 2023-04-11 18:35:03   门吉木易

云计算:为什么金融市场的未来在云...

 2023-04-11 16:01:08   兵棕

为什么AIOps工具最终可以为云...

热门阅读

 2022-02-26 05:23:03   冷雨点枫

DNS服务器配置之添加正向查找区...

 2022-02-11 05:23:03   chense

Windows下Apache安装

 2022-07-27 18:23:02   sy_901

微软开发ARM版WindowsS...

 2021-08-09 01:35:43   瑟琳娜

企业网站建设根本是向客户营销运营...

 2021-10-26 05:30:02   jiess

跑分订单匹配互助抢单系统开发

随机文章

 2021-08-18 05:30:03   xxm830

纵观整个营销网站建设

 2021-09-04 05:30:02   fantasy10

javascript的值的数据类...

 2021-12-22 05:30:02   netstu

中小企业福音:郑州bgp多线服务...

 2021-12-31 05:30:02   kosine

网络托管与服务器托管区别?

 2022-01-12 05:30:04   shuiduo

深圳服务器托管费用,深圳托管一台...

 2022-02-20 05:23:03   tuoyelong

双线路服务器配置方法是怎样的?

热评文章

 2022-02-19 05:23:03   ghh

根域名服务器配置

 2022-07-31 06:23:02   randywong

浪潮服务器“全面接盘”IBM中国...

 2021-11-01 05:30:02   fdfjdlkfjslkj

全球看点系统APP模式开发

 2022-07-19 06:46:01   yuhaonan

服务器CPU市场上的“斗士”

  热门标签

小快云 - 更小更快-打造便捷的企业快网站
Catfish(鲶鱼) Blog V 4.7.3