导读 在本文中,将学习如何使用 fsck 和 xfs_repair 命令修复 Linux 磁盘错误。
什么是FSCK?

fsck(文件系统一致性检查)是用于检查Linux操作系统文件系统一致性的工具。

列出 Linux 磁盘分区和类型:

首先,需要确定 Linux 系统的磁盘分区、它们各自的文件系统以及挂载点。

下面使用lsblk命令列出磁盘明、文件系统类型、挂载点:

[root@localhost ~]# lsblk -o NAME,FSTYPE,MOUNTPOINT
NAME        FSTYPE      MOUNTPOINT
sda                     
sdb                     
sdc                     
sdd                     
sr0         iso9660     
nvme0n1                 
├─nvme0n1p1 ext4        /boot
└─nvme0n1p2 LVM2_member 
  ├─cl-root xfs         /
  └─cl-swap swap        [SWAP]

获取 Linux 磁盘的上次扫描时间

你可以使用下命令找到 Ext2,Ext3,Ext4 类型分区的最后一次扫描时间。

[root@localhost ~]# tune2fs -l /dev/nvme0n1p1 |grep checked
Last checked:             Wed Sep  1 15:42:11 2021

扫描和修复 Ext4 类型的磁盘分区

扫描 Linux 磁盘分区,可以使用 fsck(文件系统一致性检查)命令。但是在检查和修复它之前,需要卸载该分区。下面实例中,我们卸载的是/boot分区。

[root@localhost ~]# umount /dev/nvme0n1p1 

卸载成功后,使用fsck.ext4检查/dev/nvme0n1p1分区

[root@localhost ~]# fsck.ext4 /dev/nvme0n1p1 
e2fsck 1.44.3 (10-July-2018)
/dev/nvme0n1p1: clean, 311/65536 files, 55546/262144 blocks


检查并修复您的 Linux 磁盘后,在其各自的挂载点再次挂载分区。执行以下命令用来挂载 /etc/fstab 配置文件中列出的所有磁盘分区。

[root@localhost ~]# mount -a

在 Linux 启动时启用 Ext4 磁盘分区扫描

在系统启动时启用磁盘检查。你必须修改该磁盘分区的 Mount Count 参数。

[root@localhost ~]# tune2fs -c 1 /dev/nvme0n1p1 
tune2fs 1.44.3 (10-July-2018)
Setting maximal mount count to 1


重启系统之后,fsck命令现在会在启动时检查你的 Ext4 磁盘分区。

[root@localhost ~]# reboot 

重新启动后,获取磁盘分区的Last Checked值,现在它会显示 Linux 上次启动的时间。

[root@localhost ~]# tune2fs -l /dev/nvme0n1p1 |grep checked
Last checked:             Tue Sep 14 11:08:11 2021


恢复Mount Count 参数的默认值,否则它会在每次系统启动时继续执行磁盘扫描。

[root@localhost ~]# tune2fs -c -1 /dev/nvme0n1p1 
tune2fs 1.44.3 (10-July-2018)
Setting maximal mount count to -1

什么是 XFS_REPAIR?

xfs_repair 实用程序具有高度可扩展性,旨在有效修复具有许多 inode 且非常大的文件系统。与其他 Linux 文件系统不同,xfs_repair 不会在启动时运行,即使 XFS 文件系统没有完全卸载。如果发生不干净的卸载,xfs_repair 只会在挂载时重放日志,确保文件系统一致。

扫描和修复 XFS 类型的磁盘分区

XFS 类型的磁盘分区有自己的一组命令,与 Ext4 有点不同。在检查其一致性之前,必须卸载 XFS 磁盘分区。

[root@localhost ~]# umount /dev/sda1 

我们有 xfs_repair 命令用于检查和修复磁盘错误。使用xfs_repair 命令的-n选项来检查磁盘错误。

[root@localhost ~]# xfs_repair -n /dev/sda1 
Phase 1 - find and verify superblock...
Phase 2 - using internal log
        - zero log...
        - scan filesystem freespace and inode maps...
        - found root inode chunk
Phase 3 - for each AG...
        - scan (but don't clear) agi unlinked lists...
        - process known inodes and perform inode discovery...
        - agno = 0
        - agno = 1
        - agno = 2
        - agno = 3
        - process newly discovered inodes...
Phase 4 - check for duplicate blocks...
        - setting up duplicate extent list...
        - check for inodes claiming duplicate blocks...
        - agno = 0
        - agno = 1
        - agno = 2
        - agno = 3
No modify flag set, skipping phase 5
Phase 6 - check inode connectivity...
        - traversing filesystem ...
        - traversal finished ...
        - moving disconnected inodes to lost+found ...
Phase 7 - verify link counts...
No modify flag set, skipping filesystem flush and exiting.


上述命令只执行磁盘检查,不尝试修复任何错误。现在,执行不带 -n 选项的 xfs_repair 命令,它将执行 Linux 磁盘分区的扫描和修复。

[root@localhost ~]# xfs_repair /dev/sda1
Phase 1 - find and verify superblock...
Phase 2 - using internal log
        - zero log...
        - scan filesystem freespace and inode maps...
        - found root inode chunk
Phase 3 - for each AG...
        - scan and clear agi unlinked lists...
        - process known inodes and perform inode discovery...
        - agno = 0
        - agno = 1
        - agno = 2
        - agno = 3
        - process newly discovered inodes...
Phase 4 - check for duplicate blocks...
        - setting up duplicate extent list...
        - check for inodes claiming duplicate blocks...
        - agno = 0
        - agno = 1
        - agno = 2
        - agno = 3
Phase 5 - rebuild AG headers and trees...
        - reset superblock...
Phase 6 - check inode connectivity...
        - resetting contents of realtime bitmap and summary inodes
        - traversing filesystem ...
        - traversal finished ...
        - moving disconnected inodes to lost+found ...
Phase 7 - verify and correct link counts...
done


下面诚信挂载分区

[root@localhost ~]# mount /dev/sda1 /data/
在 Linux 启动时启用 XFS 磁盘分区扫描

在某些情况下,如果 Linux 操作系统正在使用磁盘分区,则无法卸载磁盘分区。出于这个原因,您可能不得不将磁盘检查推迟到下一次系统启动。

要使 xfs_repair 命令能够在 Linux 启动时运行,请在 GRUB 菜单内核命令的末尾添加“fsck.mode=force fsck.repair=yes”。

查看系统日志以验证磁盘修复命令的执行情况。

[root@localhost ~]# journalctl |grep systemd-fsck

要在启动时永久启用磁盘检查,您必须在 GRUB 配置文件中添加“fsck.mode=force fsck.repair=yes”。

下面编辑grub配置文件,找到 GRUB_CMDLINE_LINUX 参数并在行尾附加fsck.mode=force fsck.repair=yes。

[root@localhost ~]# cat /etc/default/grub 
GRUB_TIMEOUT=5
GRUB_DISTRIBUTOR="$(sed 's, release .*$,,g' /etc/system-release)"
GRUB_DEFAULT=saved
GRUB_DISABLE_SUBMENU=true
GRUB_TERMINAL_OUTPUT="console"
GRUB_CMDLINE_LINUX="crashkernel=auto resume=/dev/mapper/cl-swap rd.lvm.lv=cl/root rd.lvm.lv=cl/swap fsck.mode=force fsck.repair=yes"
GRUB_DISABLE_RECOVERY="true"
GRUB_ENABLE_BLSCFG=true


根据新参数重新生成 GRUB 菜单配置。

[root@localhost ~]# grub2-mkconfig 


然后重启系统:

# reboot
总结

到目前为止已经成功扫描和修复XFS、Ext4文件系统了。

本文原创地址:https://www.linuxprobe.com/scan-repair-disk-error.html编辑:逄增宝,审核员:逄增宝