我们的系统盘是 xfs (红帽 7 的操作系统),数据盘 ext4 ,但是昨天机器突然所有进程都 hung 了,CPU 使用率从 40 多降低到了个位数,进程状态基本都为 D ,负载从几十到了 20000 多,系统日志显示 jbd2 卡了 120s ,其他进程也有卡主 120s 的(Flink on K8s)。机器 reboot 之后恢复了,现在怀疑是内核的 ext4 文件系统有问题,但是也不能 100%确定。从我的角度上考虑,可以将 ext4 换成 xfs 去规避问题。请大家给个建议吧,目前看只能长时间用红帽 7 了,内核就到 3.10.1160 了。
举报· 247 次点击
登录 注册 站外分享
12 条回复  
iyiluo 小成 2024-8-16 09:21:46
你应该先怀疑是不是硬盘快坏了,这个几率比遇到文件系统出故障几率大得多
barrysj 小成 2024-8-16 09:26:22
确实考虑硬盘的问题更大
有监控 cpu iowait 和硬盘的读写延迟之类的数据吗
zzlyzq 小成 2024-8-16 09:30:55
硬盘可能有故障,而非文件系统问题。
hefish 小成 2024-8-16 09:42:52
op 心里已经有答案了。
liuchao719 小成 2024-8-16 09:45:33
是有什么需求要用这么低版本的内核嘛,通常来讲开发者对低版本会关照少一些,我觉得能用高版本还是尽量用高版本?因为之前做项目很多问题都是版本过旧引起的,升级一下就没有问题了。
Hormazed 小成 2024-8-16 10:33:23
我们也在用 Red Hat Enterprise Linux Server release 7.9 (Maipo)为了避免内核问题,最近陆续把内核升级到 6.6.8 ,数量已有 20 台左右
Linux version 6.6.8 (root@VTW12NET) (gcc (GCC) 11.2.1 20220127 (Red Hat 11.2.1-9), GNU ld version 2.27-44.base.el7_9.1) #1 SMP PREEMPT_DYNAMIC Thu Dec 20 12:01:06 CST 2023
就我们使用情况来说。没出现过问题,IO 平均每周 300G 。
Kumo31 小成 2024-8-16 10:49:18
给出的信息太少 不足以判断是哪里的问题。不过不用迷信内核,这么老的内核版本 bug 可不少,我们做存储碰上过一篮子的各种内核 bug
JackSlowFcck 小成 2024-8-16 10:52:27
要不,换块硬盘试试?
lrvy 小成 2024-8-16 10:56:41
RHEL 的话直接找售后查😁
12下一页
返回顶部