设备:rk3568 平台,Linux 4.19 ,Ubuntu 20.04

崩溃概率:偶现。

崩溃的时候系统彻底卡死,调试串口也没有任何输出,连 panic 都不打印。

我尝试 `echo c > /proc/sysrq-trigger` ,发现调试串口是有调用栈打印的。我也启用了 `nmi_watchdog`,在手动 `echo c > /proc/sysrq-trigger` 的时候看门狗能正常启动,但卡死的时候看门狗也失效了。

这个内核是我自己改过的,我该如何排查:

1. 这个问题是硬件问题还是软件问题导致的?
2. 如果是软件问题,我该如何 debug ?
举报· 245 次点击
登录 注册 站外分享
6 条回复  
XDiLa 小成 2024-10-12 14:45:04
想把发弄个日志收集工具 把 kern.log syslog  dmesg 推送出去,等到到时候服务器夯住了就可以分析了
CapNemo 初学 2024-10-12 15:00:31
一个想法是往地址线上挂个示波器,看看还有没有在执行任何指令
leonshaw 小成 2024-10-12 15:05:09
内存够的话把 kdump 开起来
LXGMAX 小成 2024-10-12 15:51:13
rk 啊,应该是供电不够了
myxvhgiile 初学 2024-10-12 17:25:37
既然是你改过的内核,那首先应该尝试还原修改看看能不能复现吧,如果还原后就不会复现了就从你修改的部分入手去调试呗。除此以外我能想到就是 jlink 连上尝试调试一下了,既然内核是你自己编译的,gdb 调试一下还是很有可能看到程序具体是跑到哪里了的。
Geekerstar 小成 2024-10-12 17:43:58
有没有显卡,装显卡驱动没有?
返回顶部