Linux系统故障排查(笔记)

  • 以下内容仅当本人学习备忘之用,如有侵权,请联系删除。


    故障排查步骤
for i in `rpm -qa`; do rpm -V $i &> /dev/null || echo $i; done

查询RPM版本信息,防止病毒修改

明确故障

找到故障现象直接表现,基本上能找到故障问题。

故障举例:无法通过ssh登录系统?

ssh他是一个用户态的应用程序,来回的传送指令,同时它会用到网络、tcp连接、存储方面的,他自身还有一些认证机制。
查看它发生时间和频率,是不固定的发生,还是固定那个时间段发生,分析是不是业务使用高负载时间段,明确这个故障,源端、客户端有没有其他方法登录ssh。


信息收集

1.ssh -v查看客户端debug信息
2.采集信息分析,有没有可能高负载时候,ssh无法连接


重要日志项

rceslogd服务分拣和转发日志 ,/var/log/secure只存储着sshd服务端的信息,没有客户端日志。
/var/log/dmesg里面存储的是上次启动
sos软件包

sosreport --batch 自动输出的tar包,包含收集来的日志信息

收集的日志分类

收集了有启动、块设备、内核、pci等等的相关日志。


以sos执行的命令,为文件名

这些是sosreport执行的命令,来搜集相关的日志信息。

提出假设

使用各种方法,提出各自问题接近问题的原因。
验证假设

熟悉内部逻辑,开辟新的方向,验证可能的因素。
故障解决

故障排查需要的能力

寻求帮助

案例网站:https://access.redhat.com

man命令

man命令介绍

main文档

查看系统调用类别
系统调用类别main文档

硬件故障

识别硬件命令

模块程序查看

modprobe是加载和卸载内核模块,-r参数是卸载相关联的模块。
dmesg是从启动到当前,系统内核模块存储到缓冲buff内核日志。


排查手段

常见硬件故障的日志形态

启动故障的排查

启动故障举例

启动流程

排查手段

进入单用户模式

红帽7进入单用户模式

确认根目录可读写

进入救援模式

使用镜像启动救援模式,注意镜像版本不得小于当前系统版本


救援模式

修复挂载方式

选择3手动挂载根目录进行修复

挂载启动目录
重新生成initfs

常见启动故障的日志形态

查看启动时候根目录在哪,分别启动那些

查看启动时候lv

文件系统故障

文件系统故障

EXT文件系统结构

XFS文件系统结构

文件系统常用工具
  • /proc/mounts 查询文件变成只读
  • tune2fs 查看超级块信息
  • dumpe2efs 查看数据块信息
  • e2fsck 检查ext2、ext3、ext4等文件系统的正确性


    fsck注意

    文件系统只读

    inode问题

    空间未释放
  • 利用空间未释放的问题,可以恢复误删除文件,先找到文件进程pid,然后在/proc/[pid]/fd/下找到文件,拷贝出来。


    文件系统日志故障
  • 注意:修复必须先umount


    存储故障
LVM Metadata描述
vg查询

vg内部记录
  • status正常时候有三个,有问题会提示


    pv丢失,一般按照这个流程删除,否则会报错PV丢失

    多路径软件

    scsi debug日志等级收集调试,FFFFFF代表收集所有日志

    数据操作,需要谨慎操作

    常见的存储系统故障的日志形态
  • 一个报错DID都是硬件故障

网络故障

网络故障举例

网络的分层模型

网络不通使用的命令

BROADCACST支持广播、 MULTICAST支持多播、up代表协议开启、 LOWER_UP物理链路已开启
  • tcpdump参数 -i 指定网卡 -s 指定数据包 -w 抓包结果以二进制形式存储到文件 -r 解析抓包的文件内容 -nn以数字形式显示结果,尽量使用二进制方式抓包信息比较完整,使用wireshark查看二进制文件。


    找出丢包点

    网络延迟高判断

    常见网络故障日志形态

应用故障

应用故障举例

应用运行的环境
  • 查询应用的依赖库是否缺失,应用的依赖库和系统的库发生冲突或者名称重复,需要隔离,解决是不同用户运行不通的应用和容器化,yum源尽量使用一个不能用不同版本。
  • strace命令追踪使用https://www.cnblogs.com/machangwei-8/p/10388883.html
    strace命令

    应用debug方法

    kdupmp

    kdupmp配置,高配置的服务器不建议使用auto,512M适用大多场景

    触发事件

    kdump测试,soft lookup内核锁触发

    panic开关配合开启

    可以临时打开,重启后失效
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,839评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,543评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,116评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,371评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,384评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,111评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,416评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,053评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,558评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,007评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,117评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,756评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,324评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,315评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,539评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,578评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,877评论 2 345

推荐阅读更多精彩内容