1、strace
这个功能很强大,能够看到很多底层调用,便于分析问题
举例:
[wangbin@localhost pas]$ strace -p 10472
Process 10472 attached – interrupt to quit
futex(0x4113be8, FUTEX_WAIT, 10482, NULL
<unfinished …>
Process 10472 detached
我们可以看出这个进程已经死锁了,所以strace命令非常有用,特别是网络程序
2、tcpdump
在分析fastcgi程序时,我们利用这个命令来查看tcp包的情况
[root@localhost ~]# tcpdump -i lo -s 1500 port 9000
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on lo, link-type EN10MB (Ethernet), capture size 1500 bytes
15:23:16.901004 IP localhost.localdomain.50867 > localhost.localdomain.9000: S 3482201970:3482201970(0) win 32767 <mss 16396,sackOK,timestamp 2296841391 0,nop,wscale 7>
15:23:16.901025 IP localhost.localdomain.9000 > localhost.localdomain.50867: S 3473410857:3473410857(0) ack 3482201971 win 32767 <mss 16396,sackOK,timestamp 2296841391 2296841391,nop,wscale 7>
15:23:16.901039 IP localhost.localdomain.50867 > localhost.localdomain.9000: . ack 1 win 256 <nop,nop,timestamp 2296841391 2296841391>
15:23:16.901150 IP localhost.localdomain.50867 > localhost.localdomain.9000: P 1:1377(1376) ack 1 win 256 <nop,nop,timestamp 2296841391 2296841391>
15:23:16.901170 IP localhost.localdomain.9000 > localhost.localdomain.50867: . ack 1377 win 256 <nop,nop,timestamp 2296841391 2296841391>
15:23:16.901214 IP localhost.localdomain.9000 > localhost.localdomain.50867: P 1:97(96) ack 1377 win 256 <nop,nop,timestamp 2296841391 2296841391>
15:23:16.901222 IP localhost.localdomain.50867 > localhost.localdomain.9000: . ack 97 win 256 <nop,nop,timestamp 2296841391 2296841391>
15:23:16.901236 IP localhost.localdomain.9000 > localhost.localdomain.50867: F 97:97(0) ack 1377 win 256 <nop,nop,timestamp 2296841391 2296841391>
15:23:16.901822 IP localhost.localdomain.50867 > localhost.localdomain.9000: F 1377:1377(0) ack 98 win 256 <nop,nop,timestamp 2296841392 2296841391>
15:23:16.901836 IP localhost.localdomain.9000 > localhost.localdomain.50867: . ack 1378 win 256 <nop,nop,timestamp 2296841392 2296841392>
我们通过这个命令可以发现是9000端口主动关闭了连接,这说明在另一端保持连接是没有效果的。
3、core文件
这个作用就是像取款机旁边的摄像机,能够记录下程序崩溃时的场景,对于分析高难度问题非常有用
不过用这个,一定要权限配置正确了。
4、gdb
gdb -p 进程号,可以去调试正在执行中的进程,功能也很强大。也就是说,只要你上线的程序编译的时候加上了-g,并去掉了优化参数,你就可以在上线的时候调试某一个进程,比如nginx进程。
5、log文件
这是最常用的方法,也是最土的方法,不过对于调试还是非常有用的。