pidstat 概述
pidstat是sysstat工具的一个命令,用于监控全部或指定进程的cpu、内存、线程、设备IO等系统资源的占用情况。pidstat首次运行时显示自系统启动开始的各项统计信息,之后运行pidstat将显示自上次运行该命令以后的统计信息。用户可以通过指定统计的次数和时间来获得所需的统计信息。
pidstat 安装
pidstat 是sysstat软件套件的一部分,sysstat包含很多监控linux系统状态的工具,它能够从大多数linux发行版的软件源中获得。
在Debian/Ubuntu系统中可以使用下面的命令来安装:
apt-get install sysstat
CentOS/Fedora/RHEL版本的linux中则使用下面的命令:
yum install sysstat
pidstat 示例
pidstat 的用法:
pidstat [ 选项 ] [ <时间间隔> ] [ <次数> ]
如下所示:
[root@master ~]# pidstat --help
Usage: pidstat [ options ] [ <interval> [ <count> ] ]
Options are:
[ -d ] [ -h ] [ -I ] [ -l ] [ -r ] [ -s ] [ -t ] [ -U [ <username> ] ] [ -u ]
[ -V ] [ -w ] [ -C <command> ] [ -p { <pid> [,...] | SELF | ALL } ]
[ -T { TASK | CHILD | ALL } ]
常用的参数:
- -u:默认的参数,显示各个进程的cpu使用统计
- -r:显示各个进程的内存使用统计
- -d:显示各个进程的IO使用情况
- -p:指定进程号
- -w:显示每个进程的上下文切换情况
- -t:显示选择任务的线程的统计信息外的额外信息
- -T { TASK | CHILD | ALL }
这个选项指定了pidstat监控的。TASK表示报告独立的task,CHILD关键字表示报告进程下所有线程统计信息。ALL表示报告独立的task和task下面的所有线程。
注意:task和子线程的全局的统计信息和pidstat选项无关。这些统计信息不会对应到当前的统计间隔,这些统计信息只有在子线程kill或者完成的时候才会被收集。 - -V:版本号
- -h:在一行上显示了所有活动,这样其他程序可以容易解析。
- -I:在SMP环境,表示任务的CPU使用率/内核数量
- -l:显示命令名和所
示例一: 查看所有进程cpu使用情况统计(-u)
pidstat -u
使用-u选项,pidstat将显示各活动进程的cpu使用统计,执行”pidstat -u”与单独执行”pidstat”的效果一样。
[root@localhost ~]# mpstat -P ALL 1
Linux 3.10.0-693.el7.x86_64 (localhost.localdomain) 11/02/2020 _x86_64_ (2 CPU)
10:15:45 PM CPU %usr %nice %sys %iowait %irq %soft %steal %guest %gnice %idle
10:15:46 PM all 100.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10:15:46 PM 0 100.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10:15:46 PM 1 100.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
#可以看到当前CPU使用率为100%,两核CPU
[root@localhost ~]# pidstat -u 1
Linux 3.10.0-693.el7.x86_64 (localhost.localdomain) 11/02/2020 _x86_64_ (2 CPU)
10:16:19 PM UID PID %usr %system %guest %CPU CPU Command
10:16:20 PM 0 7741 19.00 0.00 0.00 19.00 0 stress
10:16:20 PM 0 7742 20.00 0.00 0.00 20.00 0 stress
10:16:20 PM 0 7743 20.00 0.00 0.00 20.00 0 stress
10:16:20 PM 0 7744 19.00 0.00 0.00 19.00 1 stress
10:16:20 PM 0 7745 21.00 0.00 0.00 21.00 1 stress
10:16:20 PM 0 7746 20.00 0.00 0.00 20.00 1 stress
10:16:20 PM 0 7747 21.00 0.00 0.00 21.00 1 stress
10:16:20 PM 0 7748 20.00 0.00 0.00 20.00 1 stress
10:16:20 PM 0 7749 19.00 0.00 0.00 19.00 0 stress
10:16:20 PM 0 7750 19.00 0.00 0.00 19.00 0 stress
#再来看看当前进程cpu使用率,stress进程cpu使用率相加起来可以接近200%,这个和两核cpu使用率为100%的情况是相符的
在结果中你能看到如下内容:
- PID- 被监控的任务的进程号
- %usr- 当在用户层执行(应用程序)时这个任务的cpu使用率,和 nice 优先级无关。注意这个字段计算的cpu时间不包括在虚拟处理器中花去的时间。
- %system- 这个任务在系统层使用时的cpu使用率。
- %guest- 任务花费在虚拟机上的cpu使用率(运行在虚拟处理器)。
- %CPU- 任务总的cpu使用率。在SMP环境(多处理器)中,如果在命令行中输入-I参数的话,cpu使用率会除以你的cpu数量。
- CPU- 正在运行这个任务的处理器编号。
- Command- 这个任务的命令名称。
指定采样周期和采样次数
pidstat命令指定采样周期和采样次数,命令形式为”pidstat [option] interval [count]”,以下pidstat输出以2秒为采样周期,输出10次cpu使用统计信息:
pidstat 2 10
示例二: 内存使用情况统计(-r)
pidstat -r
使用-r选项,pidstat将显示各活动进程的内存使用统计:
-bash: pid: command not found
[root@master ~]# pidstat -r 1 5
Linux 3.10.0-693.el7.x86_64 (master) 07/15/2020 _x86_64_ (2 CPU)
08:37:15 AM UID PID minflt/s majflt/s VSZ RSS %MEM Command
08:37:16 AM 0 644 4.95 0.00 305144 6172 0.80 vmtoolsd
08:37:16 AM 0 3267 116.83 0.00 108300 1056 0.14 pidstat
08:37:16 AM UID PID minflt/s majflt/s VSZ RSS %MEM Command
08:37:17 AM 0 1089 47.00 0.00 153136 2196 0.28 watch
08:37:17 AM 0 3267 133.00 0.00 108300 1140 0.15 pidstat
- PID:进程标识符
- Minflt/s:任务每秒发生的次要错误,不需要从磁盘中加载页
- Majflt/s:任务每秒发生的主要错误,需要从磁盘中加载页
- VSZ:虚拟地址大小,虚拟内存的使用KB
- RSS:长期内存使用,任务的不可交换物理内存的使用量(kb)
- %MEM:该进程使用内存的百分比
- Command:task命令名
示例三:显示各个进程的IO使用情况(-d)
pidstat -d
[root@master ~]# pidstat -d
Linux 3.10.0-693.el7.x86_64 (master) 07/15/2020 _x86_64_ (2 CPU)
08:38:42 AM UID PID kB_rd/s kB_wr/s kB_ccwr/s Command
08:38:42 AM 0 1 57.12 111.11 0.00 systemd
08:38:42 AM 0 410 0.04 0.00 0.00 xfsaild/dm-0
08:38:42 AM 0 479 0.29 0.00 0.00 systemd-journal
08:38:42 AM 0 498 0.02 0.00 0.00 lvmetad
报告IO统计显示以下信息:
- PID:进程id
- kB_rd/s:每秒从磁盘读取的KB
- kB_wr/s:每秒写入磁盘KB
- kB_ccwr/s:任务取消的写入磁盘的KB。当任务截断脏的pagecache的时候会发生。
- COMMAND:task的命令名
示例四:显示每个进程的上下文切换情况(-w)
pidstat -w -p 2831
[root@master ~]# pidstat -w -p 3126 1 5
Linux 3.10.0-693.el7.x86_64 (master) 07/15/2020 _x86_64_ (2 CPU)
08:41:14 AM UID PID cswch/s nvcswch/s Command
08:41:15 AM 0 3126 4090.10 0.00 stress
08:41:16 AM 0 3126 4798.00 1.00 stress
08:41:17 AM 0 3126 5511.00 0.00 stress
08:41:18 AM 0 3126 5603.00 1.00 stress
08:41:19 AM 0 3126 5391.00 0.00 stress
Average: 0 3126 5076.65 0.40 stress
- PID:进程id
- Cswch/s:每秒主动任务上下文切换数量
- Nvcswch/s:每秒被动任务上下文切换数量
- Command:命令名
示例五:显示选择任务的线程的统计信息外的额外信息 (-t)
pidstat -t -p 2831
[root@master ~]# pidstat -ut -p 3126 1 5
Linux 3.10.0-693.el7.x86_64 (master) 07/15/2020 _x86_64_ (2 CPU)
08:43:55 AM UID TGID TID %usr %system %guest %CPU CPU Command
08:43:56 AM 0 3126 - 0.00 91.00 0.00 91.00 0 stress
08:43:56 AM 0 - 3126 0.00 91.00 0.00 91.00 0 |__stress
08:43:56 AM UID TGID TID %usr %system %guest %CPU CPU Command
08:43:57 AM 0 3126 - 0.00 90.00 0.00 90.00 0 stress
08:43:57 AM 0 - 3126 0.00 90.00 0.00 90.00 0 |__stress
08:43:57 AM UID TGID TID %usr %system %guest %CPU CPU Command
08:43:58 AM 0 3126 - 0.00 78.00 0.00 78.00 0 stress
08:43:58 AM 0 - 3126 0.00 78.00 0.00 78.00 0 |__stress
- TGID:主线程的表示
- TID:线程id
- %usr:进程在用户空间占用cpu的百分比
- %system:进程在内核空间占用cpu的百分比
- %guest:进程在虚拟机占用cpu的百分比
- %CPU:进程占用cpu的百分比
- CPU:处理进程的cpu编号
- Command:当前进程对应的命令
pidstat常用命令
使用pidstat进行问题定位时,以下命令常被用到:
pidstat -u 1
pidstat -r 1
pidstat -d 1
以上命令以1秒为信息采集周期,分别获取cpu、内存和磁盘IO的统计信息。
1. 你可以通过使用下面的命令来监测内存使用
# pidstat -r 2 5
这会给你5份关于page faults的统计数据结果,间隔2秒。这将会更容易的定位出现问题的进程。
2. 显示所有mysql服务器的子进程
# pidstat -T CHILD -C mysql
3. 将所有的统计数据结合到一个便于阅读的单一报告中:
pidstat -urd -h