进程(Process)是程序运行的一个实例,是定义在多用户、多任务操作系统环境下用于表示应用程序在内存环境中基本执行单元。系统分配资源的基本单位。
CPU 数量有限,而系统上要运行的任务(进程)很多,在任意时刻CPU只能运行一个进程。采用分时机制,把CPU的运算时间进行分片,让每个进程都获得CPU的时间片(time slice).由于进程运行的时间片很短,所以从表面看来所有进程是在同时运行着。意思是说,进程A使用完它的CPU时间后,内核根据调度算法把进程B调度到CPU上来运行,等到进程B使用完它的CPU时间后,内核根据调度策略又把另外一个进程调度到CPU上运行,就此类推。而该过程就叫做:进程的上下文切换(context switches) Linux 内核用数据结构 task_struct(任务数据结构) 表示一个进程,taks_struct 是在创建进程时候,内核为了追踪一个进程而使用的数据结构。 操作系统使用 task_struct 保持跟踪进程运行所需的所有状态信息。这种状态,也就是”上下文“。它包括许多信息,例如 PC(指令计数器) 和寄存器文件的当前值,以及主存的内容。在任何一个时刻,单处理器系统都只能执行一个进程的代码。当操作系统决定要把控制权从当前进程转移到某一个新进程时,就会进行“上下文切换”,即保存当前进程的上下文、恢复用户进程的上下文,然后将控制权传递到新进程。新进程就会从上次停止的地方开始执行。 监测指定的进程的运行状况:页请求错误、虚拟内存的大小、常驻内存的大小等:[root@node2 ~]# watch -n 1 'ps axo pid,comm,min_flt,maj_flt,trs,drs,vsize,size,rss | grep httpd'Every 1.0s: ps axo pid,comm,min_flt,maj_flt,trs,drs,vsize,size,rss | grep httpd Sat Jun 14 03:14:09 2014 3521 httpd 1169 2 387 35384 35772 13288 10248 3524 httpd 3194 55 387 37672 38060 15576 12300 3525 httpd 2179 6 387 37136 37524 15040 11524 3527 httpd 356 2 387 35384 35772 13288 9160 3528 httpd 1618 5 387 37908 38296 15812 12036 4539 httpd 1540 5 387 37656 38044 15560 11816 4549 httpd 4552 87 387 36860 37248 14764 11376 4550 httpd 2311 10 387 38928 39316 16832 13352 4551 httpd 3790 12 387 37656 38044 15560 12220 4552 httpd 363 3 387 35384 35772 13288 9184 4629 httpd 355 1 387 35384 35772 13288 9156
说明:
min_flt(minor fault) 表示程序的页请求错误次数.内存中已经缓存有进程所需要的页面数据了。只要把该页面数据与进程的虚拟地址空间建立映射关系就可以了。
maj_flt(major fault) 表示程序的页请求错误次数。内存中没有缓存有进程所需要的页面数据。内核必需要通知CPU从磁盘中把页面数据加载到内存中来。
TRS 表示程序所拥有的可执行虚拟内存的大小(KB); DRS 表示程序数据段和用户态的栈的大小(KB); vsize 表示程序使用的虚拟内存大小(KB) total vm size in KB. size 表示程序使用的内存大小(KB) memory size in kilobytes. rss 表示程序常驻内存的大小。常驻内存指的是,该进程占据的页面是不可以从物理内存交换出去的。
TRS + DRS = vsize通过 /proc接口 查看进程(应用程序)所能使用的系统资源:
[root@node2 ~]# cat /proc/3521/limitsLimit Soft Limit Hard Limit UnitsMax cpu time unlimited unlimited secondsMax file size unlimited unlimited bytesMax data size unlimited unlimited bytesMax stack size 10485760 unlimited bytesMax core file size 0 unlimited bytesMax resident set unlimited unlimited bytesMax processes 4096 4096 processesMax open files 1024 1024 filesMax locked memory 32768 32768 bytesMax address space unlimited unlimited bytesMax file locks unlimited unlimited locksMax pending signals 4096 4096 signalsMax msgqueue size 819200 819200 bytesMax nice priority 0 0Max realtime priority 0 0
说明:
Max cpu time 能使用的CPU时间 Max stack size 能使用的最大栈(stack)大小(bytes) Max processes 父进程最多同时能 fork 多少个进程。 Max open files 最多同时可以打开多少个文件。像 Nginx 服务器,使用 一个进程响应N个请求,那么只能并发1024个用户请求。
一个套接字文件表示一个用户请求。所以,想要 Nginx 并发更大的请求数,首先要修改它能同时打开的文件数量。
动态监控系统中占用物理内存最大的任务(进程)。方法:使用命令【top】,再与top进程交互,按"M"键,命令【top】显示的结果就按照占用物理内存大小进行
排序。[root@node2 ~]# toptop - 04:08:05 up 2:06, 3 users, load average: 0.02, 0.03, 0.00Tasks: 106 total, 1 running, 105 sleeping, 0 stopped, 0 zombieCpu(s): 0.3%us, 3.0%sy, 0.0%ni, 96.0%id, 0.3%wa, 0.0%hi, 0.3%si, 0.0%stMem: 255412k total, 233208k used, 22204k free, 31548k buffersSwap: 128512k total, 0k used, 128512k free, 87048k cached PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 3141 mysql 15 0 304m 35m 5280 S 0.0 14.3 0:00.77 mysqld 4550 daemon 15 0 39316 13m 2856 S 0.0 5.2 0:00.13 httpd 3524 daemon 15 0 38060 12m 2884 S 0.0 4.8 0:00.29 httpd 4551 daemon 15 0 38044 11m 2856 S 0.0 4.8 0:00.27 httpd 3528 daemon 15 0 38296 11m 2860 S 0.0 4.7 0:00.09 httpd 4539 daemon 15 0 38044 11m 2852 S 0.0 4.6 0:00.07 httpd 3525 daemon 15 0 37524 11m 2856 S 0.0 4.5 0:00.16 httpd 4549 daemon 15 0 37248 11m 2880 S 0.0 4.5 0:00.36 httpd 3394 root 34 19 25448 10m 2104 S 0.0 4.0 0:00.03 yum-updatesd 3521 root 18 0 35772 10m 3496 S 0.0 4.0 0:00.10 httpd 4552 daemon 15 0 35772 9184 2384 S 0.0 3.6 0:00.05 httpd 3527 daemon 15 0 35772 9160 2364 S 0.0 3.6 0:00.01 httpd 4629 daemon 15 0 35772 9156 2364 S 0.0 3.6 0:00.00 httpd [root@node2 ~]# top 使用"A"键与【top】交互1:Def - 04:38:57 up 2:37, 3 users, load average: 0.11, 0.08, 0.02Tasks: 107 total, 4 running, 102 sleeping, 0 stopped, 1 zombieCpu(s): 0.7%us, 2.0%sy, 0.0%ni, 97.0%id, 0.0%wa, 0.0%hi, 0.3%si, 0.0%stMem: 255412k total, 236148k used, 19264k free, 34488k buffersSwap: 128512k total, 0k used, 128512k free, 87056k cached1 PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 3141 mysql 15 0 304m 35m 5280 S 0.0 14.3 0:00.87 mysqld 4550 daemon 15 0 39316 13m 2856 S 0.0 5.2 0:00.13 httpd 3524 daemon 15 0 38060 12m 2884 S 0.0 4.8 0:00.29 httpd 4551 daemon 15 0 38044 11m 2856 S 0.0 4.8 0:00.27 httpd 3528 daemon 15 0 38296 11m 2860 S 0.0 4.7 0:00.09 httpd2 PID PPID TIME+ %CPU %MEM PR NI S VIRT SWAP RES UID COMMAND 19730 7719 0:00.00 0.0 0.0 19 0 Z 0 0 0 0 sh19121 3654 0:01.11 0.0 0.4 15 0 R 2320 1296 1024 0 top 13403 13401 0:00.16 0.0 0.3 15 0 S 4184 3384 800 0 less 13401 13399 0:00.00 0.0 0.4 20 0 S 4488 3504 984 0 sh 13399 3482 0:00.00 0.0 0.3 18 0 S 3900 3128 772 0 man3 PID %MEM VIRT SWAP RES CODE DATA SHR nFLT nDRT S PR NI %CPU COMMAND 3141 14.3 304m 268m 35m 8688 293m 5280 86 0 S 15 0 0.0 mysqld 4550 5.2 39316 25m 13m 388 16m 2856 10 0 S 15 0 0.0 httpd 3524 4.8 38060 25m 12m 388 15m 2884 55 0 S 15 0 0.0 httpd 4551 4.8 38044 25m 11m 388 15m 2856 12 0 S 15 0 0.0 httpd 3528 4.7 38296 25m 11m 388 15m 2860 5 0 S 15 0 0.0 httpd 4539 4.6 38044 25m 11m 388 15m 2852 5 0 S 15 0 0.0 httpd
说明:
说明: VIRT 进程使用的虚拟内存的大小。包括代码段(code)、数据段(data)和共享库以及交换到swap的页面。(KB)
VIRT = SWAP + RES SWAP 虚拟内存影像的一部分 The swapped out portion of a task's total virtual memory p_w_picpath.(KB)
RES 进程使用的物理内存的大小,指的是常驻内存的大小。(KB) The non-swapped physicalmemory a task has used.
RES = CODE + DATA CODE Code size (KB) 进程所常驻物理内存大小中用于执行代码的内存的大小,Text segment. DATA Data+Stack size (KB) 数据段Data segment + 栈段 stack segment SHR 一个进程使用的共享内存大小 Shared Mem size (KB) nFLT major fault类型的页请求错误数 Page Fault count. The number of major page faultsthat have occurred for a task.
nDRT 进程写到磁盘的脏页数 Dirty Pages count总结:
如果 Appache 服务器是基于 prefork 模型的话,一个进程就要占据大约 12M 的物理内存空间。还不包括被从物理内存中交换出去的页面。 基于 prefork 模型的 Appache 服务器,是使用一个进程响应一个用户的请求的。假如并发请求数为1000,那么我们的 httpd 服务器最少要消耗12M * 1000 = 12000M 也就是大约10GB的内存。
使用命令 pmap 查看进程的地址空间分布(也可以使用 cat /proc/<pid>/maps):
[root@node2 ~]# pmap 39103910: nginx: master process /usr/sbin/nginx -c /etc/nginx/nginx.conf002ca000 104K r-x-- /lib/ld-2.5.so002e4000 4K r-x-- /lib/ld-2.5.so002e5000 4K rwx-- /lib/ld-2.5.so002ed000 1276K r-x-- /lib/libc-2.5.so0042c000 4K --x-- /lib/libc-2.5.so0042d000 8K r-x-- /lib/libc-2.5.so0042f000 4K rwx-- /lib/libc-2.5.so00430000 12K rwx-- [ anon ]......08047000 432K r-x-- /usr/sbin/nginx080b3000 40K rw--- /usr/sbin/nginx080bd000 40K rw--- [ anon ]097fe000 132K rw--- [ anon ]b7fe6000 20K rw--- [ anon ]b7ff4000 4K rw-s- /dev/zero (deleted)bff8f000 84K rw--- [ stack ] total 5740K
说明:
第一列为内存区域起始地址,第二列为内存区域大小(虚拟内存),第三列为属性,第四列为内存映射的文件。
一个进程运行的时候,其用到文件的代码段、数据段等都是映射到内存地址区域的。这个功能是通过系统调用 mmap() 来完成的。
进程占用的虚拟内存为:5740KB.[root@node2 ~]# pmap -x 39103910: nginx: master process /usr/sbin/nginx -c /etc/nginx/nginx.confAddress Kbytes RSS Dirty Mode Mapping002ca000 104 0 0 r-x-- ld-2.5.so002e4000 4 4 4 r-x-- ld-2.5.so002e5000 4 4 4 rwx-- ld-2.5.so002ed000 1276 48 0 r-x-- libc-2.5.so0042c000 4 0 0 --x-- libc-2.5.so0042d000 8 8 4 r-x-- libc-2.5.so0042f000 4 4 4 rwx-- libc-2.5.so00430000 12 12 12 rwx-- [ anon ]......08047000 432 68 0 r-x-- nginx080b3000 40 40 36 rw--- nginx080bd000 40 12 12 rw--- [ anon ]097fe000 132 124 124 rw--- [ anon ]b7fe6000 20 20 20 rw--- [ anon ]b7ff4000 4 0 0 rw-s- zero (deleted)bff8f000 84 12 12 rw--- [ stack ]-------- ------- ------- ------- -------total kB 5740 - - -
说明:
该进程所占据的虚拟地址空间为: 5740KB; RSS 表示该进程的常驻内存的大小(KB); Dirty 表示脏页。 可以看得出,它们的地址是连续的。使用接口 /proc
[root@node2 ~]# cat /proc/3910/maps002ca000-002e4000 r-xp 00000000 08:02 67212 /lib/ld-2.5.so002e4000-002e5000 r-xp 00019000 08:02 67212 /lib/ld-2.5.so002e5000-002e6000 rwxp 0001a000 08:02 67212 /lib/ld-2.5.so002ed000-0042c000 r-xp 00000000 08:02 67213 /lib/libc-2.5.so0042c000-0042d000 --xp 0013f000 08:02 67213 /lib/libc-2.5.so0042d000-0042f000 r-xp 0013f000 08:02 67213 /lib/libc-2.5.so0042f000-00430000 rwxp 00141000 08:02 67213 /lib/libc-2.5.so00430000-00433000 rwxp 00430000 00:00 0......08047000-080b3000 r-xp 00000000 08:02 1525801 /usr/sbin/nginx080b3000-080bd000 rw-p 0006b000 08:02 1525801 /usr/sbin/nginx080bd000-080c7000 rw-p 080bd000 00:00 0097fe000-0981f000 rw-p 097fe000 00:00 0 [heap]b7fe6000-b7feb000 rw-p b7fe6000 00:00 0b7ff4000-b7ff5000 rw-s 00000000 00:09 17042 /dev/zero (deleted)bff8f000-bffa4000 rw-p bffea000 00:00 0 [stack]
通过 /proc 接口查看进程的状态
[root@node2 ~]# cat /proc/3521/status。。。VmPeak: 35772 kBVmSize: 35772 kBVmLck: 0 kBVmHWM: 10248 kBVmRSS: 10248 kBVmData: 13204 kBVmStk: 84 kBVmExe: 388 kBVmLib: 21016 kBVmPTE: 68 kBStaBrk: 085f7000 kBBrk: 08846000 kBStaStk: bfd6bc20 kB。。。Cpus_allowed: 00000001Mems_allowed: 1
查看一个可执行二进制程序所依赖的库文件。
[root@node2 ~]# ldd /usr/local/apache2/bin/httpd linux-gate.so.1 => (0x00f40000) libm.so.6 => /lib/libm.so.6 (0x00455000) libaprutil-1.so.0 => /usr/lib/libaprutil-1.so.0 (0x007b4000) libcrypt.so.1 => /lib/libcrypt.so.1 (0x00c79000) libldap-2.3.so.0 => /usr/lib/libldap-2.3.so.0 (0x001f2000) liblber-2.3.so.0 => /usr/lib/liblber-2.3.so.0 (0x0025a000) ......
追踪一个已经启动的进程
[root@node2 ~]# strace -p 3521
追踪启动一个进程启动的时间、发生的系统调用、是否有错误等等
[root@node2 ~]# strace -c /usr/local/apache2/bin/httpd% time seconds usecs/call calls errors syscall------ ----------- ----------- --------- --------- ---------------- 59.55 0.002931 183 16 mprotect 12.21 0.000601 9 65 munmap 11.40 0.000561 561 1 clone 11.19 0.000551 3 178 read 1.36 0.000067 0 292 mmap2 1.20 0.000059 0 180 27 open 0.95 0.000047 0 151 fstat64 0.93 0.000046 0 114 time 0.45 0.000022 4 6 write 0.41 0.000020 0 164 close 0.00 0.000000 0 1 execve 0.00 0.000000 0 1 chdir 0.00 0.000000 0 1 lseek 0.00 0.000000 0 2 1 access。。。 0.00 0.000000 0 12 socket 0.00 0.000000 0 3 bind 0.00 0.000000 0 8 6 connect。。。 0.00 0.000000 0 1 semget 0.00 0.000000 0 2 semctl------ ----------- ----------- --------- --------- ----------------100.00 0.004922 1293 50 total
查看一个进程打开的文件
[root@node2 ~]# lsof -p 3910COMMAND PID USER FD TYPE DEVICE SIZE NODE NAMEnginx 3910 root cwd DIR 8,2 4096 2 /nginx 3910 root rtd DIR 8,2 4096 2 /nginx 3910 root txt REG 8,2 3923026 1525801 /usr/sbin/nginxnginx 3910 root mem REG 8,2 125736 67212 /lib/ld-2.5.songinx 3910 root mem REG 8,2 1611564 67213 /lib/libc-2.5.songinx 3910 root mem REG 8,2 16428 67217 /lib/libdl-2.5.so......
通过 /proc 接口查看进程打开的文件
[root@node2 ~]# ll /proc/3910/fd/total 0lrwx------ 1 root root 64 Jun 14 10:09 0 -> /dev/nulllrwx------ 1 root root 64 Jun 14 10:09 1 -> /dev/nulll-wx------ 1 root root 64 Jun 14 10:09 2 -> /var/log/nginx_error.loglrwx------ 1 root root 64 Jun 14 10:09 3 -> socket:[17044]l-wx------ 1 root root 64 Jun 14 10:09 4 -> /var/log/nginx_error.logl-wx------ 1 root root 64 Jun 14 10:09 5 -> /var/log/nginx/access.loglrwx------ 1 root root 64 Jun 14 10:09 6 -> socket:[17041]lrwx------ 1 root root 64 Jun 14 10:09 7 -> socket:[17045]