加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

AIX性能监控 (cpu/memory/io/network) - 转

(2013-03-07 11:43:24)
分类: 测试相关

sar -P ALL cpu使用情况

sar -a 文件访问情况
dirblk/s 定位文件时被目录访问守护进程读取的快(512b)的个数
iget/s i节点查找系统进程被调用次数
lookuppn/s 目录查找进程找到v节点,并获取路径名的次数
sar -b buffer的活动情况,包括传输、访问、和命中率
bread/s、bwrit/s 块IO操作的数量
lread/s、lwrit/s 逻辑 IO请求的个数
pread/s、pwrit/s 裸设备IO操作数量
%rcache、%rwrit cache命中率,计算共式为:((lreads-breads)/lreads)*100



sar -c 系统调用情况
exec/s、fork/s 调用和执行系统调用总数
sread/s、swrit/s read/writ 系统调用次数
rchar/s、wchar/s 被read/writ系统调用的字符数量
scall/s 系统调用总数

sar -k 内核进程活动情况
kexit/s 中断的内核进程数
kproc-ov/s 由于进程数的限制无法创建内核进程的次数
ksched/s 被作业分派的内核进程数

sar -m 消息队列和信号灯活动情况
msg/s IPC消息队列活动情况
sema/s 信号灯活动情况

sar -d 磁盘读写情况
sar -q 队列统计信息
run-sz 内核线程处于运行队列的平均数
%runocc 最近时间段运行队列占用百分比
swpq-sz 内核线程等待 页面调度的平均数
%swpocc 交换队列最近活动情况

sar -r 页面调度信息
cycle/s 每秒中页面置换次数
fault/s 每秒中page fault次数
slots 在页空间中空闲页数量
odio/s 每秒中不使用页面空间的磁盘io数

sar -v 进程、内核线程、i节点、和文件表 的状态
sar-w 上下文切换次数
sar -y tty设备活动情况
canch/s tty输入队列中规范的字符数
mdmin/s tty modem 中断
outch/s 输出队列字符数
rawch/s 输入队列字符数
revin/s tty接收中断
xmtin/s tty传输中断

如果CPU的使用率接近100%(usr+system),可以视为是CPU瓶颈。而如果相当大的时间都花费在IO等待上,那就意味着cpu执行受到了磁盘IO的限制,
而IO瓶颈可能来自于文件访问或者没有足够的内存来分配页面。
注意:系统花费在等待远程文件访问的时间不会记入io 等待时间,如果CPU和IO等待的时间都相当的低,但是响应时间又不是很满意,那应该确认系统
花费多少时间在等待远程io,一直一来aix下没有命令对远程io进行分析,只能通过跟踪数据来观察。

vmstat

vmstat命令报告内核线程,虚拟内存、磁盘、陷阱、和CPU活动情况。
Kthr 线程活动情况
r 运行队列
b 等待队列
memory 虚拟和实际内存使用情况
avm 活动的虚拟页面
fre 空闲的页面,当系统内存大于64MB时,最小值MINFREE为120frames,当内存小于64MB时,最小值为内存以MB计的两倍
MINFREE和MAXFREE值可以通过vmtune命令来查看
page page fault和page活动情况,当在内存里分配一个页面时(非NFS或者永久文件页面),其被视为工作页面,工作页面通常包括应用堆栈、
数据和其他的共享内存段。因此当一个程序栈或者数据区域需要增长时,内存会被被访问,vvm会从ram和页面空间所在设备分配空间。这就意味着
在内存耗尽之前,页面空间会被使用。
re 页面输入输出列表,每秒中内存回收数量,当页面处于空闲列表且没有被再利用,它就会被回收应为没有新的IO会初始化它,也包括那些没有完成的IO操作但又被VMM使用
预先读取算法调入内存的页面。
pi 从页面空间page in的页面
po 从页面空间page out的页面
fr 页面空闲(页面重置)
sr 页面被页面调度算法扫描次数
cy 页面调度算法进行调度的时钟周期

faults 陷阱和系统中断率
in 设备中断
sy 系统调用
cs 内核线程上下文切换
CPU cpu使用情况
usr 用户进程
sys 系统进程
id cpu空闲时间
wa 等待磁盘IO时间

准则:
r<5,b≈0,
如果fre
对于page列,re,pi,po,cy维持于比较稳定的状态,PI率不超过5,如果有pagin发生,那么关联页面必须先进行pageout
在内存相对紧张的环境下pagein会强制对不同的页面进行steal操作。如果系统正在读一个大批的永久页面,你也许可以看到po和pi列
会出现不一致的增长,这种情景并不一定表明系统负载过重,但是有必要对应用程序的数据访问模式进行见检查。在稳定的情况下,扫描率和重置率几乎相等,在
多个进程处理使用不同的页面的情况下,页面会更加不稳定和杂乱,这时扫描率可能会比重置率高出。
faults列,in,sy,cs会不断跳跃,这里没有明确的限制,唯一的就是这些值最少大于100
cpu列,us,sys,id和wa也是不确定的,最理想的状态是使cpu处于100%工作状态,单这只适合单用户的情况下。
如果在多用户环境中us+sys》80,进程就会在运行队列中花费等待时间,响应时间和吞吐量就会下降。wa>40表明磁盘io没有也许存在不合理的平衡,或者对磁盘操作比较频繁
转:http://blog.chinaunix.net/u/9606/showart_1132998.html
--
Aix sar命令解析(翻译红皮书)
sar 命令收集、报告、或保存系统活动信息。
sar 命令默认的报告(CPU 使用报告)可能是系统管理员进行系统活动调查必须使用的第一工具,因为它监控着主要的系统资源。
可使用标记选择特定系统活动的信息。不指定任何标记只选择系统单元的活动,指定 -A 标记选择所有的活动。Sar 命令在开始输出统计数据之前,会先输出当前活动的 CPU 和磁盘数目。
~~~~~~~~~~
# sar 2 10
AIX Db01 3 5 0001CCCDD600 12/07/07
System configuration: lcpu=8 mode=Capped
10:55:37 %usr %sys %wio %idle physc
10:55:39 86 4 0 11 4.00
10:55:41 78 4 1 17 4.00
%idle CPU空闲时间的百分比
%sys CPU使用时间投入到核心进程的百分比
%usr CPU使用时间投入到用户进程的百分比
physc 消耗物理处理器的数目,只在共享处理器或启用同时多线程的分区上报告
%entc 消耗分配容量的百分比。只在共享处理器的分区上报告
~~~~~~~~~~~~~~~~~~~~~~~~~
也可以查看IO情况
sar -d 10 2
12:11:16 device %busy avque r+w/s blks/s avwait avserv
12:11:26 hdisk0 34 1.0 50 201 0.0 0.0
hdisk1 41 0.0 64 259 0.0 0.0
其中
%busy 对应的 % tm_act
avque 表示等待IO对列数,其值很高则预示着磁盘有较大瓶颈
r+w/s 对应tps,blks/s是按 0.5Kbytes/s 计算的传输速度
sar -d 最大好处是可以对较长时间的值会有一个总体平均值

注意:如果没有请求其他特定内容的选项,sar 命令报告系统单元的活动。如果使用 -P 标记,并且分区使用共享处理器运行,并且如果分配了分区的使用容量,那么,命令则报告带 cpuid U 的 CPU 行,显示全系统(system-wide)未使用的容量。
如果分区使用 uncapped 模式的共享处理器运行,那么,%entc 将报告每个 CPU 行 granted entitled capacity 的百分比,和全系统 CPU 行中 allocated entitled capacity 百分比。
~~~~~~~~~~~~~
# sar -q 2 4
AIX Db01 3 5 0001CCCDD600 12/07/07
System configuration: lcpu=8 mode=Capped
11:00:03 runq-sz %runocc swpq-sz %swpocc
11:00:05 19.0 100 1.0 50
11:00:07 7.0 100
11:00:09 3.0 100
11:00:11 4.0 100
命令#sar -q 报告队列统计信息。输出:
runq-sz = 运行队列的平均长度。(运行队列的平均长度就是等待在队列中的进程数目)
%runocc = 运行队列被占用的时间百分比。
swap-sz = 等待被内存页交换的进程的平均数目。
%swapocc = 内存页交换队列被占用的时间百分比。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
sar可以针对SMP系统来分别查看CPU使用情况
#sar -P ALL 3 2
AIX testhost 1 5 0050C33A4C00 06/28/05
17:30:02 cpu %usr %sys %wio %idle
17:30:05 0 38 4 43 15
1 32 3 49 16
2 51 3 44 2
3 53 3 42 2
- 44 3 44 9
17:30:08 0 35 1 46 18
1 18 3 70 9
2 24 2 60 14
3 16 1 81 3
- 23 2 64 11
Average 0 36 2 45 16
1 25 3 59 13
2 38 3 52 8
3 34 2 62 2
- 33 3 54 10
~~~~~~~~~~~~~~~~~~~~~~
sar也可以查看系统调用情况
#sar -c 3 2
AIX test 1 5 0050C33A4C00 06/28/05
17:31:00 scall/s sread/s swrit/s fork/s exec/s rchar/s wchar/s
17:31:03 5738 484 439 0.00 0.00 952729 1073997
17:31:06 3365 149 266 0.00 0.00 11620 930150
Average 4553 317 352 0.00 0.00 482957 1002193
转:http://blog.chinaunix.net/u1/50863/showart_437765.html
---
查询aix主机性能的几个基本命令
http://blog.chinaunix.net/templates/default/images/right_line.gif(cpu/memory/io/network) 转" TITLE="AIX性能监控 (cpu/memory/io/network) 转" />
查询aix主机性能的几个基本命令


机器性能优化主要从四个方面去考虑:CPU,内存,磁盘I/O,网络
1、CPU
sar命令 可以使用sar命令来查看cpu的使用率。
%usr + %sys > 80% 的时候 CPU将是瓶颈

ps aux | head -4 查看前3位占用cpu的进程
%CPU表示进程使用cpu时间的百分比;%MEM表示进程使用实际内存的百分比

ps –elf 命令 将查看进程的优先级别
PRI值越小,优先级越大。
NI值越大,优先级越小。

可以使用命令nice ,renice来修改NI值。

2、MEMORY
vmstat命令 主要使用vmstat命令来查看虚拟内存和实际内存的使用率,看内存瓶颈主要是看ps的使用率,只要ps的使用率没有超过70%,内存的使用率为100%都是正常的。
Page表示页面调入调出的数量,pi po经常为非零值时,需要注意。
Wa 表示等待I/O的时间,不能太高
avm 活动虚拟页面,在进程运行中分配到工作段的页面空间数. 越小越好,单位为4K。
实际内存中 系统进程使用的(计算段) 工作段。该值与svmon –G中的virtual值相等。

fre 空闲列表的数量.一般不少于120,当fre少于120时,系统开始自动的kill进程去释放free list 越大越好,实际内存中空闲的frame数。
注意:avm不包括 文件系统缓存
The avm number will grow as more processes get started and/or existing processes allocate more working storage.

实际内存 页面数 =(avm+fre+文件系统缓存)×4k
文件系统缓存 =文件系统缓存+某些程序退出时未释放的文件页面
可以使用 vmstat -v查看文件系统缓存
当文件系统mount上的时候,对于内存区域有两个动作,第一为分配部分工作段,第二为分配部分文件系统缓存

lsps –a命令 查看pagespces的使用率
%used > 70% 内存将成瓶颈

svmon命令 可以查看物理内存的情况
svmon –G 查看内存全局使用状况
svmon -Pt 3 查看前三个占用内存的进程

HPUX下可以使用 lsof 查看
svmon -G ,topas,看出来都是20G内存,可ps gu或ps auxxx相加或使用svmon -U 相加却少了10G
使用svmon -P发现大量的aioserver占掉了内存,用ps -efk统计也是如此,原来是aioserver开得过多造成的。而aioserver属于kernel的,所以有些统计都不算在内。

3、磁盘I/O
iostat命令 主要使用iostat命令查看磁盘I/O的负载
iostat 1 2
A system is I/O bound, if: %iowait > 25%, %tm_act > 70%

lvmstat命令 该命令查看单个lv,vg上的I/O流量
使用lvmstat 命令前需要用 -e选项 激活该命令:
#lvmstat -v rootvg –e
#lvmstat -v rootvg
#lvmstat -l hd4

filemon 命令 To monitor the physical I/O activity of the virtual memory, logical volume, and physical volume levels of the file system, enter:
#filemon -o /tmp/filemon.out 开始监控磁盘I/O
#smitty trcstop 停止监控并创建报告
#more /tmp/filemon.out 查看报告
topas svmon 查看每个进程所占的IO
#topas –P
#svmon -P | more

4、network
topas命令 可以使用该命令查看所有的性能情况,包括CPU,内存,磁盘I/O,network
#topas
其他命令可参见相关网络管理文档

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有