数据库日常运维操作手册
(2010-03-30 13:29:39)
标签:
oracledba日常管理 |
数据库日常运维操作手册
作者:董凯
二零零七年七月
目
一.日维护过程... 3
1.1、确认所有的INSTANCE状态正常... 3
1.2、检查文件系统的使用(剩余空间)... 3
1.3、检查日志文件和trace文件记录... 3
1.4、检查数据库当日备份的有效性。... 4
1.5、检查数据文件的状态... 4
1.6、检查表空间的使用情况... 4
1.7、检查剩余表空间... 4
1.8、监控数据库性能... 4
1.9、检查数据库系统性能... 4
1.10、日常出现问题的处理。... 5
三.每周维护过程... 5
3.1、监控数据库对象的空间扩展情况... 5
3.2、监控数据量的增长情况... 5
3.3、系统健康检查... 5
3.4、 检查无效的数据库对象... 6
3.5、检查不起作用的约束... 6
3.6、检查无效的trigger. 6
四.月维护过程... 6
4.1、Analyze Tables/Indexes/Cluster. 6
4.2、检查表空间碎片... 6
4.3、寻找数据库性能调整的机会... 6
4.4、数据库性能调整... 6
4.5、提出下一步空间管理计划... 6
缺少对索引的管理以及优化
数据库日常运维操作手册主要针对ORACLE数据库管理员对数据库系统做定期监控:
(1). 每天对ORACLE数据库的运行状态、日志文件、备份情况、数据库的空间使用情况、系统资源的使用情况进行检查,发现并解决问题。
(2). 每周对数据库对象的空间扩展情况、数据的增长情况进行监控、对数据库做健康检查、对数据库对象的状态做检查。
(3). 每月对表和索引等进行Analyze、检查表空间碎片、寻找数据库性能调整的机会、进行数据库性能调整、提出下一步空间管理计划。对ORACLE数据库状态进行一次全面检查
一.日维护过程
1.1、确认所有的INSTANCE状态正常
登陆到所有数据库或例程,检测ORACLE后台进程:
$ps –ef|grep ora
1.2、检查文件系统的使用(剩余空间)
如果文件系统的剩余空间小于20%,需删除不用的文件以释放空间。
#df –k
1.3、检查日志文件和trace文件记录
检查相关的日志文件和trace文件中是否存在错误。
A、连接到每个需管理的系统
使用’telnet’命令
B、对每个数据库,进入到数据库的bdump目录,unix系统中BDUMP目录通常是$ORACLE_BASE/<SID>/bdump
#$ORACLE_BASE/<SID>/bdump
C、使用 Unix ‘tail’命令来查看alert_<SID>.log文件
#tail $ORACLE_BASE/<SID>/bdump/alert_<SID>.log
D、如果发现任何新的ORA- 错误,记录并解决
1.4、检查数据库当日备份的有效性。
对RMAN备份方式:
检查第三方备份工具的备份日志以确定备份是否成功
对EXPORT备份方式:
检查exp日志文件以确定备份是否成功
对其他备份方式:
检查相应的日志文件
1.5、检查数据文件的状态
检查所有数据文件并记录状态不是“online”的数据文件,并做恢复。
Sqlplus> Select file_name from dba_data_files where status=’OFFLINE’
1.6、检查表空间的使用情况
SELECT tablespace_name, max_m, count_blocks free_blk_cnt,
sum_free_m,to_char(100*sum_free_m/sum_m, '99.99') || '%' AS
pct_free
1.7、检查剩余表空间
SELECT tablespace_name, sum ( blocks ) as free_blk ,
trunc ( sum ( bytes ) /(1024*1024) ) as free_m,
max ( bytes ) / (1024) as big_chunk_k,
count (*) as num_chunks FROM dba_free_space GROUP BY tablespace_name;
1.8、监控数据库性能(重点)
运行bstat/estat生成系统报告或者使用statspack收集统计数据
1.9、检查数据库系统性能(重点)
主要检查并记录数据库系统的cpu使用率、pagespaces、IO、buffer命中率等等,可以使用topas、vmstat、iostat、glance、top等命令
1.10、日常出现问题的处理。
三.每周维护过程
3.1、监控数据库对象的空间扩展情况
根据本周每天的检查情况找到空间扩展很快的数据库对象,并采取相应的措施
-- 删除历史数据
--- 扩表空间
alter tablespace <name> add
datafile ‘<file>’ size
<size>
--- 调整数据对象的存储参数
next extent
pct_increase
3.2、监控数据量的增长情况
根据本周每天的检查情况找到记录数量增长很快的数据库对象,并采取相应的措施
-- 删除历史数据
--- 扩表空间
alter tablespace <name> add datafile ‘<file>’ size <size>
3.3、系统健康检查
检查以下内容:
init<sid>.ora
controlfile
redo log file
archiving
sort area size
tablespace(system,temporary,tablespace fragment)
datafiles(autoextend,location)
object(number of extent,next extent,index)
rollback segment
logging &tracing(alert.log,max_dump_file_size,sqlnet)
3.4、 检查无效的数据库对象
SELECT owner, object_name, object_type FROM dba_objects WHERE
status=’INVALID’。
3.5、检查不起作用的约束
SELECT owner, constraint_name, table_name, constraint_type, status
FROM dba_constraints WHERE status = 'DISABLED’ AND constraint_type
= 'P'
3.6、检查无效的trigger
SELECT owner, trigger_name, table_name, status FROM dba_triggers
WHERE status = 'DISABLED’
四.月维护过程
4.1、Analyze Tables/Indexes/Cluster
analyze table <name> estimate
statistics sample 50 percent;
4.2、对索引进行维护和管理
使用analyze 和DBMS_STATS,DBMS_UTILITY对库进行分析工作。对于频繁更新的表,需进行索引重建 alter
index XXXXX rebulid online
(建议在非繁忙时刻进行重建工作)。对一些运行非常慢的查寻语句进行分析,根据execution
4.3、检查表空间碎片
根据本月每周的检查分析数据库碎片情况,找到相应的解决方法
4.4、寻找数据库性能调整的机会 (重点)
比较每天对数据库性能的监控报告,确定是否有必要对数据库性能进 行调整
4.5、数据库性能调整 (重点)
如有必要,进行性能调整
4.6、提出下一步空间管理计划
根据每周的监控,提出空间管理的改进方法