今天主要介绍一下如何对RMAN备份监控及优化，这里就不讲rman备份的一些原理了，仅供参考。

一、监控RMAN备份

1、确定备份源与备份设备的最大速度
从磁盘读的速度和磁带写的带度、备份的速度不可能超出这两个速度、只能尽量的接近、我们心里要有数
1）确定磁盘读速度：
可以在数据服务器负载高峰期做一下sar –d，把物理盘的blks/s这一列加起来，再乘上操作系统块的大小
或者挑出一些盘或LV，做对/dev/null的dd操作，然后用sar –d 进行观察，测算速度
2）确定备份设备的速度
可以通过并行备份多个数据量大点的文件系统获得

2、通过v$session_longops监测RMAN的性能
v$session_longops会将超过6秒的操作记录在这个视图中，可以通过这个视图观看RMAN的各个操作已经花费了多少时间，还需要多少时间，每一部分使用了多少时间

SELECT A.SID,
       A.PROGRAM,
       A.STATUS,
       B.OPNAME,
       B.ELAPSED_SECONDS,
       B.TIME_REMAINING
  FROM V$SESSION A, V$SESSION_LONGOPS B
 WHERE A.SID = B.SID
   AND A.SERIAL# = B.SERIAL#
   AND upper(A.PROGRAM) LIKE '%RMAN%'
   AND TIME_REMAINING > 0

3、通过v$backup_sync_io和v$backup_async_io监测IO是否有瓶颈
备份最主要的部分是IO操作，因此IO也是最可能产生瓶颈的地方。
Oracle提供了v$backup_sync_io和v$backup_async_io这两张视图用于观察实际的备份的速率、观察备份过程中的等待。这两张视图中的数据存在的周期是实例运行的过程中、当数据库被重新启动，这两张视图中的数据会被清空
3.1、同步IO瓶颈

V$BACKUP_SYNC_IO displays performance information about ongoing and recently completed RMAN backups and restores. For each backup, it contains one row for each input datafile, one row for the aggregate total performance of all datafiles, and one row for the output backup piece. This data is not stored persistently, and is not preserved when the instance is re-started.

查询v$backup_sync_io视图、关注TYPE为AGGREGATE值的discrete_bytes_per_second这一列
这一列表示每秒中以同步方式备份、恢复数据的字节数，这个值应该接近于备份设备的读、写速率
如果这个值很小于备份设备读写速率，就需要从CPU负载、备份的进程、网络、MML接口的配置等几方面进行检查、优化。

SELECT device_type device,
       TYPE,
       filename,
       to_char(open_time, 'yyyymmdd hh24:mi:ss') OPEN,
       to_char(close_time, 'yyyymmdd hh24:mi:ss') CLOSE,
       elapsed_time elapse,
       discrete_bytes_per_second d_bytes
  FROM v$backup_sync_io
 WHERE close_time > SYSDATE - 1
 ORDER BY close_time;

3.2、异步IO瓶颈
关注每秒备份、恢复的效率

V$BACKUP_ASYNC_IO displays performance information about ongoing and recently completed RMAN backups and restores. For each backup, it contains one row for each input datafile, one row for the aggregate total performance of all datafiles, and one row for the output backup piece. This data is not stored persistently, and is not preserved when the instance is re-started.

查询v$backup_async_io、关注TYPE为AGGREGATE值的
effective_bytes_per_second这一列
在生产环境，基本用的都是异步IO的方式，因此这个视图用的频率特别的多

SELECT device_type device,
       TYPE,
       filename,
       to_char(open_time, 'yyyymmdd hh24:mi:ss') OPEN,
       to_char(close_time, 'yyyymmdd hh24:mi:ss') CLOSE,
       elapsed_time elapse,
       effective_bytes_per_second e_bytes
  FROM v$backup_async_io
 WHERE close_time > SYSDATE - 1
 ORDER BY close_time

二、优化RMAN备份

1、分配合理的并行通道数
RMAN的备份、恢复的操作是通过通道(Channel)来完成的,Channel在数据库服务器的体现是一个Server进程,当RMAN分配一个Channel时，它即建立了一个到数据库实例的连接。多个Channel可以相互独立的完成备份、恢复的操作。

实际测试表明，如果备份设备是带库，并行通道数等于带库中带机的数会达到最佳的性能。很少的情况也是一个带机分配2或3个通道达到最佳性能的状况。需要注意的是，如果并行通道数多于带机数，会出现Backupset在多盘磁带混合存放的情况，因而会影响到恢复的速度
如果备份到磁盘，并行通道数等于磁盘子系统的数量时会达到最佳的性能，磁盘子系统数量指的是输出设备跨几块磁盘。例如磁盘子系统分布在3块物理硬盘上，则应分配3个通道。
假设并行通道设置2个，参考如下：

CONFIGURE DEVICE TYPE SBT_TAPE PARALLELISM 2; 
CONFIGURE CHANNEL 1 DEVICE TYPE 'SBT_TAPE' PARMS 'ENV=(TDPO_OPTFILE=/usr/tsm/client/oracle/bin64/tdpo.opt)';
CONFIGURE CHANNEL 2 DEVICE TYPE 'SBT_TAPE' PARMS 'ENV=(TDPO_OPTFILE=/usr/tsm/client/oracle/bin64/tdpo.opt)';

2、确定合理的“多路复用”数

多路复用的目的是为了加快备份时自磁盘读数据的性能，其针对的是单个channel，当单个通道在备份时，它从多个数据文件同时读取数据，然后写到同一个backupset中，这样的操作模式我们称之为多路复用。
多路复用级别的多少取决于三个因素：
● FILESPERSET参数
● MAXOPENFILES参数
● 通道读取的文件数
从实际的测试及Oracle的建议来看，多路复用设置的规则为：

如果要备份的所有磁盘或数据文件很好的做了条带(stripe)，多路复用处就不大了，可以将多路复用级别设为1或者2
如果磁盘没有做条带，多路复用应当设一个8之下的一个值,大于8的值常用在备份有很多空块的文件或在做增量备份的场景

3、内存方面调整

3.1、调整linux内核参数shmmax和shmall

kernel.shmmax 是核心参数中最重要的参数之一，用于定义单个共享内存段的最大值，shmmax 设置应该足够大，能在一个共享内存段下容纳下整个的SGA ,设置的过低可能会导致需要创建多个共享内存段，这样可能导致系统性能的下降。

kernel.shmmni 内核参数是共享内存段的最大数量，shmmni 缺省值 4096 ，一般肯定是够用了

kernel.shmall 参数是控制共享内存页数。Linux 共享内存页大小为4KB, 共享内存段的大小都是共享内存页大小的整数倍。假设一个共享内存段的最大大小是16G，那么需要共享内存页数是 16GB/4KB=16777216KB/4KB=4194304 （页），也就是64Bit 系统下16GB 物理内存，设置 kernel.shmall = 4194304 才符合要求(几乎是原来设置2097152的两倍)。这时可以将shmmax 参数调整到 16G 了，同时可以修改SGA_MAX_SIZE 和SGA_TARGET 为 12G。

设置之后我们可以通过ipcs -m观察Oracle的共享内存，看碎片有没减少。

3.2、增大磁盘/磁带缓冲区(Buffers)

缓冲区的大小决定了单次IO所能传送数据的多少，磁盘缓冲区的大小取决于多路复用(Mutiplexing)的级别，对照关系可以参数下表：

当你使用带库作为备份设备，并且分配了SBT通道，Oracle会为每一个通道分配一个Buffer

当BACKUP_TYPE_IO_SLAVES初始化数值为TRUE时，磁带缓冲区这段内存空间会从SGA区分配
当BACKUP_TYPE_IO_SLAVES初始化数值为FALSE时，磁带缓冲区会从PGA中分配
ORACLE建议这部份空间从LARGE POOL中分配，避免RMAN的IO缓冲区与Library cache的争用问题

RMAN通道的BLKSIZE参数确定了磁带缓冲区的大小。
实际的测试及Oracle的建议都表明磁带缓冲区至少应为256K。

3.3、设定合理的LARGE_POOL_SIZE值

如果LARGE_POOL_SIZE参数没有设定，磁盘及磁带缓冲区会试图从shared pool中分配
这样会引起shared pool中各组件如Library cache的争用问题
LARGE POOL要分配一个合理值，如果其大小不够用，磁盘及磁带缓冲区会从PGA分配，同时alert 警告信息：

?Ksfqxcre: failure to allocate chared memory means sync I/O will be used whenever async I/O to file not supported natively

4、IO方面调整成异步IO

默认的情况下，当RMAN备份到磁带时使用的是同步IO
同步IO在一个时点只能执行一次操作，此时的备份性能一定是很糟的
而异步IO一个时点可以做多次操作，更好的填充写缓冲区，保证磁带的streaming
对于支持本地异步IO的系统，启用比较简单,BACKUP_TAPE_IO_SLAVES这个初始化参数设为TRUE就可以了

ps:简单比较一下在同异/步备份时数据流传送的过程：

常用命令如下：

--查看是否开启异步IO
SELECT NAME,ASYNCH_IO FROM V$DATAFILE F,V$IOSTAT_FILE I WHERE F.FILE#=I.FILE_NO AND FILETYPE_NAME='Data File';
--开启异步IO
alter system set filesystemio_options=setall  sid ='*' scope=spfile;
startup force;

5、修改成hugepage

Transparent HugePages内存与标准HugePages内存的差异在于内核khugepaged线程在运行时动态分配内存。标准HugePages内存是在启动时预先分配在运行时不会发生改变。
如检查Transparent HugePage是否被启用

cat /sys/kernel/mm/transparent_hugepage/enabled
[always] madvise never ---这说明Transparent Hugepage被启用

觉得有用的朋友多帮忙转发哦！后面会分享更多devops和DBA方面的内容，感兴趣的朋友可以关注下~

RMAN备份监控及优化总结

一、监控RMAN备份

二、优化RMAN备份

相关推荐

Linux环境中查看Oracle错误和警告日志信息

絮语----工作四年的碎碎念

SQL 中的 (+)用法

oracle常见问题处理

MYSQL经典面试题汇总

医院信息系统突发应急演练记录

Windows 11:已知问题和已解决问题列表(更新时间:2022年1月)

最全面的IBMS系统集成系统技术规格书，赶紧收藏起来!

苹果停止更新Windows版QuickTime!

Navicat Data Modeler使用教程十二:配置