百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

RMAN备份监控及优化总结

moboyou 2025-03-03 11:10 65 浏览

今天主要介绍一下如何对RMAN备份监控及优化,这里就不讲rman备份的一些原理了,仅供参考。


一、监控RMAN备份

1、确定备份源与备份设备的最大速度
从磁盘读的速度和磁带写的带度、备份的速度不可能超出这两个速度、只能尽量的接近、我们心里要有数
1)确定磁盘读速度:
可以在数据服务器负载高峰期做一下sar –d,把物理盘的blks/s这一列加起来,再乘上操作系统块的大小
或者挑出一些盘或LV,做对/dev/null的dd操作,然后用sar –d 进行观察,测算速度
2)确定备份设备的速度
可以通过并行备份多个数据量大点的文件系统获得

2、通过v$session_longops监测RMAN的性能
v$session_longops会将超过6秒的操作记录在这个视图中,可以通过这个视图观看RMAN的各个操作已经花费了多少时间,还需要多少时间,每一部分使用了多少时间

SELECT A.SID,
       A.PROGRAM,
       A.STATUS,
       B.OPNAME,
       B.ELAPSED_SECONDS,
       B.TIME_REMAINING
  FROM V$SESSION A, V$SESSION_LONGOPS B
 WHERE A.SID = B.SID
   AND A.SERIAL# = B.SERIAL#
   AND upper(A.PROGRAM) LIKE '%RMAN%'
   AND TIME_REMAINING > 0

3、通过v$backup_sync_io和v$backup_async_io监测IO是否有瓶颈
备份最主要的部分是IO操作,因此IO也是最可能产生瓶颈的地方。
Oracle提供了v$backup_sync_io和v$backup_async_io这两张视图用于观察实际的备份的速率、观察备份过程中的等待。这两张视图中的数据存在的周期是实例运行的过程中、当数据库被重新启动,这两张视图中的数据会被清空
3.1、同步IO瓶颈

V$BACKUP_SYNC_IO displays performance information about ongoing and recently completed RMAN backups and restores. For each backup, it contains one row for each input datafile, one row for the aggregate total performance of all datafiles, and one row for the output backup piece. This data is not stored persistently, and is not preserved when the instance is re-started.

查询v$backup_sync_io视图、关注TYPE为AGGREGATE值的discrete_bytes_per_second这一列
这一列表示每秒中以同步方式备份、恢复数据的字节数,这个值应该接近于备份设备的读、写速率
如果这个值很小于备份设备读写速率,就需要从CPU负载、备份的进程、网络、MML接口的配置等几方面进行检查、优化。

SELECT device_type device,
       TYPE,
       filename,
       to_char(open_time, 'yyyymmdd hh24:mi:ss') OPEN,
       to_char(close_time, 'yyyymmdd hh24:mi:ss') CLOSE,
       elapsed_time elapse,
       discrete_bytes_per_second d_bytes
  FROM v$backup_sync_io
 WHERE close_time > SYSDATE - 1
 ORDER BY close_time;


3.2、异步IO瓶颈
关注每秒备份、恢复的效率

V$BACKUP_ASYNC_IO displays performance information about ongoing and recently completed RMAN backups and restores. For each backup, it contains one row for each input datafile, one row for the aggregate total performance of all datafiles, and one row for the output backup piece. This data is not stored persistently, and is not preserved when the instance is re-started.

查询v$backup_async_io、关注TYPE为AGGREGATE值的
effective_bytes_per_second这一列

在生产环境,基本用的都是异步IO的方式,因此这个视图用的频率特别的多

SELECT device_type device,
       TYPE,
       filename,
       to_char(open_time, 'yyyymmdd hh24:mi:ss') OPEN,
       to_char(close_time, 'yyyymmdd hh24:mi:ss') CLOSE,
       elapsed_time elapse,
       effective_bytes_per_second e_bytes
  FROM v$backup_async_io
 WHERE close_time > SYSDATE - 1
 ORDER BY close_time



二、优化RMAN备份

1、分配合理的并行通道数
RMAN的备份、恢复的操作是通过通道(Channel)来完成的,Channel在数据库服务器的体现是一个Server进程,当RMAN分配一个Channel时,它即建立了一个到数据库实例的连接。多个Channel可以相互独立的完成备份、恢复的操作。

实际测试表明,如果备份设备是带库,并行通道数等于带库中带机的数会达到最佳的性能。很少的情况也是一个带机分配2或3个通道达到最佳性能的状况。需要注意的是,如果并行通道数多于带机数,会出现Backupset在多盘磁带混合存放的情况,因而会影响到恢复的速度
如果备份到磁盘,并行通道数等于磁盘子系统的数量时会达到最佳的性能,磁盘子系统数量指的是输出设备跨几块磁盘。例如磁盘子系统分布在3块物理硬盘上,则应分配3个通道。
假设并行通道设置2个,参考如下:

CONFIGURE DEVICE TYPE SBT_TAPE PARALLELISM 2; 
CONFIGURE CHANNEL 1 DEVICE TYPE 'SBT_TAPE' PARMS 'ENV=(TDPO_OPTFILE=/usr/tsm/client/oracle/bin64/tdpo.opt)';
CONFIGURE CHANNEL 2 DEVICE TYPE 'SBT_TAPE' PARMS 'ENV=(TDPO_OPTFILE=/usr/tsm/client/oracle/bin64/tdpo.opt)';


2、确定合理的“多路复用”数

多路复用的目的是为了加快备份时自磁盘读数据的性能,其针对的是单个channel,当单个通道在备份时,它从多个数据文件同时读取数据,然后写到同一个backupset中,这样的操作模式我们称之为多路复用。
多路复用级别的多少取决于三个因素:
● FILESPERSET参数
● MAXOPENFILES参数
● 通道读取的文件数
从实际的测试及Oracle的建议来看,多路复用设置的规则为:

  • 如果要备份的所有磁盘或数据文件很好的做了条带(stripe),多路复用处就不大了,可以将多路复用级别设为1或者2
  • 如果磁盘没有做条带,多路复用应当设一个8之下的一个值,大于8的值常用在备份有很多空块的文件或在做增量备份的场景


3、内存方面调整

3.1、调整linux内核参数shmmax和shmall

kernel.shmmax 是核心参数中最重要的参数之一,用于定义单个共享内存段的最大值,shmmax 设置应该足够大,能在一个共享内存段下容纳下整个的SGA ,设置的过低可能会导致需要创建多个共享内存段,这样可能导致系统性能的下降 。

kernel.shmmni 内核参数是共享内存段的最大数量,shmmni 缺省值 4096 ,一般肯定是够用了

kernel.shmall 参数是控制共享内存页数 。Linux 共享内存页大小为4KB, 共享内存段的大小都是共享内存页大小的整数倍。假设一个共享内存段的最大大小是16G,那么需要共享内存页数是 16GB/4KB=16777216KB/4KB=4194304 (页),也就是64Bit 系统下16GB 物理内存,设置 kernel.shmall = 4194304 才符合要求(几乎是原来设置2097152的两倍)。这时可以将shmmax 参数调整到 16G 了,同时可以修改SGA_MAX_SIZE 和SGA_TARGET 为 12G。

设置之后我们可以通过ipcs -m观察Oracle的共享内存,看碎片有没减少。


3.2、增大磁盘/磁带缓冲区(Buffers)

缓冲区的大小决定了单次IO所能传送数据的多少,磁盘缓冲区的大小取决于多路复用(Mutiplexing)的级别,对照关系可以参数下表:

当你使用带库作为备份设备,并且分配了SBT通道,Oracle会为每一个通道分配一个Buffer

当BACKUP_TYPE_IO_SLAVES初始化数值为TRUE时,磁带缓冲区这段内存空间会从SGA区分配
当BACKUP_TYPE_IO_SLAVES初始化数值为FALSE时,磁带缓冲区会从PGA中分配
ORACLE建议这部份空间从LARGE POOL中分配,避免RMAN的IO缓冲区与Library cache的争用问题

RMAN通道的BLKSIZE参数确定了磁带缓冲区的大小。
实际的测试及Oracle的建议都表明磁带缓冲区至少应为256K。


3.3、设定合理的LARGE_POOL_SIZE值

如果LARGE_POOL_SIZE参数没有设定,磁盘及磁带缓冲区会试图从shared pool中分配
这样会引起shared pool中各组件如Library cache的争用问题
LARGE POOL要分配一个合理值,如果其大小不够用,磁盘及磁带缓冲区会从PGA分配,同时alert 警告信息:

?Ksfqxcre: failure to allocate chared memory means sync I/O will be used whenever async I/O to file not supported natively


4、IO方面调整成异步IO

默认的情况下,当RMAN备份到磁带时使用的是同步IO
同步IO在一个时点只能执行一次操作,此时的备份性能一定是很糟的
而异步IO一个时点可以做多次操作,更好的填充写缓冲区,保证磁带的streaming
对于支持本地异步IO的系统,启用比较简单,BACKUP_TAPE_IO_SLAVES这个初始化参数设为TRUE就可以了

ps:简单比较一下在同异/步备份时数据流传送的过程:

常用命令如下:

--查看是否开启异步IO
SELECT NAME,ASYNCH_IO FROM V$DATAFILE F,V$IOSTAT_FILE I WHERE F.FILE#=I.FILE_NO AND FILETYPE_NAME='Data File';
--开启异步IO
alter system set filesystemio_options=setall  sid ='*' scope=spfile;
startup force;

5、修改成hugepage

Transparent HugePages内存与标准HugePages内存的差异在于内核khugepaged线程在运行时动态分配内存。标准HugePages内存是在启动时预先分配在运行时不会发生改变。
如检查Transparent HugePage是否被启用

cat /sys/kernel/mm/transparent_hugepage/enabled
[always] madvise never ---这说明Transparent Hugepage被启用

觉得有用的朋友多帮忙转发哦!后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注下~


相关推荐

高效有趣学Excel:从入门到精通的全面教程分享

在当今这个数据驱动的时代,掌握Excel不仅是提升工作效率的利器,更是职场竞争中的一项重要技能。今天,我非常高兴地与大家分享一套全面的Excel学习教程——《高效有趣学Excel:轻松入门到精通》,这...

Excel新函数重磅来袭!告别复杂公式,效率提升200%!

“透视表终于不用点来点去了?”昨晚刷到这条留言,顺手把新表扔进365,一行=GROUPBY(部门,产品,销售额,SUM)回车,三秒出汇总,刷新按钮直接失业。那一刻,办公室空调声都显得多余。有人还在录宏...

Excel 效率神器:LET 函数入门教程,让复杂公式变简单

您是否曾经编写过又长又复杂的Excel公式,然后没过几天自己都看不懂了?或者,同一个计算在公式里重复写了无数次,不仅容易出错,修改起来更是噩梦?Excel推出的LET函数就是来解决这些痛点...

Excel多对多查询函数新手教程:从案例到实操

一、为啥要学多对多查询?举个例子你就懂!假设你是公司HR,手里有张员工技能表(如下),现在需要快速找出:"张三"会哪些技能?"Excel"技能有哪些人掌握?员工姓名...

14、VBA代码+excel内置函数,实现高效数据处理(零基础入门)

1、学习VBA的主要目的是数据处理,VBA在数据处理上展现出强大的计算实力。它不仅完美继承EXCEl内置函数的功能,还能通过编程语法实现更灵活的应用。无论是基础的加减乘除,还是复杂的统计分析、逻辑判断...

word和excel零基础学习免费视频教程,赶紧收藏,作者将转付费课

亲爱的朋友们:大家好!本人是全国计算机等级考试二级MSoffice高级应用课程的在校授课老师。本人近段时间打算将wore/excel免费分享给所有有需要的朋友。知识本身无深浅,本人知识也有限,如果讲...

excel函数从入门到精通,5组13个函数,易学易懂易用

对于职场中经常使用Excel的小伙伴们,最希望掌握一些函数公式,毕竟给数据处理带来很多方便,可以提高我们的工作效率。今天分享几组函数公式,适合于初学者,也是职场中经常用到的,下次碰到可以直接套用了。0...

Excel效率神器:LET函数入门教程,让复杂公式变简单

写公式写到想砸电脑?教你用LET把Excel公式从“迷宫”变成“小剧本”,几步看懂又好改很多人都经历过这样的窘境:花了半小时写出一条看似厉害的Excel公式,几天后再看自己都懵了,或者同样...

完全免费的Excel教程大全,适合日常excel办公和技能提升

说明微软官方的excel文档,由于网站在国外,有时打开慢,而且应用层面介绍不够详细;这里介绍一个集齐了excel各种使用方法和说明的网站;网站名称:懒人Excel网站介绍可以看到有基础教程、快捷键、函...

Excel 新函数 LAMBDA 入门级教程_excel365新增函数

LAMBDA函数的出现是Excel历史上的一次革命性飞跃。它允许用户自定义函数,而无需学习VBA等编程语言。这意味着你可以将复杂的、重复的计算逻辑封装成一个简单的、可复用的自定义函数,极大地...

Excel新函数LAMBDA入门级教程_excel新建函数

把复杂公式“变成函数”后,我在Excel上的重复工作少了一半——你也能做到我一直有一个习惯:遇到每天要重复写的复杂公式,就想把它封装起来,像调用内置函数那样去用。说实话,过去没有LAMBDA,这个想法...

Excel DROP 函数全方位教程:从基础入门到高级动态应用

上一篇我们学习了ExcelTAKE函数,今天我们来学习一下和TAKE函数相对应的DROP函数,它是Microsoft365和Excel2021中引入的一个动态数组函数。它的核心功能是从一...

学习Excel公式函数还有官方提供的教程,还是免费的!赶紧试试

首先声明,这不是广告,纯干货分享!除了学习Excel的基本操作之外,很多人都是冲着公式和函数才去找教程买教材的,这个结论应该不会有什么毛病。因为,Excel的公式函数真的很强大!现在的Excel教程可...

什么是保险员常说的“IRR”?让我们一次说明白!

买保险的时候,你是不是常听到销售抛出一些术语,比如“IRR很高哦,收益不错!”?听着挺专业,但“IRR”到底啥意思?想问又不好意思问,别急,它其实是个很简单的概念,咱们今天一次把它说明白。1,IRR...

理财型保险如何选择缴费期?_理财型保险计算方式

选择理财型保险(通常指年金险、增额终身寿险等)的缴费期,并非简单地看哪个年限短或长,而是需要结合自己的财务状况、理财目标和产品特性来综合决定。下面我将为大家详细解析不同缴费期的特点、适用人群和选择策略...