百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

RMAN备份监控及优化总结

moboyou 2025-03-03 11:10 24 浏览

今天主要介绍一下如何对RMAN备份监控及优化,这里就不讲rman备份的一些原理了,仅供参考。


一、监控RMAN备份

1、确定备份源与备份设备的最大速度
从磁盘读的速度和磁带写的带度、备份的速度不可能超出这两个速度、只能尽量的接近、我们心里要有数
1)确定磁盘读速度:
可以在数据服务器负载高峰期做一下sar –d,把物理盘的blks/s这一列加起来,再乘上操作系统块的大小
或者挑出一些盘或LV,做对/dev/null的dd操作,然后用sar –d 进行观察,测算速度
2)确定备份设备的速度
可以通过并行备份多个数据量大点的文件系统获得

2、通过v$session_longops监测RMAN的性能
v$session_longops会将超过6秒的操作记录在这个视图中,可以通过这个视图观看RMAN的各个操作已经花费了多少时间,还需要多少时间,每一部分使用了多少时间

SELECT A.SID,
       A.PROGRAM,
       A.STATUS,
       B.OPNAME,
       B.ELAPSED_SECONDS,
       B.TIME_REMAINING
  FROM V$SESSION A, V$SESSION_LONGOPS B
 WHERE A.SID = B.SID
   AND A.SERIAL# = B.SERIAL#
   AND upper(A.PROGRAM) LIKE '%RMAN%'
   AND TIME_REMAINING > 0

3、通过v$backup_sync_io和v$backup_async_io监测IO是否有瓶颈
备份最主要的部分是IO操作,因此IO也是最可能产生瓶颈的地方。
Oracle提供了v$backup_sync_io和v$backup_async_io这两张视图用于观察实际的备份的速率、观察备份过程中的等待。这两张视图中的数据存在的周期是实例运行的过程中、当数据库被重新启动,这两张视图中的数据会被清空
3.1、同步IO瓶颈

V$BACKUP_SYNC_IO displays performance information about ongoing and recently completed RMAN backups and restores. For each backup, it contains one row for each input datafile, one row for the aggregate total performance of all datafiles, and one row for the output backup piece. This data is not stored persistently, and is not preserved when the instance is re-started.

查询v$backup_sync_io视图、关注TYPE为AGGREGATE值的discrete_bytes_per_second这一列
这一列表示每秒中以同步方式备份、恢复数据的字节数,这个值应该接近于备份设备的读、写速率
如果这个值很小于备份设备读写速率,就需要从CPU负载、备份的进程、网络、MML接口的配置等几方面进行检查、优化。

SELECT device_type device,
       TYPE,
       filename,
       to_char(open_time, 'yyyymmdd hh24:mi:ss') OPEN,
       to_char(close_time, 'yyyymmdd hh24:mi:ss') CLOSE,
       elapsed_time elapse,
       discrete_bytes_per_second d_bytes
  FROM v$backup_sync_io
 WHERE close_time > SYSDATE - 1
 ORDER BY close_time;


3.2、异步IO瓶颈
关注每秒备份、恢复的效率

V$BACKUP_ASYNC_IO displays performance information about ongoing and recently completed RMAN backups and restores. For each backup, it contains one row for each input datafile, one row for the aggregate total performance of all datafiles, and one row for the output backup piece. This data is not stored persistently, and is not preserved when the instance is re-started.

查询v$backup_async_io、关注TYPE为AGGREGATE值的
effective_bytes_per_second这一列

在生产环境,基本用的都是异步IO的方式,因此这个视图用的频率特别的多

SELECT device_type device,
       TYPE,
       filename,
       to_char(open_time, 'yyyymmdd hh24:mi:ss') OPEN,
       to_char(close_time, 'yyyymmdd hh24:mi:ss') CLOSE,
       elapsed_time elapse,
       effective_bytes_per_second e_bytes
  FROM v$backup_async_io
 WHERE close_time > SYSDATE - 1
 ORDER BY close_time



二、优化RMAN备份

1、分配合理的并行通道数
RMAN的备份、恢复的操作是通过通道(Channel)来完成的,Channel在数据库服务器的体现是一个Server进程,当RMAN分配一个Channel时,它即建立了一个到数据库实例的连接。多个Channel可以相互独立的完成备份、恢复的操作。

实际测试表明,如果备份设备是带库,并行通道数等于带库中带机的数会达到最佳的性能。很少的情况也是一个带机分配2或3个通道达到最佳性能的状况。需要注意的是,如果并行通道数多于带机数,会出现Backupset在多盘磁带混合存放的情况,因而会影响到恢复的速度
如果备份到磁盘,并行通道数等于磁盘子系统的数量时会达到最佳的性能,磁盘子系统数量指的是输出设备跨几块磁盘。例如磁盘子系统分布在3块物理硬盘上,则应分配3个通道。
假设并行通道设置2个,参考如下:

CONFIGURE DEVICE TYPE SBT_TAPE PARALLELISM 2; 
CONFIGURE CHANNEL 1 DEVICE TYPE 'SBT_TAPE' PARMS 'ENV=(TDPO_OPTFILE=/usr/tsm/client/oracle/bin64/tdpo.opt)';
CONFIGURE CHANNEL 2 DEVICE TYPE 'SBT_TAPE' PARMS 'ENV=(TDPO_OPTFILE=/usr/tsm/client/oracle/bin64/tdpo.opt)';


2、确定合理的“多路复用”数

多路复用的目的是为了加快备份时自磁盘读数据的性能,其针对的是单个channel,当单个通道在备份时,它从多个数据文件同时读取数据,然后写到同一个backupset中,这样的操作模式我们称之为多路复用。
多路复用级别的多少取决于三个因素:
● FILESPERSET参数
● MAXOPENFILES参数
● 通道读取的文件数
从实际的测试及Oracle的建议来看,多路复用设置的规则为:

  • 如果要备份的所有磁盘或数据文件很好的做了条带(stripe),多路复用处就不大了,可以将多路复用级别设为1或者2
  • 如果磁盘没有做条带,多路复用应当设一个8之下的一个值,大于8的值常用在备份有很多空块的文件或在做增量备份的场景


3、内存方面调整

3.1、调整linux内核参数shmmax和shmall

kernel.shmmax 是核心参数中最重要的参数之一,用于定义单个共享内存段的最大值,shmmax 设置应该足够大,能在一个共享内存段下容纳下整个的SGA ,设置的过低可能会导致需要创建多个共享内存段,这样可能导致系统性能的下降 。

kernel.shmmni 内核参数是共享内存段的最大数量,shmmni 缺省值 4096 ,一般肯定是够用了

kernel.shmall 参数是控制共享内存页数 。Linux 共享内存页大小为4KB, 共享内存段的大小都是共享内存页大小的整数倍。假设一个共享内存段的最大大小是16G,那么需要共享内存页数是 16GB/4KB=16777216KB/4KB=4194304 (页),也就是64Bit 系统下16GB 物理内存,设置 kernel.shmall = 4194304 才符合要求(几乎是原来设置2097152的两倍)。这时可以将shmmax 参数调整到 16G 了,同时可以修改SGA_MAX_SIZE 和SGA_TARGET 为 12G。

设置之后我们可以通过ipcs -m观察Oracle的共享内存,看碎片有没减少。


3.2、增大磁盘/磁带缓冲区(Buffers)

缓冲区的大小决定了单次IO所能传送数据的多少,磁盘缓冲区的大小取决于多路复用(Mutiplexing)的级别,对照关系可以参数下表:

当你使用带库作为备份设备,并且分配了SBT通道,Oracle会为每一个通道分配一个Buffer

当BACKUP_TYPE_IO_SLAVES初始化数值为TRUE时,磁带缓冲区这段内存空间会从SGA区分配
当BACKUP_TYPE_IO_SLAVES初始化数值为FALSE时,磁带缓冲区会从PGA中分配
ORACLE建议这部份空间从LARGE POOL中分配,避免RMAN的IO缓冲区与Library cache的争用问题

RMAN通道的BLKSIZE参数确定了磁带缓冲区的大小。
实际的测试及Oracle的建议都表明磁带缓冲区至少应为256K。


3.3、设定合理的LARGE_POOL_SIZE值

如果LARGE_POOL_SIZE参数没有设定,磁盘及磁带缓冲区会试图从shared pool中分配
这样会引起shared pool中各组件如Library cache的争用问题
LARGE POOL要分配一个合理值,如果其大小不够用,磁盘及磁带缓冲区会从PGA分配,同时alert 警告信息:

?Ksfqxcre: failure to allocate chared memory means sync I/O will be used whenever async I/O to file not supported natively


4、IO方面调整成异步IO

默认的情况下,当RMAN备份到磁带时使用的是同步IO
同步IO在一个时点只能执行一次操作,此时的备份性能一定是很糟的
而异步IO一个时点可以做多次操作,更好的填充写缓冲区,保证磁带的streaming
对于支持本地异步IO的系统,启用比较简单,BACKUP_TAPE_IO_SLAVES这个初始化参数设为TRUE就可以了

ps:简单比较一下在同异/步备份时数据流传送的过程:

常用命令如下:

--查看是否开启异步IO
SELECT NAME,ASYNCH_IO FROM V$DATAFILE F,V$IOSTAT_FILE I WHERE F.FILE#=I.FILE_NO AND FILETYPE_NAME='Data File';
--开启异步IO
alter system set filesystemio_options=setall  sid ='*' scope=spfile;
startup force;

5、修改成hugepage

Transparent HugePages内存与标准HugePages内存的差异在于内核khugepaged线程在运行时动态分配内存。标准HugePages内存是在启动时预先分配在运行时不会发生改变。
如检查Transparent HugePage是否被启用

cat /sys/kernel/mm/transparent_hugepage/enabled
[always] madvise never ---这说明Transparent Hugepage被启用

觉得有用的朋友多帮忙转发哦!后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注下~


相关推荐

黄道十二宫杀手密码51年后被破解,来自两位程序员和数学家合作

杨净边策发自凹非寺量子位报道|公众号QbitAI黄道十二宫杀手(ZodiacKiller)可能是世界上最知名的高智商连环杀手,52年来从未被抓获。他的事迹已被改编成了多部好莱坞电影。△...

深入剖析MediaCodec解码器的基本原理及使用「建议新手收藏」

一,MediaCodec工作原理MediaCodec类Android提供的用于访问低层多媒体编/解码器接口,它是Android低层多媒体架构的一部分,通常与MediaExtractor、MediaMu...

Retrofit WebService 实践

前言作为Android开发,平时和后端聊得最多的除了喝酒就是接口。常用语:Restful和WebService,前者现在聊得多,后者以前聊得多。默认含义分别为:Restful:HTTP协议...

建议收藏!175部4K UHD版本经典高分电影洗版参考目录(2015之前)

本内容来源于@什么值得买APP,观点仅代表作者本人|作者:1L789近两年很多经典高分老电影陆续开始重制成4KUHD版本,虽然我早已将这些电影的BD蓝光版收入,但纠结一番后还是花了不少时间将其全部...

2 个月的面试亲身经历告诉大家,如何进入 BAT 等大厂?

这篇文章主要是从项目来讲的,所以,从以下几个方面展开。怎么介绍项目?怎么介绍项目难点与亮点?你负责的模块?怎么让面试官满意?怎么介绍项目?我在刚刚开始面试的时候,也遇到了这个问题,也是我第一个思考的问...

详解Android官推Kotlin-First的图片加载库

前言Coil是一个非常年轻的图片加载库,在2020年10月22日才发布了1.0.0版本,但却受到了Android官方的推广,在AndroidDevelopersBackst...

webview 渲染机制:硬件加速方式渲染的Android Web

webview渲染是什么?webview渲染是用于展现web页面的控件;webview可以内嵌在移动端,实现前端的混合式开发,大多数混合式开发框架都是基于webview模式进行二次开发的w...

因为我对Handler的了解,居然直接给我加了5K

1Handler是什么?android提供的线程切换工具类。主要的作用是通过handler实现从子线程切换回主线程进行ui刷新操作。1.1为什么Handler能实现线程切换?在创建Handler的...

「经典总结」一个View,从无到有会走的三个流程,你知道吗?

前言一个View,从无到有会走三个流程,也就是老生常谈的measure,layout,draw三流程我们都知道Android视图是由一层一层构成的层级结构,直白点说,就是父View包含子View而子V...

这些垃圾代码是谁写的?哦,原来小丑竟是我自己

程序员是最喜欢自嘲、自黑的群体之一,比如他们常常称自己是“码农”、“程序猿”,再比如他们的工作明明是写代码、修Bug,也有人调侃说:“明明我们是修代码、写Bug!”本文整理了一些程序员“修代码、写...

手把手教你爬取天堂网1920*1080大图片(批量下载)——理论篇

/1前言/平时我们要下载图片,要要一个一个点击下载是不是觉得很麻烦?那有没有更加简便的方法呢?答案是肯定的,这里我们以天堂网为例,批量下载天堂网的图片。/2项目准备工作/首先我们第一步我们要安装...

音视频开发需要你懂得 ffmpeg 开源库的编码原理

引言音视频开发需要你懂得音视频中一些基本概念,针对编解码而言,我们必须提前懂得编解码器的一些特性,码流的结构,码流中一些重要信息如sps,pps,vps,startcode以及基本的工作原理,...

「8年老 Android 开发」最全最新 Android 面试题系列全家桶(带答案)

下面跟大家分享的这些面试题都是互联网大厂真实流出的面试内容,每个问题都附带完整详细的答案,不像网上的那些资料三教九流有的甚至还没答案,这些面试题我也是经过日积月累才整理出来的精品资料。这些面试题主要是...

手把手教你爬取天堂网1920*1080大图片(批量下载)——实战篇

/1前言/上篇文章手把手教你爬取天堂网1920*1080大图片(批量下载)——理论篇我们谈及了天堂网站图片抓取的理论,这篇文章将针对上篇文章的未尽事宜进行完善,完成图片的批量抓取。/2图片网址解...

PHP 8.1.9 更新发布

CLI:修复了内置服务器通过PHP_CLI_server_WORKERS环境变量的潜在溢出。修正了GH-8952(不再可能有意关闭std句柄)。Core:修复了GH-8923的错误(Windows上的...