平民全闪存跑车:Oracle数据库存储“山寨”大法
moboyou 2025-03-30 15:20 37 浏览
本文内容非商业用途可无需授权转载,请务必注明作者、微博ID:唐僧_huangliang,以便更好地与读者互动。
在《不靠写缓存:更多百万IOPS的双节点存储软件》一文中,我给大家介绍了微软SOFS(Storage Spaces)共享SSD/磁盘的高可用文件存储方案。本文继续讨论几款IOPS达到百万水平、轻量级的块存储软件方案。
1、依赖Oracle ASM存储管理器(镜像保护)
上图中的英文字样“Exadata”我想大家都不陌生。从某种意义上说,Oracle Exadata是将Cell存储节点中的SSD/HDD通过IB网络暴露给前端数据库服务器,由ASM来统一管理。
这时可以选择Normal单冗余(双副本)和High双重冗余(三副本)两种保护策略,而正是由于ASM的强大,催生了不少“山寨”Exadata的产品。
国内的先不提了,上图是一家国外公司FlashGrid专门针对Oracle RAC和ASM集群推出的“Open Storage Software”,从上图来看好像是用戴尔服务器加上NVMe SSD组成的超融合方案。
根据这个架构,3节点集群中的所有SSD均通过iSCSI/iSER target暴露给每台主机,然后应该是用ASM组成3路镜像。关于Read-Local技术就是优先读本地,比如在Node 1上读取SSD 1的数据就不会绕道另两个节点了。
记得一位朋友曾经对我说过ASM Mirror的一个问题:RAC集群的仲裁盘放哪里,能否在一些故障时满足投票规则?上面的方案每个主机自身都有单点,即使非超融合的双机双柜也要考虑这个问题。对此有一种解决办法是把仲裁盘放在外部NFS上。
在不久前的闪存峰会上,达沃时代CTO雷迎春博士曾经表示:“超融合的HA要考虑计算节点和存储两个部分,因此比普通的ServerSAN要复杂”。
上面是FlashGrid的2节点Normal冗余方案,我们看到除了数据Failure Group里的SSD互相配对之外,Quorum(仲裁盘)Failure Group在NFS上占用了100MB文件存储空间。
在3节点的High冗余配置中,FlashGrid将Quorum Failure Group的数量增加到2个。
从测试数字来看,当每个节点4个Intel SSD DC P3700时,2 / 3节点的8KB读IOPS分别超过160万和240万IOPS。可见本地读对性能发挥还是很有帮助的。
据我了解,类似FlashGrid的方案还有不少,比如国内的沃趣(前年我写的《IDF14:全闪存VSAN、缓存Hadoop和高可用》一文中有提及)、云和恩墨zData、宝存的Oracle数据库一体机等。与OracleExadata相比他们解决了基本存储管理,都不再需要传统共享阵列,但是不具备SmartScan这样的高级软件特性。
相对于传统存储,使用这类一体机的硬件性价比更好,同时对方案提供商的服务能力要求更高,或者用户DBA较强敢于自己搞定ASM。外加仲裁/表决盘的实现机制,感觉多少还有些不够完美,那么受否有各方面比较均衡或者说折中一些的产品呢?
2、SanDisk ION/Dell DAAD系统(同步复制高可用)
如图,上半部分的4个RAC数据库节点、私有网络和公共网络配置都属于常规,下面的存储连接使用FC SAN光纤通道存储网络,数据放在Dell AccelerationAppliances for Databases(DAAD)上。
DAAD分为Standalone和HA两种版本,前者使用基于主机的镜像,而后者则是自身具备HA特性。本文讨论的主要是表格中右边那种。
DAAD(HA)在硬件上就是2台戴尔服务器加上PCIe闪存,并通过双路40-56Gb/s的以太网或者InfiniBand互连,其核心软件是SanDisk ION Accelerator。关于ION的身世,四年前我曾经撰文一篇《Fusion-io软件定义存储:全闪存阵列DIY时代?》(有兴趣的读者可以访问
http://storage.chinabyte.com/18/12398018.shtml),后来Fusion-io被SanDisk收购,SanDisk又被WD-HGST收购。
之所以我们将ION称为轻量级存储软件,因为它的实现原理比较简单。根据这个架构图,每个ioDrive PCIe闪存卡被切成两半,通过高速网络在两个DAAD节点之间同步复制(互备)。整个HA对中的8块闪存卡最终由每节点各自导出4个存储卷。
与Oracle ASM从数据库端实现数据的多份写入不同,ION/DAAD的闪存保护和高可用都是自身完成,不改变用户对传统存储的使用习惯。它的另一个优势是支持多种存储网络,Target类型比较丰富,除了16Gb FC之外,还有40Gb iSCSI和56Gb InfiniBand(SRP)。
从当年的DAAD 1.0到现在DAAD 2.0的性能提升比较大,我理解一方面是因为闪存卡升级,此外软件优化可能也有。值得注意的是6.4TB的性能不如3.2TB,看来容量也不总是越大越好。
190万IOPS的数字比前面FlashGrid的2节点要高,不过值得注意的是这里是4KB随机读而前面为8KB,此外DAAD采用数据库/存储节点分离式部署而不是超融合。
我们知道闪存的写性能总是比读差不少,记得我们在《SPC-1 IOPS被刷到500万,说不是因为内存你信吗?》一文开头曾经交待过,MemblazeFlashRAID使用8个PBlaze NVMe SSD做本地RAID 5随机写测得IOPS在35-40万。ION/DAAD有节点间同步数据的开销,混合读写IOPS表现为66万,超过一般的中端存储阵列不成问题。
3、管理界面决定易用性、DRBD的进展
上图是DAAD的管理界面,比较简单的风格,可以看到ioDrive闪存卡位于哪些PCIe插槽及其状态,还有性能监控等。
记得当年同行专家曾告诉我ION是基于DRBD开源项目研发的。我想除了性能调优之外,另外一个增值点就是GUI管理体验。如上图,左边的菜单包括卷、存储池、Initiator、Target、Fusion ioMemory闪存卡、主机和集群;右边是展开的Initiator界面,其中可以添加/编辑HBA卡的WWN,管理主机组等。
由上述功能,我们可以把基于ION软件的DAAD称为一个轻量级的全闪存阵列,Oracle的仲裁盘也可以放在上面。而像快照、远程复制等传统阵列的高级软件功能它是不具备的,数据库用户可以考虑采用Oracle Data Guard这样的数据库级别的复制保护技术。
既然提到了DRBD(Distributed Replicated Block Device),我们也简单出示一下其原理,从上图来看并不算复杂。
目前最新的版本是DRBD9,有朋友说支持分布式了,按照这个示意图我觉得更像一对多复制(一主多从)吧?
如果您对DRBD等比较熟悉,也许可以尝试下搭建自己的同步复制+HA块存储设备,每人的效果可会有些差异。SanDiskION/戴尔DAAD则是专门针对数据库定制的目标高性能、包含支持服务的全闪存系统商业产品。
注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。进一步交流技术,可以加我的QQ/微信:490834312。如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)
尊重知识,转载时请保留全文。感谢您的阅读和支持!《企业存储技术》微信公众号:huangliang_storage
原文地址:http://mp.weixin.qq.com/s?__biz=MzAwODExNjI3NA==&mid=2649774404&idx=1&sn=
39016f6d018b45a9880350fa567bf26c#rd
相关推荐
- 【开源推荐】给大家推荐个基于ChatGPT的PHP开发库 openai-php-api
-
有了这个库大家就可以愉快的使用PHP对接chatGPT的官方接口了,至于对接了官方接口想要做什么就看你自己的啦环境要求PHP7.4或以上composer1.6.5以上支持框架Laravel、Sym...
- PHP使用Phar打包控制台程序
-
1.介绍1.1介绍php脚本有着非常强大的库支持,可以轻松做出特别强大的程序。php不仅仅可以搭建各种各样的网站系统、平台系统,还可以开发基于控制台运行的程序。不过使用php开发的控制台程序在使用...
- PHP实现URL编码、Base64编码、MD5编码的方法
-
1.介绍1.1介绍今天开始福哥要给大家讲解关于字符编码的知识,所谓字符编码就是将一个字符串或者是一个二进制字节数组里面的每一个字符根据一定的规则替换成一个或者多个其他字符的过程。字符编码的意义有很...
- 雷卯针对易百纳海思Hi3521D开发板防雷防静电方案
-
一、应用场景1、医疗电子2、安防监控3、数字标牌4、视频广告5、环境监测二、功能概述1CPU:ARMCortexA7双核@Max.1.3GHz2H.265/H.264&JPEG多码流编...
- 不折腾无人生-安卓盒子安装Linux系统armbian纪实
-
不折腾无人生-安卓盒子安装Linux系统armbian纪实小编的x96max+(晶晨Amlogics905x3)安卓盒子已安装二个系统,原装安卓9.0和tf卡上的CoreELEC9.2.3,可玩性...
- 全网最简单的玩客云刷casaos方法及后续使用心得
-
本内容来源于@什么值得买APP,观点仅代表作者本人|作者:不鸣de前几天在站内看见很多值友分享了玩客云刷casaos,被简洁的操作界面种草,于是我将之前刷了powersee大神网页导航版armbia...
- 最新评测:英特尔旗舰 Alder Lake 处理器击败苹果M1 Max
-
据国外媒体tomshardware报道,英特尔最新的酷睿i9-12900HK处理器刚刚赢得了移动x86与Arm的性能大战,但这是有代价的。这款移动14核AlderLake芯片在多个工作负...
- 创维酷开Max系列电视开启ADB并安装第三方应用教程
-
前言创维酷开系列智能电视采用的是相对封闭的系统,虽然设置中提供了安装未知应用的选项,但由于电视安装位置的限制,往往难以直接使用USB接口安装应用。本文将详细介绍如何通过ADB方式在创维酷开Max系列电...
- 苹果 Mac Studio,再次刷新我们对个人电脑的认知
-
由两块M1Max组成的M1Ultra,成为了M1系列的最后一块拼图,并完成了整个M1SoC宇宙。这就好像《复仇者联盟4:终局之战》对于漫威第一阶段,十几年勤恳的布局,最终达到顶峰...
- 「必买」盘点2021年男人们的败家清单,越“败”越香
-
心里总想买点啥?看看《必买》,全网最有料的场景种草指南。草原割不尽,春风吹又生。在过去的2021年,不断被各种数码产品种草,一直在买买买,剁手不停。大部分产品都经过详细的对比做足了功课,也有部分是一时...
- Opus音频编解码在arm上的移植
-
一、简介现在有个需求,在局域网内实现实时语音,传输层协议使用UDP协议,如果直接使用ALSA进行录制音频流并发送到另一端进行播放,音质会非常差,而且断断续续,原因如下:采样频率:fm=44.1K...
- N ARM MINI空气减震系统臂体安装指南及应用说明
-
距离MOVMAX移动大师NARMMINI发布已经过去一段时间了,不少收到NARMMINI的小伙伴也已经迅速将产品投入到自己的车拍工作中去了。而在实际工作过程中我们也收到了用户的部分疑问和反馈:...
- 搜索引擎中的性能怪兽,Elasticsearch挑战者之Manticore Search
-
ManticoreSearch简介ManticoreSearch是一个使用C++开发的高性能搜索引擎,创建于2017年,其前身是SphinxSearch。ManticoreSe...
- 10个运维拿来就用的 Shell 脚本,用了才知道有多爽
-
1、监控MySQL主从同步状态是否异常脚本#!/bin/bashHOST=localhostUSER=rootPASSWD=123.comIO_SQL_STATUS=$(mysql-h$...
- PHP7.0.0正式版开放下载:速度大提升
-
IT之家讯PHP发布经理AnatolBelski在GitHub发布了PHP7.0.0正式版,该版本在速度提升上面有非常大的进步,比5.6版本提速两倍,已经接近Facebook开发的PHP执行引擎...
- 一周热门
- 最近发表
- 标签列表
-
- curseforge官网网址 (16)
- 外键约束 oracle (36)
- oracle的row number (32)
- 唯一索引 oracle (34)
- oracle in 表变量 (28)
- oracle导出dmp导出 (28)
- oracle两个表 (20)
- oracle 数据库 字符集 (20)
- oracle安装补丁 (19)
- matlab化简多项式 (20)
- 多线程的创建方式 (29)
- 多线程 python (30)
- java多线程并发处理 (32)
- 宏程序代码一览表 (35)
- c++需要学多久 (25)
- c语言编程小知识大全 (17)
- css class选择器用法 (25)
- css样式引入 (30)
- html5和css3新特性 (19)
- css教程文字移动 (33)
- php简单源码 (36)
- php个人中心源码 (25)
- 网站管理平台php源码 (19)
- php小说爬取源码 (23)
- github好玩的php项目 (18)