数据库集群
利用至少两台或者多台数据库服务器、构成一个虚拟单一数据库逻辑映像
数据库集群,顾名思义,就是利用至少两台或者多台数据库服务器,构成一个虚拟单一数据库逻辑映像,像单数据库系统那样,向客户端提供透明的数据服务
定义
一.数据库集群的定义
这里有两个关键点:
1. 两台或者多台数据库服务器:如果只有一台数据库服务器是不能称其为集群的。
2. 透明的服务:集群向客户端提供的服务与单机系统向客户端提供的服务,从通讯协议上保持二进制兼容。
二.相关名词解释
1.同步
数据库客户端发出数据更新请求后,要等集群的每个节点全部更新后,才给客户端返回结果。
2.异步
数据库客户端发出数据更新请求后,接受请求的节点(这里往往是主数据库)立马给客户端返回结果,被更新的数据则会在接下来的某个时间里被复制传输到集群的其它节点上(弱一致性处理)。
3.基于连接的负载均衡
此种负载均衡实现技术比较简单,就是在客户端发起登陆的时候,按照某种负载均衡算法,选择登陆到集群某台数据库,此后所有客户端的请求全部会发送到此数据库上。
4.基于请求的负载均衡
此种负载均衡实现技术比较复杂,但是功能强大,就是在客户端发起登陆的时候,集群网关会同时登录到集群各节点数据库,此后所有的客户端请求,经过集群网关的分析被分成两类,查询请求根据负载均衡算法挑选一个节点执行,数据更新请求则由主机执行并实时同步数据到集群各节点。
性质
一.与分布式数据库系统的区别
二.数据库集群的技术指标
由于数据库系统是任何一个信息系统的核心,因此除了业务逻辑之外,用户还关心下面三点:
性能问题涉及硬件、软件、网络、应用设计架构、代码质量等多方面。但是数据库集群如果能提供负载均衡能力和自动优化能力,则是对整个系统性能具有莫大的好处。
2. 数据可靠性
系统发生任意故障(包括操作系统、数据库引擎、硬盘或磁盘阵列存储网络等故障)条件下数据丢失的可能性。有的系统从设计原理上注定了必然会存在理论上的数据丢失可能性,而有的系统因为冗余设计原理,可以保证理论上的数据零丢失。用容灾领域的术语来讲,这类似于RPO(Recovery Point Objective),但是不完全等同于RPO。
在系统发生任意故障(包括操作系统、数据库引擎、硬盘或磁盘阵列或存储网络等故障)条件下整个系统停止对外提供数据服务的可能性。与上面的数据库可靠性紧密关联,如果一个系统从理论上存在数据丢失的可能性,那么这样的系统必然会导致整个系统的服务停止。同样地,用容灾领域的术语来讲,这类似于RTO(Recovery Time Objective),但是也同样不能完全等同于RTO。
三.数据库集群的分类
在市场上,数据库集群是一个笼统的名词,没有一个权威的定义,各市场参与者往往是各取所需,推出各种特色的数据库集群解决方案。一般地具有下列四种集群方案:
1.基于串行数据复制技术
串行复制技术,本来是用于数据传送数据备份的,离人们熟悉的“数据库集群”的概念有一定的距离。但是由于计算机软硬件技术和网络通讯技术的快速发展,使得利用这种概念和技术构成的“数据库集群”有了一定的可行性。此类集群,又可以分两类:
a.串行异步复制
此种方式是数据的异步串行复制。主要采用数据库事务日志传送或者硬盘数据块传送技术来实现,SQL Server自带的复制、镜像和SQL2012新出的AlwaysON(备机可读)以及第三的一些镜像Mirror技术都是属于此类产品,此类技术和产品本质上就是数据备份技术和产品。下列以事务日志传送(Log Shipping)为例来说明。主数据库完成事务处理后,生成事务处理日志,日志记录通过FIFO队列,进入备份数据库处理,从而得到备份数据。此种方式的缺陷在于:
a、主数据库并行处理事务而日志拷贝是串行的,而备份数据库处理日志记录也是串行的。因此,FIFO队列的溢出随时可能发生。一旦发生,队列必须重建,从而需要重新建立备份数据库。此种方法对于一般客户来讲是不可行的。
b、由于日志拷贝是异步的,主备数据库不是实时一致,两者之间存在“时间差”,因此如果用备份数据库作负荷均衡,这样的应用存在逻辑上的漏洞,可能会发生数据错乱。
c、由于主备数据存在时间差, 主数据库一旦发生事故,理论上一定会丢失数据。在这种情况下,要么需要手工恢复数据库,这会消耗大量的人工成本,或者数据根本就不能恢复。
d、对主机的性能影响,根据测试一般在15%到25%之间。
b.串行同步复制
此类集群往往是由昂贵的专用软硬件构成的,原理图如图1:
此类系统采用专用的高速网络和软件技术,将每个数据库的请求,通过同步复制的方式,同步在主备两台数据库服务器上执行正确后,才将结果返回给数据库客户。此系统的特点是:
a) 主数据库被强迫与备份数据库同步串行处理,因此性能受到限制。
b) 主备数据库中任意一个出现问题,都会迫使事务处理交易回滚,因此整个系统的可靠性比单机系统降低了一半。
c) 由于以上问题,这种备份方式只适用于近距离光纤网络(5英里)。
d) 专用系统造价昂贵,又加上述明显缺陷,因此市场上很少被采用。
2.基于共享存储的双机容错技术
从技术适应性的角度讲,双机容错比较适合于无状态应用,或者状态信息较少的应用切换,以此达到应用级的高可用性目的,其实并不适合于数据库级的应用切换。
此种结构往往是两个服务器共享一个磁盘阵列,这里两个服务器共享一个虚拟的IP供数据库客户使用,形成一个单一的逻辑数据库映象。此种所谓的数据库集群的目的是,一旦主机系统出现问题,备份系统通过心跳机制的检测,完成从主机系统到备份系统的切换。这种方案在市场上被称为“双机集群”或者“双机热备”,简称参见“双机”,但微软称之为“故障转移集群”。它有下列特点:
a. 此种高可用性解决方案只是无状态系统(典型的如Web服务器)的普通容错切换思想在数据库领域的应用。
b. 此系统本身只有一个单一的数据映象,数据储存在共享的磁盘阵例上,因此共享的磁盘阵列成为了整个系统的单点错误源。
c. 由于是单一数据映象,因此必须采用通常的复制或备份方法获取第二份数据,以保证数据的安全性。因此所有复制或备份方法的缺点,此类系统全部存在。
d. 主机系统和备份系统之间是没有任何负载均衡关系的,在正常情况下,备份系统是闲置在那里,因此对用户来说是一种投资浪费。
e. 在错误切换的时候,往往存在切换时间长,而且更严重的是可能会存在丢失用户交易数据丢失的现象,结果导致系统被迫停止服务,或者需要人工修复数据,或者数据永远找不回来。
3.以Oracle RAC为代表的系统
RAC的英文全称是:Real Application Cluster(真正的应用级集群)。我们需要关注的是“应用级”。为了缓解数据库系统日益增长的性能压力,Oracle公司推出了RAC系统。它基本结构如下:
此类系统,专门是针对数据库性能问题而提出的。采用共享磁盘阵列的方式,因此在结构上和上述双机容错相似,不同的地方在于此系统中的数据库节点之间采用的不是简单的心跳检测,而是Oracle公司自己定义的一套复杂的信息交换协议,以此来动态分配来自数据库客户端的请求。它的特点是:
a. 是个应用级的集群,也就是针对Oracle的数据库管理系统(因为数据库管理系统对于操作系统来讲,就是一个“应用程序”,因此被称为“应用级集群”),专门为提高数据库性能而设计。
b. 此系统本身只有一个单一的数据映象,数据储存在共享的磁盘阵列上,因此共享的磁盘阵列成为了整个系统的单点错误源。
c. 管理配置复杂。
d. 由于是单一数据映象,因此必须采用通常的复制或备份方法获取第二份数据,以保证数据的安全性。因此所有复制或备份方法的缺点,此类系统全部存在。
e. 由于数据库系统本身具有高I/O的特性,因此,RAC系统里,磁盘I/O是提高性能的关键地方。
f. 依据不同的数据库应用,有的性能有所提升,有的性能可能会反而下降。
应用
一.基于实时数据同步技术
基于此技术构造的数据库集群是市场上的新兴力量,它又具有两类,分别是:
a.具有独立网关
下面以DBTwin为例来说明其技术特点。
DBTwin采用了冗余设计原理,对于来自客户端的请求,请求被分成两类:查询请求和数据更新请求。对于数据更新请求,集群内部各节点之间保持数据的实时同步一致;对于数据的查询请求,则可以在集群各节点之间负载均衡执行。它的特点是:
a、负载均衡的单元是客户端的每个独立请求,这点除了Oracle RAC集群,是市场上独有的。
b、 实时冗余一致的多份数据,从理论上讲实现了数据的零丢失。
c、 由于可以做到数据零丢失,因此在系统发生任意故障条件下,可以做到系统的对外服务不停止。
d、 此系统使用了专用高速数据同步技术,根据测试,数据同步速度能SQL Server的镜像相等。
e、此系统的缺点是数据同步需要花费代价,节点数量受到限制,一般2到4个节点为宜。
f、 此系统从宏观上提升了整个系统的性能。
b.将调度节点集成于数据库引擎
下面以Moebius来说明其技术特点。
任何在数据库和应用程序之间引入的中间件都同时引入了单点故障点,如果中间件(网关)出现了故障,则数据库集群就会形同虚设。因此Moebius在集群中的每个节点上都存在于嵌入于数据库引擎的分发代理,当前负责调度的分发代理出现故障时,分发代理会故障转移到集群中的其他节点,从而避免了使用网关架构所引入的单点故障点,除此之外,该类产品的特点是:
a、负载均衡是基于每个客户端的独立请求,默认规则是将查询优先分发到集群中负载低的服务器,也可以自定义规则,将某些特定业务分发到集群中的某一台,比如将报表相关的查询分发给集群中的特定服务器。
b、 采用Share-Nothing架构,对数据进行冗余,从而保证了数据的安全性
c、 数据库同步机制采用日志Redo的方式,在日志同步之前对日志进行压缩,保证了同步效率
d、 在集群中任意节点出现故障时,会被自动剥离出节点,由剩余运行正常的节点继续提供服务,从而保证了最小停机时间
e、 负载均衡集群从宏观上提高了吞吐量和性能
f、 该类集群不需要特殊的存储设备,可以使用廉价的本地存储,但由于数据冗余,因此相较于Share-Disk架构而言,需要更多的存储空间
c.没有独立网关
当前市场上也存在下列一种基于数据实时同步的集群,其拓扑结构如图2所示:
此系统由于没有独立的集群网关,因此本质上简化成了数据库的实时备份系统,与实际的备份系统不同的是,它是工作在数据库应用层。此系统的特点:
a、 没有独立的集群网关,通过主节点的转发来实行查询的负载均衡。在系统压力大的情况下,集群主机会形成性能瓶颈,无论是CPU、内存还是网络带宽,也可能是OS系统内核资源,都容易因到达临界状态而形成瓶颈。
b、 各节点数据实时一致,对于数据容错有利。
c、 对客户端没有二进制透明。
d、 负载均衡单元是数据库连接。也就是说,在客户端登陆数据库的时候,静态地指定连接到某个集群节点,此后此连接上的全部请求一律发送到该数据库上,因此在特殊情况下,可能会出现这样的场景:所有客户端的连接集中在集群主机上,这时候,集群主机不但承担了客户端的所有查询,还需要实时同步数据到所有的集群从机,即集群主机的CPU为100%,而集群别的节点CPU可能为0%,这样整个系统的性能会受到严重影响。
e、 由于使用的是分布式事务机制(MSDTC)确保数据的实时一致性,因此数据同步的性能比较慢,根据测试,会比SQL Server镜像慢好几倍。
f、 同样地,此集群的节点数量也受到限制,也是以2到4个节点为宜。
参考资料
最新修订时间:2024-07-31 09:36
目录
概述
定义
参考资料