RoseHA

RoseHA是利用共享磁盘阵列实现系统高可用性,保证应用系统7*24不间断运行的软件产品。 双机系统的两台服务器都与共享存储设备连接,用户的操作系统、应用软件和双机软件分别安装在两台主机的内部存储(硬盘)上,应用服务的数据则存放在共享存储设备上。两台主机之间通过私有心跳网络连接,随时监控对方的运行状态,它能侦测应用级系统软件、硬件发生的故障。当工作主机发生故障,无法正常提供服务时,备机会及时侦测到故障信息,并根据切换策略及时进行故障转移,由备机接管故障主机上的工作,并进行报警,提示管理人员对故障主机进行维护。RoseHA以最低成本提供用户几乎不停顿的计算机作业环境。

2016年,RoseHA 10.0 全新发布,新版本在稳定性方面,经过Rose全球数十万个成功客户的经验积累,非常成熟稳健运行。全面支持最新的Oracle、Sybase、 MSSQL、MYSQL数据库及weblogic、websphere和tomcat等应用,完好兼容Windows、Linux(Redhat/SUSE/Centos/红旗)、Solaris等主流操作系统最新版本。

功能特点

工作模式

•主从方式(Active/Standby):  主机工作,从机处于监控准备状态。当主机宕机时,从机接管从机的工作,待主机恢复正常后,按使用者的预定以自动或手动的方式将服务切换到主机上运行。

•双工方式(Active/Active):  两台主机同时运行各自的服务工作,且相互监测对方的情况。当一台主机宕机时,另外一台主机立即接管它的工作,保证工作不间断。 譬如:A机运行ORACLE数据库应用,B机运行IIS网站应用。

特 点

•自动切换:   当系统出现故障时(如:系统宕机、HA进程/应用进程被杀掉、RS-232、SCSI、光纤、网络线缆断开),RoseHA 将确定故障原因,并采取相应对策,并将这些应用切换到备份服务器上。而故障服务器中未受影响的应用不会被切换,既不会受任何影响。不需要系统管理员干预。

•支持多条心跳路径:  可以将网线和RS-232串口线作为在RoseHA软件的心跳路径。配置多条心跳路径可以避免系统的单点故障。两台服务器的信息交换可通过:RS232、TCP/IP。

•自动检测: 在集群系统的每一台服务器内,RoseHA具有两个核心进程,它们互相监控,如果其中一个进程失败,另一个进程会立即进行恢复。

•丰富的附加功能: 提供不同的针对特定应用的Agent程序,使服务监控更切实际,更加有效;提供用于开发Agent程序的应用程序界面(API),使用者可针对特定的服务编写Agent程序,执行与特定服务相关的状态诊断及错误恢复工作的。

•采取高可靠的错误检测和故障恢复机制减少系统宕机,停机时间并防范错误,提供故障警告。

•可设定故障排除后自动或手动回复(switch back)。

•安装时不需要修改操作系统的核心、更改应用软件,也无需特殊的硬件。

•提供基于GUI的监控中心,管理员能查看ROSE HA的状态、检查错误信息和警告、修改系统参数及从远程工作站管理ROSE HA系统。

•支持各种数据库,包括ORACLE、Sybase、Informix、SQLSERVER、DB2、MySQL等。

Private Net 私用网络

两台服务器通过私用网络心跳(HeartBeat)信号,使两台服务器能够相互了解对方的运行情况。为了避免不必要的失效切换,最好建立两条独立的物理路径作为通讯路径。

•TCP/IP Socket Private Net:两台服务器的网卡用反线(back to back)直接或通过LAN建立一条通讯路径。

•RS-232 Socket Private Net:配置服务器空闲的串口作为一条通讯路径。

如果所有的私用网均失效,服务器仍然可以用公用侦测对方服务器的可用性。如果对方服务器仍然可用,不触发接管动作;如果对方服务器不可用,立即接管动作。

Public Net 公用网络

客户端通过此网络与服务器通信,当两台服务器互为备份。对于不同的服务,可以用不同的公用网连接到两台服务器。ROSE HA支持TCP/IP协议,可以在EthernetFastEthernet、FDDI和ATM网上运行。

管理监控界面

•友好、直观、易于操作的GUI界面

•有关ROSE HA的配置都可以在GUI中完成,支持动态配置和实时同步

•网卡的状态,磁盘的状态都可在GUI中显示出来

工作原理

系统启动后,ROSE HA首先启动HA Manager管理程序,根据高可靠性系统的配置结构初始化,然后启动必要的服务和代理程序来监控和管理系统服务。HA代理程序用来监控、监测、诊断和管理硬件软件服务。

代理程序检测到该服务器处于活动状态,HA Manager就会认为该服务处于活动状态,HA Manager会定时通知后备服务器上的HA Manager,其每项服务处于正常。

当代理程序检测到某个服务发生故障时,它就通知HA Manager管理程序。HA软件首先会重新启动该服务多次(可由用户设定)。如果启动不能成功,该服务会由HA转移到后备服务器上。

HA周期性地检测系统硬件的状态,如果硬件发生故障,HA会把与该硬件相关的服务转移到后备服务器上。当某项服务发生转移时,HA首先在运行服务器上停止该服务,之后,由备份服务器上的HA在备份服务器上启动该服务。由于停止和启动该服务需要一定的时间,所以,当服务被切换(转移)时,该服务会有短暂的中断,转移完成后,服务自动恢复正常运行。

考虑到一些数据库系统(如ORACLE、SYBASE、INFORMIX等)以及其他一些应用软件(如Domino Server、WWW Server等),ROSE HA在HA管理模块(HA Manager)的基础上,提供了一系列的Agent软件模块。Agent为一个软件监视模块,监控数据库服务或其他应用服务的运行。当运行服务器发生故障时,由Agent向HA主控软件请求,进行相应的处理动作。

总之,ROSE HA软件极大程度上减少了人的介入,提高了系统的可靠性与安全性,使服务能可靠的运行。

优 点

•接近零系统资源的占用

•快速反映,错误检测时间小于15秒(可设定),故障切换及恢复时间一般在15-60秒

•GUI与Server分离,可随时中断GUI而不影响Server的运行

•支持JOB和BRING IN/BRING OUT、在一台SERVER上停止JOB不会导致FAILOVER

•在同一块网卡上建立多个活动的IP地址,支持多个JOB的运行

•主服务器网络连接故障时会自动FAILOVER,而备用援服务器失败时不会进行误切换

•采用C++面向对象的方法设计,程序的稳健性、可维护性、扩充性得到提高

RoseStorDS双机双柜

共享盘柜方式的双机容错方案中,数据存放在共享的磁盘阵列柜上,形成了单点故障。一旦其共享磁盘(磁盘阵列)出现问题,即使服务器没有问题,整个群集或双机都不可能继续提供应用业务。因此希望接上2个磁盘阵列,这两个磁盘阵列数据实时一致,当其中一个盘柜的磁盘出现问题,另外一个磁盘阵列的磁盘的数据继续可用,从而保证业务继续可用,不会中断。

Rose公司为了解决这个问题,推出了双机双柜软件--RosestorDS。其基于成熟稳定的roseha原理架构自行研发的,支持FC、iSCSI或混构存储。RosestorDS监测硬盘文件的变化,实时同步,保证两个磁盘阵列柜的数据是完全一致的。当其中一个盘柜损坏(包括链路断了、存储死机、存储反应),另外一个盘柜会自动替换,应用不会受到任何影响。当存储恢复后,RosestorDS会自动同步数据,无需管理员干预,保证两个盘柜的数据一致。

RosestorDS继承了RosesHA的管理简单方便的优点,将链路、状态、应用等状态集中在一个管理界面,直观易懂,一目了然。

RoseHA多节点

RoseHA(多节点)集群软件采用Rose自行研发的集群技术,将企业多台提供网络资源的计算机,有效的组合成一个保证多个核心应用服务连续运营的高可用集群系统。它通过监控应用程序、数据库、操作系统、存储资源、客户端访问资源等各类计算机软件和硬件资源的运行状态,实现核心信息系统高可用性。当某个节点不可用或执行操作系统升级、应用程序补丁等需要主服务器脱机操作的日常维护工作时,RoseHA(多节点)软件开始监控系统,通过私用网络传递的心跳信息,每台主机上的RoseHA自动将该台计算机的工作转移到集群中的其它可用节点继续运行,有效减少计划内和计划外宕机时间,提高了业务信息系统高可用性和稳定性。

RoseHA(Multi-node)采用资源组的管理模式。资源组作为整个集群的配置、运作、管理、故障自动转移的基本单元,包括端IP资源、卷资源、NT服务资源以及某些用户自定义资源,如脚本程序、JAVA开发程序等。

支持规格