产品代理

ROSE HA:双机高可用集群软件

ROSE HA 是一款成熟的双机高可用集群软件,核心价值为共享存储 + 实时监控 + 秒级故障切换 + 数据一致性保障,通过主备 / 主主模式与 Fence 强制隔离、仲裁服务等机制,解决服务器软 / 硬件单点故障,保障 Oracle、SQL Server、Web 服务等关键业务 7×24 小时连续运行,适配金融、电信、政府、能源等对业务连续性要求极高的行业,是国内双机热备领域的主流方案之一。


核心功能详解

ROSE HA 的功能围绕故障预防、检测、切换、恢复全流程设计,兼顾高可用与数据安全,核心功能分为四大模块:

    1. 故障监控与检测(多层次精准判断)

  • 全维度资源监控:实时监测服务器硬件(CPU / 内存 / 磁盘 / 网卡)、操作系统、网络(IP / 端口)、应用程序、数据库(Oracle/MySQL/SQL Server 等)、存储链路状态,支持毫秒级健康检测,提前预警潜在故障。

  • 智能心跳机制:通过私有网络(TCP/IP)、串口、共享磁盘等多路径心跳通信,精准判断节点状态,避免网络波动导致的 “脑裂” 问题;支持心跳频率自定义,适配不同网络环境。

  • 应用级深度检测:内置数据库 / 应用 Agent,通过事务日志、服务进程、端口监听等方式,检测应用健康状态,如 Oracle 实例异常、SQL Server 服务中断等,实现故障精准定位,避免误切换。

  • 自定义监控规则:支持通过 API / 脚本开发自定义 Agent,适配自研应用,满足个性化监控需求。

2. 故障切换与隔离(保障业务无缝接管)

  • 灵活切换模式

    主备模式(Active/Standby):主机运行业务,备机监控;主机故障时,备机秒级接管 IP、存储、应用,终端用户无感知,恢复后可自动 / 手动切回。

    主主模式(Active/Active):两台主机同时运行不同业务,相互备份;一台故障时,另一台接管其业务,提升资源利用率。

  • Fence 强制隔离:支持内部 Fence 与外部 Fence(IPMI 协议),当主机操作系统假死时,强制关闭故障主机电源 / 禁用存储,防止数据损坏,保障备机安全接管资源。

  • 秒级故障切换(Failover):故障确认后,1 分钟内完成 IP 地址、文件系统、数据库服务、应用程序的无缝迁移,RTO(恢复时间目标)<15 分钟,最大限度减少业务停机时间。

  • 手动 / 自动切换策略:支持按优先级、负载均衡自定义切换策略,可手动触发切换(如系统维护),也可按事件自动切换(如硬件故障 / 应用崩溃)。

3. 数据一致性与容灾(防止数据丢失)

  • 共享存储模式:通过 SAN/NAS 实现双节点共用存储,数据零丢失,故障切换时直接挂载存储,无需数据同步,适配本地高可用场景。

  • 镜像复制模式(Rose MirrorHA):基于块级 / 文件级实时复制,支持异步 / 同步传输,适配异地容灾;故障后自动反向同步,确保主备数据一致,支持数据回滚(Data Rewind)恢复到故障前状态。

  • 仲裁服务:负责集群主备角色决策,支持共享磁盘、仲裁节点、云仲裁等多种方式,兼顾业务连续性与数据一致性,避免 “脑裂” 导致的数据冲突。

  • 应用级数据保护:针对数据库等关键应用,支持事务日志备份、快照恢复,确保故障切换时数据完整性,适配金融 / 电信等敏感行业合规要求。

4. 管理与运维(简化集群部署与监控)

  • 图形化管理控制台:提供跨平台 GUI/CLI,单界面管理所有集群节点,支持远程配置备份任务、监控状态、执行切换、查看日志,适配大规模集群集中管理。

  • 自动化部署与调度:向导式安装与配置,支持批量部署 Agent,自动发现资源,按时间 / 事件触发备份 / 切换任务,减少手动操作成本。

  • 告警与审计:实时发送邮件 / 短信 / 声光告警,生成详细故障 / 切换 / 审计日志,支持导出报表,满足 SOX/HIPAA/GDPR 等合规要求。

  • 高可用测试:支持模拟故障(如关闭网卡 / 停止应用),验证切换流程与数据一致性,提前发现潜在问题。