Evidian Logo

Eviden > SafeKit:全合一 SANless 高可用性与应用程序集群软件 > SafeKit:实时字节级文件复制和镜像集群软件

SafeKit:实时字节级文件复制和镜像集群软件

无需共享存储的同步数据镜像和自动故障转移

用于 Windows/Linux 的 SafeKit 提供无缝的高可用性(High Availability),同时显著降低总拥有成本(TCO)。通过消除传统集群的硬件和运维开销,SafeKit 为复杂的集群解决方案提供了一种轻量级的双节点高可用替代方案。

  • 一体化业务连续性:一个完整的解决方案,在单个集成包中提供虚拟 IP自动故障转移自动故障恢复(回切)实时复制
  • 同步复制(零数据丢失):通过同步复制确保事务型应用绝对的数据完整性,保证在发生故障时数据零丢失。
  • 灵活的文件级保护:SafeKit 在文件级别进行基于主机的复制,这对应用程序是完全透明的。它不仅保护数据库,还保护所有相关的文件夹和数据。您可以直接在现有文件夹的安装位置进行复制,甚至可以在系统盘上。
  • 简化部署(无需 AD/LDAP):与传统集群不同,无需配置 AD/LDAP 目录,从而消除了复杂的安装要求和对基础设施的依赖。
  • 实现高可用零 SAN 投入:利用无共享(shared-nothing)架构实现完整冗余。它适用于标准的本地磁盘,无需昂贵的 SAN 硬件、光纤通道交换机和专业的存储维护。
  • 真正的双节点高效性:大多数解决方案都需要第三个“见证(witness)”节点来防止脑裂(split-brain),而 SafeKit 提供强大的双节点集群,可节省 33% 的硬件、电力和机架空间。
  • 与硬件无关的冗余:避免供应商锁定。您可以使用任何服务器品牌或内部存储类型来构建高可用集群,从而延长现有硬件 Lifecycle(生命周期)并降低更换成本。
  • 成本可预测的许可模式:SafeKit 通过一次性永久许可提供高可用性,确保预算的可预测性,并消除了年度价格上涨的风险。

通过将高可用性整合到一个轻量级的软件层中,SafeKit 为 Windows/Linux 提供了企业级的冗余和业务连续性,而成本仅为传统集群套件的一小部分。

SafeKit 高可用架构:提供虚拟 IP、自动故障转移、自动故障恢复和实时复制的 SafeKit 镜像集群架构,适用于 Windows/Linux
针对 Windows/Linux 的 SafeKit 高可用镜像集群

SafeKit 软件如何简单地实现无 SAN 的 Windows/Linux 高可用集群?

什么是针对 Windows/Linux 的 SafeKit 镜像高可用(HA)解决方案?

SafeKit 可在任意品牌的两台服务器之间为 Windows/Linux 提供高可用性。

本文将介绍如何在没有 SAN 共享存储且无需专业技能的情况下,快速实现 Windows/Linux 集群。

该解决方案的原理是定义 Windows/Linux 应用程序数据所在的文件夹、其服务、虚拟 IP 以及检查器(checkers)。

随后,SafeKit 将执行实时复制自动故障转移,以确保服务的持续可用性。

为什么选择统一的一体化高可用解决方案,而不是零散的工具?

与结合了独立复制和集群产品的“拼凑型”解决方案不同,SafeKit虚拟 IP、自动故障转移、自动故障恢复(回切)和实时文件复制整合到了单个引擎中。

这消除了因操作系统更新而破坏不同工具之间脆弱关联的“纸牌屋”风险,为整个高可用技术栈提供了单一的责任归属,并通过为 Windows/Linux 高可用提供统一的界面来减少人为错误。

我应该选择应用级的高可用,还是虚拟机(VM)级的高可用?

借助 SafeKit,您可以灵活选择符合自身需求的冗余模型。

虚拟机(VM)级冗余(适用于 Hyper-V 或 KVM)实现起来最简单,因为它复制的是整个虚拟机,不需要了解应用程序的内部结构。

相反,应用级冗余的粒度更细;它仅复制特定的数据文件夹,并重新启动应用程序服务,而不是整个操作系统。

虽然虚拟机级高可用(HA)更容易设置,但应用级高可用与虚拟机管理程序(Hypervisor)无关,可以跨物理、虚拟或云环境运行。

与竞争对手相比,SafeKit Windows/Linux 高可用性有哪些独特优势?

SafeKit 通过其无共享(shared-nothing)架构和简化部署,在传统 Windows/Linux 集群中脱颖而出。虽然大多数企业级解决方案需要复杂的复制部署或昂贵的 SAN 存储,但 SafeKit 能够提供:

  • 零数据丢失的同步复制:SafeKit 实现了 100% 同步复制,确保事务型应用完整的数据绝对安全。在发生故障时,可实现零数据丢失(RPO=0)。此外,SafeKit 不仅能够复制 Windows/Linux 数据库,还可以复制任何其他数据文件夹(日志、配置文件等),确保整个环境被完整镜像。
  • 简化的双节点集群:与通常需要“见证”(第 3 个节点、磁盘或文件共享)来维持仲裁(Quorum)的标准集群不同,SafeKit 仅需两台冗余服务器即可提供完整的高可用性,从而降低了基础设施成本和复杂度。
    了解更多关于我们的心跳和仲裁机制
  • 统一的管理:管理员可以通过单个 SafeKit 控制台来管理 Windows/Linux 故障转移、数据复制和监控。这使得没有专业“集群管理员”经验的团队也能轻松掌握高可用技术。
  • 自定义检查器:SafeKit 超越了基础的服务监控;它提供检查器(checkers)来监控 Windows/Linux 进程的健康状况。该系统具有高度的可扩展性,允许根据您的环境添加量身定制的自定义检查器。

与标准集群相比,SafeKit 如何降低 Windows/Linux 的总拥有成本(TCO)?

与传统的高可用性解决方案不同,SafeKit 旨在以绝对最低的基础设施开销运行,同时绝不牺牲可靠性。与传统故障转移集群相比,其核心节省部分包括:

  • 零存储成本:SafeKit 采用适用于本地磁盘的无共享(shared-nothing)架构。这消除了对昂贵的 SAN 硬件、iSCSI 网络或复杂 vSAN 配置的需求。
  • 无需企业版软件:虽然原生复制机制可能需要昂贵的企业版许可,但 SafeKit 不需要企业版。它可与标准版甚至免费版无缝协作,以极低的成本提供高端的可用性。
  • 真正的双节点高效性:与通常需要“见证”(第 3 个节点、磁盘或文件共享)来维持仲裁(Quorum)的标准集群不同,SafeKit 仅需两台冗余服务器即可提供完整的高可用性。
  • 无强制订阅:SafeKit 提供永久许可。您拥有该软件的所有权,从而避免了“订阅陷阱”以及现代纯云端或基于订阅的模型中常见的不可预测的年度价格上涨。
  • 低运维成本(OPEX):作为一款即插即用的解决方案,它不需要针对维护进行专门的培训,也不需要昂贵的外部顾问,这与复杂的开源集群工具有着本质区别。
  • 与 CPU 无关的定价模式:许可证的计费与 CPU 或内核的数量无关。只需为两个节点购买两份许可证,即可保护 Windows/Linux 免受故障影响。

在没有集群技术经验的情况下,是否可以搭建 Windows/Linux 镜像集群?

是的。本文将介绍如何快速实现 Windows/Linux 镜像集群,而无需专业的 SAN 管理或复杂的故障转移集群(HA)技术经验。通过使用 SafeKit 的自动化故障转移脚本来处理 Windows/Linux 的数据复制和重启动作,您将获得一个强大的冗余解决方案,其部署和维护难度显著低于传统集群解决方案。

除了 Windows/Linux,SafeKit 还可以保护哪些应用程序和环境?

SafeKit 是一款同时支持 Windows 和 Linux 的通用高可用性解决方案。它能够为各种关键工作负载提供同步实时复制和自动故障转移,其中包括:

  • 虚拟与物理环境:完整的 Hyper-V 或 KVM 虚拟机。
  • 容器编排:Docker、Podman 和 K3s (Kubernetes) 环境。
  • 数据与服务:单个文件目录、服务以及各种数据库。
  • 云基础设施:为云端应用程序提供高可用性。

SafeKit 还为 Web 服务器等无状态应用提供具备原生网络负载均衡和故障转移功能的负载均衡集群(Farm Clusters)

在此处探索受支持的高可用(HA)解决方案完整列表。

SafeKit 镜像集群如何与 Windows/Linux 协同工作?

步骤 1. 实时复制

服务器 1 (PRIM) 运行 Windows/Linux 应用程序。客户端连接到一个虚拟 IP 地址。SafeKit 通过网络实时复制文件内部所做的修改。

镜像 Windows/Linux 集群中字节级的文件复制

与异步复制不同,该复制是同步的,在发生故障时不会丢失数据。

您只需在 SafeKit 中配置需要复制的目录名称即可。对磁盘布局没有任何预备条件。目录可以位于系统盘中。

步骤 2. 自动故障转移

当服务器 1 发生故障时,服务器 2 将接管服务。SafeKit 会自动切换虚拟 IP 地址并在服务器 2 上重新启动 Windows/Linux 应用程序。

应用程序在服务器 2 上能够找到由 SafeKit 复制的最新文件。应用程序继续在服务器 2 上运行,并在本地修改其文件(此时文件不再复制到服务器 1)。

镜像集群中 Windows/Linux 的故障转移

故障转移时间等于故障检测时间(默认 30 秒)加上应用程序启动时间。

步骤 3. 自动故障恢复

故障恢复(Failback)是指在修复导致服务器 1 发生故障的问题后,重新启动服务器 1。

SafeKit 会自动重新同步文件,仅更新在服务器 1 停机期间在服务器 2 上被修改过的文件。

镜像 Windows/Linux 集群中的故障恢复

故障恢复过程不会干扰 Windows/Linux 应用程序的运行,该程序可以继续在服务器 2 上保持运行状态。

步骤 4. 恢复正常运行

重新集成完成后,文件将再次进入镜像模式,正如步骤 1 中所示。系统恢复到高可用模式,此时 Windows/Linux 应用程序在服务器 2 上运行,且 SafeKit 将文件更新实时复制到服务器 1。

镜像 Windows/Linux 集群恢复正常运行

如果管理员希望应用程序在服务器 1 上运行,可以在合适的时间通过 Web 控制台进行手动切换,或者通过配置实现自动切换。

如何为 Windows/Linux 配置 SafeKit 镜像集群?

SafeKit Web Console: High Availability configuration dashboard for Windows/Linux showing heartbeat networks, virtual IP setup, and real-time directory replication for a mirror cluster.

SafeKit Web 控制台提供了一个直观的界面来构建和管理关键应用程序的高可用性。只需几个步骤,您就可以配置 SafeKit 镜像集群以确保业务连续性:

  • 应用程序故障转移(Macros 选项卡):定义在发生故障时需要自动重新启动的具体应用程序服务。
  • 心跳网络:集群节点使用的专用通信路径,用于持续监测彼此的健康状况和可用性,并同步故障转移决策。
  • 虚拟 IP 管理:设置虚拟 IP (VIP),以便在故障转移后实现客户端的透明无感重连。
  • 实时复制:选择关键目录,进行基于主机的同步字节级复制。
  • 检查器(Checkers):监控应用程序的健康状况,并在检测到进程故障时触发自动恢复。

SafeKit 集群包含一个专用的脑裂检查器(split-brain checker),用于解决网络隔离问题,而不需要第三台见证服务器(witness machine)或额外的心跳网络。了解更多关于集群中的心跳、故障转移和仲裁(quorum)的信息。

如何监控 Windows/Linux 的 SafeKit 镜像集群?

SafeKit Web Console: Real-time monitoring of a 2-node mirror cluster for Windows/Linux showing PRIM and SECOND states with active data replication.

SafeKit 管理控制台为您的高可用性基础设施提供了一个统一的视图。它允许管理员实时监控集群的运行状态并跟踪数据同步情况。

对于双节点镜像集群,控制台会清晰地显示每台服务器的角色:

  • PRIM (主节点):当前正在运行应用程序并管理虚拟 IP 的活动节点。它负责写入本地存储,并向备用节点进行实时复制。
  • SECOND (备节点):接收同步字节级更新的备用节点。如果主节点发生故障,它已准备好立即接管服务。
  • ALONE (孤立) 状态:当集群仅在单个节点上运行时(例如在维护期间或发生故障后)为您提供直观的警报,提示冗余已暂时丢失。
  • 重新同步进度:当故障节点恢复时,在后台数据重新集成期间其状态会变为橙色,确保在“恢复正常”阶段不会出现停机时间。

除了简单的状态图标外,该界面还提供了一键式故障转移调度(one-click failover orchestration),允许您在计划内维护时手动重新分配主节点角色,同时确保用户活动的持续可用性。

对比:用于 Windows/Linux 的 SafeKit 与其他集群解决方案

特性 用于 Windows/Linux 的 SafeKit 共享存储故障转移集群 数据库复制
架构 无 SAN(无共享) 共享存储(SAN/NAS) 无共享
应用程序重新配置 无需(就地运行) 需要(将数据移至共享磁盘) 无需
复制范围 整个应用程序(数据库 + 配置 + 日志) 共享磁盘数据 仅限数据库数据
复制类型 同步(零 RPO) 同步(通过 SAN) 取决于版本(通常为异步)
故障转移/故障恢复逻辑 完全自动 完全自动 通常为手动或较为复杂
AD/LDAP 依赖性 独立(无需 AD) 在 Windows 上为必需(活动目录) 独立
部署复杂度 低(< 30 分钟) 高(需要 AD、存储、仲裁) 中等(仅复制,无故障转移)

结论

通过消除对 SAN 的需求并简化部署——去除了对 Active Directory(活动目录)和特定仲裁(Quorum)配置等依赖——SafeKit 提供了一种轻量级、与硬件无关的高可用(HA)替代方案。这在显著降低总拥有成本(TCO)的同时,确保 your Windows/Linux 环境在零数据丢失和自动化恢复的保障下保持强大的业务韧性。

视频指南:配置 SafeKit 高可用镜像集群

🔍 SafeKit 高可用性导航中心

探索 SafeKit:功能特性、技术视频、文档资料及免费试用
资源类型 描述 直接链接
关键特性 为什么选择 SafeKit 实现简单且经济高效的高可用性? 查看为何选择 SafeKit 实现高可用性
使用案例 探索 SafeKit 如何确保关键基础设施的高可用性 查看所有使用案例
部署模式 全合一 SANless HA:无共享软件集群 查看 SafeKit 全合一 SANless HA
HA 策略 SafeKit:基础设施(VM)级 vs. 应用程序级高可用性 查看 SafeKit HA 与冗余:VM 级 vs. 应用级
技术规格 SafeKit 集群的技术限制 查看 SafeKit 高可用性限制条件
概念验证 SafeKit:高可用性配置与故障转移演示 查看 SafeKit 故障转移教程
架构 SafeKit 镜像集群(Mirror Cluster)工作原理(实时复制与故障转移) 查看 SafeKit 镜像集群:实时复制与故障转移
架构 SafeKit 场集群(Farm Cluster)工作原理(网络负载均衡与故障转移) 查看 SafeKit 场集群:网络负载均衡与故障转移
竞争优势 对比:SafeKit vs. 传统高可用性(HA)集群 查看 SafeKit vs. 传统 HA 集群对比
技术资源 SafeKit 高可用性:文档、下载与试用 查看 SafeKit HA 免费试用与技术文档
预配置解决方案 SafeKit 应用模块库:开箱即用的 HA 解决方案 查看 SafeKit 高可用性应用模块