Evidian Logo

Eviden > SafeKit: Software de Alta Disponibilidade SANless Tudo-em-Um e Clustering de Aplicações

SafeKit: Software de Alta Disponibilidade SANless Tudo-em-Um e Clustering de Aplicações

O que é o SafeKit?

O SafeKit é uma solução de software de alta disponibilidade tudo-em-um que garante 100% de tempo de atividade (uptime) das aplicações, combinando replicação baseada em host em tempo real, failover automático e balanceamento de carga num único pacote.

Ao sincronizar dados entre servidores padrão, o SafeKit elimina a necessidade de armazenamento partilhado (SAN) dispendioso ou competências de TI especializadas, proporcionando uma forma simples e económica de proteger bases de dados empresariais (como SQL Server), sistemas de segurança críticos (como o software de gestão de vídeo Milestone XProtect) e software de controlo industrial SCADA (como aplicações Siemens) em ambientes Windows e Linux.

Logótipo oficial do Evidian SafeKit - Software de alta disponibilidade (HA) e clustering de aplicações sem SAN (SANless)

🔍 Hub de Navegação de Alta Disponibilidade SafeKit

Explore o SafeKit: Funcionalidades, vídeos técnicos, documentação e teste gratuito
Tipo de Recurso Descrição Link Direto
Funcionalidades Chave Porquê escolher o SafeKit para uma Alta Disponibilidade simples e económica? Veja porquê escolher o SafeKit para Alta Disponibilidade
Casos de Uso Descubra como o SafeKit garante a alta disponibilidade de infraestruturas críticas Ver todos os casos de uso
Modelo de Implementação HA SANless Tudo-em-Um: Clustering de Software Shared-Nothing Veja o SafeKit HA SANless Tudo-em-Um
Estratégias de HA SafeKit: Infraestrutura (VM) vs. Alta Disponibilidade ao Nível da Aplicação Veja SafeKit HA & Redundância: VM vs. Nível da Aplicação
Especificações Técnicas Limitações Técnicas para o Clustering SafeKit Veja as Limitações de Alta Disponibilidade do SafeKit
Prova de Conceito SafeKit: Configuração de Alta Disponibilidade & Demos de Failover Veja os Tutoriais de Failover do SafeKit
Arquitetura Como funciona o Mirror Cluster do SafeKit (Replicação em Tempo Real & Failover) Veja SafeKit Mirror Cluster: Replicação em Tempo Real & Failover
Arquitetura Como funciona o Farm Cluster do SafeKit (Balanceamento de Carga de Rede & Failover) Veja SafeKit Farm Cluster: Balanceamento de Carga de Rede & Failover
Vantagens Competitivas Comparação: SafeKit vs. Clusters de Alta Disponibilidade (HA) Tradicionais Veja a Comparação SafeKit vs. Cluster de HA Tradicional
Recursos Técnicos Alta Disponibilidade SafeKit: Documentação, Downloads & Teste Veja o Teste Gratuito & Documentação Técnica do SafeKit HA
Soluções Pré-configuradas Biblioteca de Módulos de Aplicação SafeKit: Soluções de HA Prontas a Usar Veja os Módulos de Aplicação de Alta Disponibilidade SafeKit

Porquê Escolher o SafeKit para uma Alta Disponibilidade Simples e Económica?

Quais são as funcionalidades do SafeKit?

O SafeKit oferece as seguintes funcionalidades para Windows e Linux num único produto de software:

  • Balanceamento de carga
  • Replicação de ficheiros síncrona em tempo real
  • Failover automático de aplicações
  • Failback automático após uma falha de servidor

Preciso de competências especiais para configurar o SafeKit?

Não. O SafeKit é simples de implementar — não é necessária experiência avançada.

O SafeKit requer hardware adicional?

Não. O SafeKit corre nos seus servidores existentes, máquinas virtuais ou na nuvem — não são necessários discos partilhados ou armazenamento SAN.

São necessárias licenças de software extra para o SafeKit?

Não. O SafeKit funciona com edições padrão de Windows e Linux e não necessita de licenças de bases de dados enterprise.

Que problemas resolve o SafeKit?

O SafeKit resolve:

  • Falhas de hardware (20% dos problemas), incluindo a falha total de uma sala de computadores
  • Falhas de software (40% dos problemas), incluindo o reinício de processos críticos
  • Erros humanos (40% dos problemas) graças à sua facilidade de utilização

Quais as aplicações suportadas pelo SafeKit?

Pode implementar replicação em tempo real e failover para:

  • Todos os tipos de aplicações, diretórios de ficheiros e serviços
  • Bases de dados
  • Máquinas virtuais Hyper-V ou KVM completas
  • Docker, Podman e aplicações na nuvem

Como é que o SafeKit reduz os custos?

O SafeKit elimina os seguintes requisitos:

  • Balanceadores de carga de rede ou servidores proxy dedicados
  • Discos partilhados ou armazenamento SAN replicado
  • Edições Enterprise de sistemas operativos e bases de dados
  • Competências especializadas em manutenção de clusters

Como é definido o preço e o licenciamento do SafeKit High Availability?

O SafeKit apresenta um modelo de licenciamento por nó transparente e económico, baseado estritamente no número de servidores, independentemente dos núcleos de CPU ou sockets. Ao contrário de muitos concorrentes de alta disponibilidade que exigem subscrições recorrentes, o SafeKit oferece licenças perpétuas para garantir um menor Custo Total de Propriedade (TCO) e ativos de software a longo prazo.

Casos de Uso do SafeKit

SafeKit para OEM

Oferecer alta disponibilidade com a sua aplicação aumenta o valor do negócio ao garantir um serviço contínuo, reduzindo os riscos de inatividade e reforçando a confiança do cliente, permitindo simultaneamente que operações críticas funcionem sem interrupção em infraestruturas padrão.

SafeKit for OEM

Adicione o SafeKit ao seu catálogo como uma opção de alta disponibilidade: uma solução exclusivamente de software adaptada à sua aplicação, sem custos ocultos como armazenamento partilhado, totalmente agnóstica em relação ao hardware e implementável em ambientes físicos, virtuais ou na nuvem, com uma administração simples e plug-and-play.

SafeKit para Edge

Os locais de Edge muitas vezes não possuem centro de dados nem competências especializadas em HA — e, no entanto, a continuidade do negócio é crítica. O SafeKit mantém as aplicações de Edge a funcionar em fábricas, plataformas petrolíferas, navios, segurança de edifícios, controlo de tráfego aéreo, redes 5G, saúde, retalho...

SafeKit for Edge

O SafeKit transforma dois servidores de Edge comuns (de qualquer marca) num cluster HA plug-and-play — sem armazenamento partilhado/SAN. Uma única stack leve oferece replicação em tempo real e failover automático (podendo também incluir balanceamento de carga), sendo fácil de instalar e administrar.

SafeKit para VMS

O Software de Gestão de Vídeo (VMS) é fundamental para a segurança pública, gravando e exibindo vídeos em direto e arquivados para que os agentes de segurança possam reagir instantaneamente a incidentes. Qualquer interrupção no VMS coloca pessoas e ativos diretamente em risco.

SafeKit para VMS

O SafeKit evita a perda de vídeo e lacunas de monitorização ao manter o acesso contínuo a transmissões em direto e gravadas, mesmo durante falhas de servidor ou software. Integra-se perfeitamente com as principais plataformas de VMS, como Milestone, Genetec, Hanwha, entre outras, para manter a vigilância operacional quando ela é mais necessária.

SafeKit para EACS

Os Sistemas de Controlo de Acesso Eletrónico (EACS) são essenciais para a segurança física, controlando e monitorizando o acesso a áreas privadas e sensíveis através de portas, cartões, leitores e sensores. Qualquer interrupção no sistema pode expor imediatamente pessoas, edifícios e ativos a intrusões.

SafeKit para EACS

O SafeKit mantém as decisões de controlo de acesso, alarmes e credenciais sempre disponíveis, eliminando pontos únicos de falha. Oferece uma operação resiliente para soluções EACS, tais como Hirsch Microsesame, Nedap AEOS e Siemens SiPass, garantindo um acesso seguro mesmo durante incidentes de infraestrutura.

SafeKit para SCADA

Os sistemas SCADA (Supervisory Control and Data Acquisition) estão no centro dos ambientes industriais, permitindo aos operadores monitorizar e controlar processos críticos através de sensores, válvulas, bombas, motores e interfaces homem-máquina.

SafeKit para SCADA

O SafeKit minimiza o tempo de inatividade da produção ao garantir que os sistemas de controlo SCADA — como os que alimentam os torradores de café Probat e as máquinas de triagem de bagagem ALSTEF — permanecem operacionais apesar de incidentes de hardware ou software. Isto permite que os operadores mantenham total visibilidade e controlo dos processos industriais em todos os momentos, evitando paragens dispendiosas e riscos de segurança.

SafeKit para BMS

Os Sistemas de Gestão Técnica Centralizada (BMS) são centrais para os edifícios modernos, fornecendo controlo automatizado de AVAC, distribuição elétrica, iluminação, segurança contra incêndios e sistemas de águas. Qualquer interrupção no sistema pode impactar diretamente a segurança, o conforto dos ocupantes e as operações do edifício.

SafeKit para BMS

O SafeKit salvaguarda a automação de edifícios ao permitir que os serviços de BMS continuem a ser executados de forma transparente em caso de falha. Suporta plataformas como o Siemens Desigo CC, Bosch BIS e sistemas relacionados para manter as operações dos edifícios seguras, eficientes e ininterruptas.

SafeKit para ATC

Os sistemas de Controlo de Tráfego Aéreo (ATC) são fundamentais para a segurança da aviação, permitindo a monitorização e o controlo em tempo real dos movimentos das aeronaves no solo e no ar através de aplicações de vigilância, orientação e controlo.

SafeKit para ATC

O SafeKit reforça a resiliência do sistema ATC ao garantir o acesso ininterrupto dos controladores a aplicações críticas do lado ar (airside). É utilizado com soluções de ATC e aeroportuárias, tais como ADB SafeGate, para suportar operações de tráfego aéreo seguras e contínuas sob todas as condições.

SafeKit para OCC

Os Centros de Controlo de Operações (OCC) estão no cerne das redes de metro modernas, centralizando a supervisão dos movimentos dos comboios, fornecimento de energia, sinalização, informações aos passageiros e gestão de incidentes. Em linhas de metro automáticas e sem condutor, o OCC é o ponto único de controlo das operações.

SafeKit para OCC

O SafeKit garante a supervisão ininterrupta do metro, assegurando que as aplicações do OCC permanecem disponíveis durante falhas. Suporta Centros de Controlo de Operações para as linhas de metro automáticas e sem condutor de Paris, permitindo um serviço contínuo e uma resposta rápida a incidentes sem dependência de condutores a bordo.

Porque é Essencial um Produto de Alta Disponibilidade SANless Tudo-em-Um?

No mundo da continuidade de negócio, muitas organizações acreditam erradamente que ter uma cópia de segurança (backup) ou uma ferramenta de replicação de dados é o mesmo que ter Alta Disponibilidade (HA). Na realidade, estas são apenas peças de um puzzle muito maior. Para garantir verdadeiramente 100% de tempo de atividade (uptime), necessita de uma solução tudo-em-um que integre todas as camadas do processo de failover.

Eis porque é que uma abordagem fragmentada falha e porque é necessário um produto integrado e tudo-em-um como o SafeKit — que utiliza replicação baseada em host ao nível do ficheiro.

A replicação baseada em host é suficiente por si só para Alta Disponibilidade?

Não. A replicação de dados é simplesmente o ato de copiar dados do Servidor A para o Servidor B. Embora seja crítica, a replicação por si só não oferece disponibilidade. Sem os outros componentes de uma pilha de HA, a replicação é apenas uma "cópia passiva" que requer uma intervenção manual e demorada para se tornar útil:

  • Se o Servidor A falhar, o software de replicação de dados não redirecionará automaticamente os seus utilizadores para o Servidor B.
  • Não detetará que a aplicação parou.
  • Não reiniciará os serviços.

Os Riscos Ocultos das Soluções Fragmentadas: Porque é que a HA em Silos Aumenta as Falhas

Muitos fornecedores exigem que "una" vários produtos diferentes para obter replicação baseada em host, failover e balanceamento de carga. Esta arquitetura fragmentada é uma estratégia perigosa para sistemas de missão crítica:

  • Integração Frágil: Quando utiliza o produto A para replicação e o produto B para clustering, cria um "castelo de cartas". Cada atualização de SO ou patch de segurança corre o risco de quebrar a frágil ligação de comunicação entre estes motores separados.
  • Carga Cognitiva Elevada & Erro Humano: Gerir múltiplas interfaces aumenta o risco de erros. Durante uma falha de sistema sob alta pressão, saltar entre diferentes GUIs ou utilizar diferentes sintaxes de CLI para diagnosticar um problema leva à confusão e a um tempo de inatividade prolongado.
  • Troca de Acusações entre Fornecedores: Se um failover falhar, o fornecedor da replicação pode culpar a ferramenta de clustering, deixando-o preso no meio sem um caminho claro para a resolução. Uma solução tudo-em-um oferece um único ponto de responsabilidade.
  • Manutenção Complexa: Sistemas fragmentados requerem competências especializadas para cada componente separado, tornando a solução mais difícil de manter e significativamente mais dispendiosa ao longo do tempo.

Para além dos dados, que componentes específicos são necessários para um verdadeiro failover SANless?

Para automatizar a recuperação e eliminar o tempo de inatividade, um produto tudo-em-um deve gerir várias partes técnicas móveis em simultâneo:

  • Replicação Baseada em Host: replicação síncrona em tempo real de dados críticos de aplicações entre servidores sem depender de armazenamento partilhado (SAN). Isto garante zero perda de dados (RPO=0) e elimina dependências de hardware dispendiosas.
  • Endereço IP Virtual (VIP): oferece um ponto de entrada único para os utilizadores. Quando ocorre uma falha, o software move o VIP do nó com falha para o nó saudável, para que os utilizadores não tenham de alterar a sua configuração.
  • Detetores de Erros de Hardware e Software: o sistema deve efetuar constantemente um "heartbeat" tanto ao servidor físico como aos processos de software específicos para identificar imediatamente um bloqueio ou uma falha.
  • Scripts de Reinício Personalizáveis: nem todas as aplicações iniciam da mesma forma. Uma ferramenta tudo-em-um permite scripts personalizados para garantir que serviços complexos iniciam na ordem correta.
  • Failover Automático: a inteligência para orquestrar toda a transição de um servidor para outro sem intervenção humana.

Porque é que o mecanismo de failover deve estar sincronizado com a replicação baseada em host?

Se o seu gestor de failover e a sua replicação de dados forem dois produtos diferentes, estes poderão não estar "em sincronia".

O Perigo: Se ocorrer um failover mas a replicação ainda não tiver terminado de enviar os últimos bits, o Servidor B iniciará a aplicação com dados desatualizados ou corrompidos.

Uma solução de HA SANless tudo-em-um garante que o mecanismo de failover esteja ciente do estado da replicação. Este apenas permitirá que a aplicação seja iniciada no nó de reserva (backup) se houver a garantia de que os dados estão atualizados, evitando nós ativos em conflito e perda de dados.

O que acontece quando o servidor com falha é reparado (failback)?

Frequentemente ignorado em guias técnicos e mal executado pelas soluções de HA tradicionais, o failback automático continua a ser o requisito mais crítico para uma verdadeira resiliência. Um verdadeiro produto tudo-em-um gere o "Regresso ao Normal" de forma tão elegante como gere a falha. Quando o servidor que falhou volta a estar online, os seus dados estão desatualizados. O software de HA deve:

  1. Resincronizar os dados em segundo plano, do nó ativo para o nó recuperado.
  2. Manter o Tempo de Atividade (Uptime): esta resincronização deve ocorrer sem interromper a aplicação que está a correr no nó ativo.
  3. Restaurar a Redundância: assim que os dados estiverem novamente espelhados (mirrored), o cluster regressa automaticamente a um estado protegido, pronto para o próximo evento.

Replicação ao Nível do Bloco vs. Ficheiro: Porque é que a Transparência é Importante

O método técnico utilizado para a replicação baseada em host tem um impacto significativo na quantidade de alterações que terá de efetuar na configuração da sua aplicação existente.

  • O Desafio da Replicação ao Nível do Bloco: A maioria das soluções SANless replica ao nível do disco/bloco. Isto não é transparente para a aplicação. Exige que reconfigure totalmente a aplicação para mover os seus dados para um volume de "disco replicado" específico, criado recentemente. Isto envolve frequentemente uma migração complexa e potenciais alterações na lógica da aplicação.
  • A Vantagem do SafeKit ao Nível do Ficheiro: O SafeKit efetua a replicação baseada em host ao nível do ficheiro, o que é completamente transparente para a aplicação. Não precisa de mover os dados para um disco especial; basta configurar o SafeKit para replicar as pastas existentes da aplicação. Estas pastas podem até permanecer no disco do sistema, permitindo-lhe proteger uma aplicação exatamente onde esta já está instalada.

Escolher a sua estratégia de Alta Disponibilidade: HA de VM vs. HA de Aplicação

SafeKit oferece duas abordagens principais para garantir a continuidade do negócio: Alta Disponibilidade de Máquinas Virtuais (VM HA) e Alta Disponibilidade de Aplicações (Application HA). Embora ambos os métodos forneçam capacidades de failover automático, diferem significativamente no seu âmbito, nos mecanismos de replicação de dados, na velocidade de recuperação e na compatibilidade com plataformas. Esta comparação detalha essas diferenças para ajudar a identificar a estratégia ideal para ambientes de TI específicos, quer o foco seja um suporte amplo à virtualização ou uma recuperação de aplicações granular e de alta velocidade.

Comparação de Funcionalidades: SafeKit VM HA vs. Clustering de Aplicação SafeKit
Funcionalidade de Comparação VM HA com módulo SafeKit Hyper-V ou KVM Application HA com módulos de aplicação SafeKit
Diagrama de Implementação Diagrama que ilustra a Alta Disponibilidade de VM com SafeKit usando Hyper-V ou KVM: dois hipervisores replicam a imagem completa da VM, permitindo reinício e recuperação completos em caso de falha do host. Diagrama que ilustra a Alta Disponibilidade de Aplicações com SafeKit: dois servidores de aplicação (nós) com replicação do sistema de ficheiros e failover rápido ao nível da aplicação para baixo RTO.
Âmbito do Failover SafeKit em 2 hipervisores: replicação e failover da VM completa. SafeKit em 2 máquinas virtuais ou físicas: replicação e failover ao nível da aplicação.
Dados Replicados Replica mais dados (Aplicação + Sistema Operativo). Replica apenas os dados da aplicação, resultando em menores volumes de dados.
Processo de Recuperação & Velocidade (RTO) Reinício da VM no hipervisor 2 se o hipervisor 1 falhar. O tempo de recuperação depende do reinício do sistema operativo. Monitor de VM e mecanismo de failover. Tempo de recuperação rápido com o reinício da aplicação no SO2 se o servidor 1 falhar. Tipicamente cerca de 1 minuto ou menos (baixo RTO). Monitor de aplicações e failover por software.
Instalação A aplicação é instalada uma vez numa única VM. A aplicação é instalada em dois nós.
Configuração Solução genérica para qualquer aplicação/SO em execução na VM.

  • Não requer conhecimento técnico da aplicação instalada na VM.
  • É a melhor solução se não souber como a aplicação funciona.
  • Basta definir a localização dos ficheiros da VM.
Requer conhecimento técnico da própria aplicação.

  • Quais os serviços que precisam de ser reiniciados.
  • As pastas específicas da aplicação que necessitam de replicação em tempo real.
  • A configuração de um endereço IP virtual para failover.
Compatibilidade de Plataforma Funciona com Windows/Hyper-V e Linux/KVM, mas não é compatível com VMware. Independente da plataforma; funciona com máquinas físicas ou virtuais, infraestrutura cloud e qualquer hipervisor, incluindo VMware.
Ideal Para Ideal para gerir ambientes complexos com múltiplas aplicações distribuídas por várias VMs através de uma única política de HA. Ideal para integrar a alta disponibilidade diretamente numa solução de software, independentemente do hardware ou hipervisor subjacente.

Limitações da Alta Disponibilidade SafeKit

Porquê uma replicação de alguns Terabytes?

Tempo de resincronização após uma falha (passo 3)

  • Rede de 1 Gb/s ≈ 3 horas para 1 Terabyte.
  • Rede de 10 Gb/s ≈ 1 hora para 1 Terabyte ou menos, dependendo do desempenho de escrita do disco.

Alternativa

Porquê uma replicação < 1.000.000 ficheiros?

  • Desempenho do tempo de resincronização após uma falha (passo 3).
  • Tempo para verificar cada ficheiro entre ambos os nós.

Alternativa

  • Coloque os muitos ficheiros a replicar num disco rígido virtual / máquina virtual.
  • Apenas os ficheiros que representam o disco rígido virtual / máquina virtual serão replicados e resincronizados neste caso.

Porquê um failover ≤ 32 VMs replicadas?

  • Cada VM é executada num módulo de espelho independente.
  • Máximo de 32 módulos de espelho a correr no mesmo cluster.

Alternativa

  • Utilize armazenamento partilhado externo e outra solução de clustering de VMs.
  • Mais caro, mais complexo.

Porquê uma rede LAN/VLAN entre sites remotos?

Alternativa

Tutoriais Técnicos e Demos de Failover do SafeKit

Como funciona o cluster de espelhamento SafeKit?

Passo 1. Replicação em tempo real

O Servidor 1 (PRIM) executa a aplicação. Os clientes estão ligados a um endereço IP virtual. O SafeKit replica em tempo real as modificações feitas nos ficheiros através da rede.

Replicação de ficheiros ao nível do byte num cluster de espelhamento

A replicação é síncrona, sem perda de dados em caso de falha, ao contrário da replicação assíncrona.
Basta configurar os nomes dos diretórios a replicar no SafeKit. Não existem pré-requisitos na organização do disco. Os diretórios podem estar localizados no disco do sistema.

Passo 2. Failover automático (Comutação automática)

Quando o Servidor 1 falha, o Servidor 2 assume o controlo. O SafeKit comuta o endereço IP virtual e reinicia a aplicação automaticamente no Servidor 2.
A aplicação encontra os ficheiros replicados pelo SafeKit atualizados no Servidor 2. A aplicação continua a ser executada no Servidor 2, modificando localmente os seus ficheiros que deixam de ser replicados para o Servidor 1.

Failover num cluster de espelhamento

O tempo de failover é igual ao tempo de deteção de falha (30 segundos por predefinição) mais o tempo de arranque da aplicação.

Passo 3. Failback automático (Retorno automático)

O failback envolve o reinício do Servidor 1 após a correção do problema que causou a falha.
O SafeKit ressincroniza automaticamente os ficheiros, atualizando apenas os ficheiros modificados no Servidor 2 enquanto o Servidor 1 estava parado.

Failback num cluster de espelhamento

O failback ocorre sem perturbar a aplicação, que pode continuar a ser executada no Servidor 2.

Passo 4. Regresso à normalidade

Após a reintegração, os ficheiros estão novamente em modo de espelhamento, tal como no passo 1. O sistema está de volta ao modo de alta disponibilidade, com a aplicação em execução no Servidor 2 e o SafeKit a replicar as atualizações de ficheiros para o Servidor 1.

Regresso à operação normal num cluster de espelhamento

Se o administrador desejar que a aplicação seja executada no Servidor 1, ele/ela pode executar um comando "swap" (troca) manualmente num momento apropriado ou automaticamente através da configuração.

Como configurar um Mirror Cluster SafeKit?

SafeKit Web Console: painel de configuração de Alta Disponibilidade mostrando redes de heartbeat, configuração de IP virtual e replicação de diretórios em tempo real para um mirror cluster.

A consola web do SafeKit oferece uma interface intuitiva para orquestrar a alta disponibilidade das suas aplicações críticas. Em apenas alguns passos, pode configurar um mirror cluster SafeKit para garantir a continuidade do negócio:

  • Failover de Aplicação (Separador Macros): defina os serviços específicos da aplicação que devem ser reiniciados automaticamente em caso de falha.
  • Rede(s) de Heartbeat: caminhos de comunicação dedicados utilizados pelos nós do cluster para monitorizar continuamente a integridade e disponibilidade uns dos outros e sincronizar decisões de failover.
  • Gestão de IP Virtual: configure o IP Virtual (VIP) para uma reconexão transparente do cliente após um failover.
  • Replicação em Tempo Real: selecione os diretórios críticos para replicação síncrona ao nível do byte baseada no host.
  • Checkers (Verificadores): monitorize a integridade da aplicação e acione a recuperação automática se for detetada uma falha de processo.

O cluster SafeKit inclui um verificador de "split-brain" dedicado para resolver problemas de isolamento de rede sem a necessidade de uma terceira máquina de testemunho (witness) ou uma rede de heartbeat adicional. Saiba mais sobre falha de energia e isolamento de rede num cluster.

Como monitorizar um mirror cluster SafeKit?

Consola Web SafeKit: Monitorização em tempo real de um mirror cluster de 2 nós mostrando os estados PRIM e SECOND com replicação de dados ativa.

A consola de gestão SafeKit oferece uma visão unificada da sua infraestrutura de alta disponibilidade. Permite aos administradores monitorizar o estado operacional do cluster e acompanhar a sincronização de dados em tempo real.

Para um mirror cluster de 2 nós, a consola exibe claramente as funções de cada servidor:

  • PRIM (Primário): O nó ativo que está a executar a aplicação e a gerir o IP Virtual. Realiza escritas no armazenamento local e a replicação em tempo real para o nó secundário.
  • SECOND (Secundário): O nó de reserva (standby) que recebe atualizações síncronas ao nível do byte. Está pronto para assumir o controlo instantaneamente se o Primário falhar.
  • Estado ALONE: Alerta visualmente quando o cluster está a funcionar num único nó (ex: durante manutenção ou após uma falha), indicando que a redundância foi temporariamente perdida.
  • Progresso de Ressincronização: Quando um nó que falhou recupera, o seu estado fica cor de laranja durante a reintegração de dados em segundo plano, garantindo que não há tempo de inatividade durante a fase de "regresso ao normal".

Além de ícones de estado simples, a interface oferece orquestração de failover com um clique, permitindo-lhe trocar manualmente as funções (Primário/Secundário) para manutenção planeada sem interromper a atividade do utilizador.

Como funciona o cluster farm SafeKit?

Endereço IP Virtual num cluster farm

Como o cluster farm SafeKit da Evidian implementa o balanceamento de carga de rede e o failover

Na figura anterior, a aplicação está a ser executada nos 3 servidores (3 é um exemplo, podem ser 2 ou mais). Os utilizadores estão ligados a um endereço IP virtual.
O endereço IP virtual é configurado localmente em cada servidor no cluster farm.
O tráfego de entrada para o endereço IP virtual é recebido por todos os servidores e dividido entre eles por um filtro de rede dentro do kernel de cada servidor.
O SafeKit deteta falhas de hardware e software, reconfigura os filtros de rede em caso de falha e oferece verificadores de aplicação e scripts de recuperação configuráveis.

Balanceamento de carga num filtro de rede

O algoritmo de balanceamento de carga de rede dentro do filtro de rede baseia-se na identidade dos pacotes do cliente (endereço IP do cliente, porta TCP do cliente). Dependendo da identidade da entrada do pacote do cliente, apenas um filtro num servidor aceita o pacote; os outros filtros noutros servidores rejeitam-no.
Assim que um pacote é aceite pelo filtro num servidor, apenas o CPU e a memória deste servidor são usados pela aplicação que responde ao pedido do cliente. As mensagens de saída são enviadas diretamente do servidor de aplicação para o cliente.
Se um servidor falhar, o protocolo heartbeat do farm reconfigura os filtros no cluster de balanceamento de carga de rede para reequilibrar o tráfego nos servidores restantes disponíveis.

Aplicações com estado (Stateful) ou sem estado (Stateless)

Com uma aplicação com estado (stateful), existe afinidade de sessão. O mesmo cliente deve estar ligado ao mesmo servidor em múltiplas sessões TCP para recuperar o seu contexto no servidor. Neste caso, a regra de balanceamento de carga do SafeKit é configurada no endereço IP do cliente. Assim, o mesmo cliente está sempre ligado ao mesmo servidor em múltiplas sessões TCP. E diferentes clientes são distribuídos por diferentes servidores na farm.
Com uma aplicação sem estado (stateless), não há afinidade de sessão. O mesmo cliente pode estar ligado a diferentes servidores na farm em múltiplas sessões TCP. Não há contexto armazenado localmente num servidor de uma sessão para outra. Neste caso, a regra de balanceamento de carga do SafeKit é configurada na identidade da sessão TCP do cliente. Esta configuração é a melhor para distribuir sessões entre servidores, mas requer um serviço TCP sem afinidade de sessão.

Como configurar um cluster farm do SafeKit?

Consola Web SafeKit: Configuração de cluster farm para balanceamento de carga de rede e gestão de IP virtual.

O cluster farm do SafeKit foi concebido para alta disponibilidade e escalabilidade de serviços. A configuração foca-se na distribuição do tráfego de entrada entre ambos os nós em simultâneo:

  • Serviços com Balanceamento de Carga (separador Macros): Defina os serviços de aplicação específicos (ex: Apache, IIS, Nginx) que devem ser mantidos ativos em todos os nós.
  • Rede(s) de Heartbeat: Caminho(s) de comunicação utilizados para detetar se um nó abandonou o farm, acionando uma redistribuição imediata da carga.
  • IP Virtual (Farm VIP): Ao contrário de um cluster mirror, o VIP do Farm é partilhado entre os nós através de um algoritmo de filtragem de kernel para distribuir o tráfego de rede.
  • Regras de Balanceamento de Carga: Defina a política de distribuição de tráfego com base no endereço IP de origem ou na porta.
  • Checkers (Verificadores): Monitorizam o estado da aplicação e ativam o reinício automático caso seja detetada uma falha num processo.

Como monitorizar um cluster farm do SafeKit?

Consola SafeKit: Monitorização de um cluster Farm de 2 nós mostrando ambos os nós em estado UP com balanceamento de carga ativo.

A monitorização de um cluster farm oferece visibilidade sobre a natureza Ativo-Ativo da infraestrutura, onde todos os nós contribuem para o desempenho da aplicação (mostrando 2 nós neste exemplo):

  • Estado UP (50% em 2 nós): Num farm saudável, ambos os nós estão no estado "UP" (50%), o que significa que ambos estão a receber e a processar ativamente os pedidos dos clientes através do IP Virtual partilhado.
  • Reequilíbrio Automático (Re-balancing): Se um nó falhar, a consola mostra visualmente o nó restante a assumir 100% do tráfego. Não existe atraso de "failover", pois o nó sobrevivente já está ativo (à exceção de um tempo de deteção de alguns segundos).
  • Inserção de Nó: Quando um nó reparado é reiniciado, este transita de "STOP" para "UP" e começa automaticamente a receber a sua parcela da carga sem a intervenção do administrador.
  • Sem Sincronização de Dados: Note que, num cluster farm, não existe o estado de ressincronização "Laranja", pois pressupõe-se que os nós sejam sem estado (stateless) ou partilhem uma base de dados de back-end (que pode ser protegida separadamente num cluster mirror).

Para além de ícones de estado simples, a interface oferece gestão de nós com um clique, permitindo parar ou iniciar manualmente um nó para manutenção planeada, enquanto o IP Virtual partilhado redistribui automaticamente o tráfego sem interromper a atividade do utilizador.

Comparação do SafeKit com Clusters de Alta Disponibilidade (HA) Tradicionais

Como se compara o SafeKit com as soluções tradicionais de cluster de Alta Disponibilidade (HA)?

Esta comparação realça as diferenças fundamentais entre o SafeKit e as soluções tradicionais de cluster de Alta Disponibilidade (HA), como Clusters de Failover, HA de Virtualização e SQL Always-On. O SafeKit foi concebido como uma solução de baixa complexidade, apenas por software, para redundância genérica de aplicações, contrastando com a elevada complexidade e requisitos de armazenamento específicos (armazenamento partilhado, SAN) típicos dos mecanismos tradicionais de HA.
Comparação do SafeKit com clusters de Alta Disponibilidade (HA) tradicionais
Soluções Complexidade Comentários
Cluster de Failover (Microsoft) Elevada Armazenamento Específico (armazenamento partilhado, SAN)
Virtualização (VMware HA) Elevada Armazenamento Específico (armazenamento partilhado, SAN, vSAN)
SQL Always-On (Microsoft) Elevada Apenas o SQL é redundante, requer SQL Enterprise Edition
SafeKit Baixa Mais simples, genérico e apenas por software. Inadequado para replicação de grandes volumes de dados.

A Vantagem do SafeKit na Redundância de Aplicações

O SafeKit atinge a sua Alta Disponibilidade de baixa complexidade através de um mecanismo de espelhamento simples e baseado em software que elimina a necessidade de hardware dedicado e caro como uma SAN (Storage Area Network). Isso torna-o uma solução altamente acessível para implementar rapidamente a redundância de aplicações sem alterações complexas na infraestrutura.

Teste Gratuito do SafeKit HA & Documentação Técnica

💡 Para iniciar a sua jornada de alta disponibilidade com o SafeKit, comece com os Guias de Instalação Rápida.

📦 Pacotes de Software HA do SafeKit - Versão 8.2

Esta tabela fornece os ficheiros de instalação do SafeKit para a versão atual, organizados por sistema operativo e tipo de instalador.

SO / Plataforma Tipo de Instalador Benefício Chave / Documentação Link de Download
Todas as Plataformas Documento PDF Boletim Oficial de Lançamento de Software (Suporte de SO e Correções) 📄 Ver SafeKit 8.2 SRB
Windows (Intel 64-bit) Instalador .exe Inclui Microsoft VC++ Redistributable ⬇️ Descarregar SafeKit 8.2 Windows EXE
Windows (Intel 64-bit) Instalador .msi Não inclui Microsoft VC++ Redistributable ⬇️ Descarregar SafeKit 8.2 Windows MSI
Linux (Intel 64-bit) .BIN Auto-extraível Inclui pacote Linux e script de instalação ⬇️ Descarregar SafeKit 8.2 Linux BIN (Intel)
Linux (ARM 64-bit) .BIN Auto-extraível Inclui pacote Linux e script de instalação ⬇️ Descarregar SafeKit 8.2 Linux BIN (ARM)

➡️ Ir para Arquivos da v7.5

Biblioteca de Módulos de Aplicação SafeKit: Soluções HA Prontas a Utilizar

Esta tabela apresenta as soluções de Alta Disponibilidade (HA) do SafeKit, categorizadas por aplicação e ambiente operativo (Bases de Dados, Servidores Web, VMs, Contentores, Cloud). Identifique o módulo .safe pré-configurado específico (por exemplo, mirror.safe, farm.safe, entre outros) necessário para replicação em tempo real, balanceamento de carga e failover automático de aplicações empresariais críticas em Windows ou Linux. Simplifique a configuração do seu cluster HA com ligações diretas para guias de instalação rápida.

⚠️ Nota: Um módulo .safe do SafeKit é, essencialmente, um modelo de Alta Disponibilidade (HA) pré-configurado que define como uma aplicação específica será clusterizada e protegida pelo software SafeKit. Na prática, é um ficheiro zip que contém um ficheiro de configuração (userconfig.xml) e scripts de reinício.

Soluções de Alta Disponibilidade (HA) SafeKit: Guias de Instalação Rápida (com módulos .safe descarregáveis)
Categoria da Aplicação Como funciona? Guia de Instalação Rápida Módulo da Aplicação
Novas Aplicações Arquitetura de Cluster Mirror para Windows Guia de Instalação Rápida para Windows mirror.safe (Windows)*
Novas Aplicações Arquitetura de Cluster Mirror para Linux Guia de Instalação Rápida para Linux mirror.safe (Linux)*
Novas Aplicações Arquitetura de Balanceamento de Carga para Windows Guia de Instalação Rápida para Windows farm.safe (Windows)*
Novas Aplicações Arquitetura de Balanceamento de Carga para Linux Guia de Instalação Rápida para Linux farm.safe (Linux)*
Bases de Dados Arquitetura de Cluster Mirror para Microsoft SQL Server Guia de Instalação Rápida para Microsoft SQL Server sqlserver.safe (Windows)
Bases de Dados Arquitetura de Cluster Mirror para PostgreSQL Guia de Instalação Rápida para PostgreSQL postgresql.safe (Windows)
postgresql.safe (Linux)
Bases de Dados Arquitetura de Cluster Mirror para MySQL Guia de Instalação Rápida para MySQL mysql.safe (Windows)
mysql.safe (Linux)
Bases de Dados Arquitetura de Cluster Mirror para MariaDB Guia de Instalação Rápida para MariaDB mysql.safe (Windows)
mysql.safe (Linux)
Bases de Dados Arquitetura de Cluster Mirror para Oracle Guia de Instalação Rápida para Oracle oracle.safe (Windows)
oracle.safe (Linux)
Bases de Dados Arquitetura de Cluster Mirror para Firebird Guia de Instalação Rápida para Firebird firebird.safe (Windows)
firebird.safe (Linux)
Servidores Web Arquitetura de Balanceamento de Carga Apache Guia de Instalação Rápida para Apache apache_farm.safe (Windows)
apache_farm.safe (Linux)
Servidores Web Arquitetura de Balanceamento de Carga IIS Guia de Instalação Rápida para IIS iis_farm.safe (Windows)
Servidores Web Arquitetura de Balanceamento de Carga NGINX Guia de Instalação Rápida para NGINX farm.safe (Windows & Linux)*
VMs e Contentores Arquitetura HA de VM Hyper-V Guia de Instalação Rápida para Hyper-V hyperv.safe (Windows)
VMs e Contentores Arquitetura HA de VM KVM Guia de Instalação Rápida para KVM kvm.safe (Linux)
VMs e Contentores Arquitetura HA de Contentor Docker Guia de Instalação Rápida para Docker mirror.safe (Linux)*
VMs e Contentores Arquitetura HA de Contentor Podman Guia de Instalação Rápida para Podman mirror.safe (Linux)*
VMs e Contentores Arquitetura de Cluster Kubernetes K3S Guia de Instalação Rápida para Kubernetes K3S k3s.safe (Linux)
Nuvem AWS Arquitetura de Cluster Mirror AWS Guia de Instalação Rápida para AWS mirror.safe (Windows & Linux)*
Nuvem AWS Arquitetura de Balanceamento de Carga AWS Guia de Instalação Rápida para AWS farm.safe (Windows & Linux)*
Nuvem GCP Arquitetura de Cluster Mirror GCP Guia de Instalação Rápida para GCP mirror.safe (Windows & Linux)*
Nuvem GCP Arquitetura de Balanceamento de Carga GCP Guia de Instalação Rápida para GCP farm.safe (Windows & Linux)*
Nuvem Azure Arquitetura de Cluster Mirror Azure Guia de Instalação Rápida para Azure mirror.safe (Windows & Linux)*
Nuvem Azure Arquitetura de Balanceamento de Carga Azure Guia de Instalação Rápida para Azure farm.safe (Windows & Linux)*
Nuvem Arquitetura de Cluster Mirror na Cloud Guia de Instalação Rápida para Cloud mirror.safe (Windows & Linux)*
Nuvem Arquitetura de Balanceamento de Carga na Cloud Guia de Instalação Rápida para Cloud farm.safe (Windows & Linux)*
Segurança Física / VMS Arquitetura de Cluster Mirror Milestone XProtect Guia de Instalação Rápida para Milestone XProtect milestone.safe (Windows)
Segurança Física / VMS Arquitetura de Cluster Mirror Nedap AEOS Guia de Instalação Rápida para Nedap AEOS nedap.safe (Windows)
Segurança Física / VMS Arquitetura de Cluster Mirror SQL Genetec Guia de Instalação Rápida para Genetec (SQL Server) sqlserver.safe (Windows)
Segurança Física / VMS Arquitetura HA de VM Bosch AMS Guia de Instalação Rápida para Bosch AMS hyperv.safe (Windows)
Segurança Física / VMS Arquitetura HA de VM Bosch BIS Guia de Instalação Rápida para Bosch BIS hyperv.safe (Windows)
Segurança Física / VMS Arquitetura HA de VM Bosch BVMS Guia de Instalação Rápida para Bosch BVMS hyperv.safe (Windows)
Segurança Física / VMS Arquitetura HA de VM Hanwha Vision Guia de Instalação Rápida para Hanwha Vision hyperv.safe (Windows)
Segurança Física / VMS Arquitetura HA de VM Hanwha Wisenet Guia de Instalação Rápida para Hanwha Wisenet hyperv.safe (Windows)
Produtos Siemens Arquitetura HA de VM Siemens Siveillance Guia de Instalação Rápida para a suite Siemens Siveillance hyperv.safe (Windows)
Produtos Siemens Arquitetura HA de VM Siemens Desigo CC Guia de Instalação Rápida para Siemens Desigo CC hyperv.safe (Windows)
Produtos Siemens Arquitetura de Cluster Mirror Siemens Siveillance Guia de Instalação Rápida para Siemens Siveillance VMS SiveillanceVMS.safe (Windows)
Produtos Siemens Arquitetura HA de VM Siemens SiPass Guia de Instalação Rápida para Siemens SiPass hyperv.safe (Windows)
Produtos Siemens Arquitetura HA de VM Siemens SIPORT Guia de Instalação Rápida para Siemens SIPORT hyperv.safe (Windows)
Produtos Siemens Arquitetura HA de VM SIMATIC PCS 7 Guia de Instalação Rápida para Siemens SIMATIC PCS 7 hyperv.safe (Windows)
Produtos Siemens Arquitetura HA de VM SIMATIC WinCC Guia de Instalação Rápida para Siemens SIMATIC WinCC hyperv.safe (Windows)

* Os módulos mirror.safe e farm.safe estão incluídos por defeito no pacote de instalação do SafeKit.