Disaster Recovery: o que significam as siglas RPO, RTO, WRT ou MTD e porque é que são importantes?

Partilhar

Vamos falar sobre Disaster Recovery, ou Recuperação de Desastres: o que significam as siglas RPO, RTO, MTD ou WRT e qual é a importância de entender estes conceitos para a continuidade dos negócios e dos serviços e para a recuperação de desastres?

Às vezes, quando falamos em recuperação de desastres (Disaster Recovery), ou impactos no serviço ou no negócio, muitas pessoas assustam-se porque ouvem ou leem siglas que parecem ter sido criadas para assustar os principiantes e leigos.

Neste artigo pretendemos começar a remover a névoa de mistério arcano que envolve todos estes conceitos relacionados com a Recuperação de Desastres para ajudá-lo a seguir o caminho certo e garantir a continuidade do seu negócio, não importa o que aconteça.

 

Disaster Recovery: o que significam as siglas RPO, RTO, WRT ou MTD e porque é que são importantes?

Vamos supor que estamos numa empresa com um funcionamento normal, sem grandes problemas operativos, ou seja, o funcionamento padrão da maioria das organizações que todos conhecemos: encontraríamos um PC com um vírus que gera um pequeno problema, outro computador que precisa de um rato novo, uma impressora que dá problemas até trocarmos o toner… Enfim, coisas normais numa empresa.

Seria o que se chama de funcionamento normal dos sistemas, em que não há interrupção do serviço nem perigo para a continuidade da empresa.

Estaríamos na situação mostrada no gráfico seguinte.

Imagem. Funcionamento correto dos serviços
Imagem. Funcionamento correto dos serviços

Após um período de tempo em que o serviço funciona sem problemas, ocorre uma interrupção do serviço.

Imagem. Ocorre uma interrupção do serviço
Imagem. Ocorre uma interrupção do serviço

Quando isto acontece devido a um desastre, é necessário restabelecer o correto funcionamento dos sistemas e da empresa o mais rápido possível, como é lógico.

Neste ponto, além disso, costuma ser descrito o RPO (Recovery Point Objective), ou Objetivo do Ponto de Recuperação, que basicamente estabelece a quantidade máxima de perda de dados ou perda de serviço medida ao longo do tempo que é aceitável para o nosso negócio.

Este valor de RPO pode variar drasticamente dependendo do serviço afetado e do tipo de negócio ao qual nos dedicamos, bem como de outros parâmetros, como o horário em que acontece.

Imagem. Introdução do RPO
Imagem. Introdução do RPO

Quando falamos em processo de recuperação, falamos do processo que se inicia quando se deteta que o sistema ou serviço está inoperante e começamos a intervenção, até recuperar o funcionamento. Durante este período, o serviço ainda não se recuperou, pelo que ainda não pode ser considerado um serviço produtivo, ou seja, um serviço normal.

O RTO (Recovery Time Objective), ou Objetivo de Tempo de Recuperação, determina o tempo máximo que será tolerável para um serviço crítico retornar ao serviço.

Incluem-se nesta operação as ações para recuperar a arquitetura relevante, colocá-la em funcionamento e recuperar os dados que lhe permitirão funcionar corretamente.

Um exemplo disto poderia ser a falha do servidor que aloja a base de dados do nosso ERP, para a qual deve ser configurado um novo servidor e implementada e recuperada a base de dados, antes que o serviço possa ser recuperado e colocado em produção.

Imagem. Introdução do RTO
Imagem. Introdução do RTO

Mas neste momento ainda não colocámos o serviço em produção. Fizemos a recuperação, mas o sistema ainda não está a servir os nossos clientes ou funcionários, por isso o tempo continua a correr contra nós e continuamos a perder dinheiro.

Neste ponto surge o WRT (Work Recovery Time), ou Tempo de Recuperação do Trabalho, que é o tempo em que o serviço real será recuperado, depois da verificação e arranque dos sistemas, uma vez recuperados com o RTO.

Imagem. Introdução do WRT
Imagem. Introdução do WRT

Neste caso, a soma do RTO mais o WRT é o que se chama de MTD (Maximum Tolerable Downtime), ou Tempo de Inatividade Máximo Tolerável, que basicamente descreve o tempo máximo que o serviço pode ficar inativo antes que as consequências sejam inaceitáveis para a empresa.

O que estamos a introduzir aqui são, de uma forma muito simples, os fundamentos do Disaster Recovery, mas se quiséssemos trabalhar num plano de continuidade de negócio ou de recuperação de desastres deveríamos calcular os valores e ser bem claros sobre quanto tempo podemos aguentar cada um dos serviços de recuperação de desastres e como podemos otimizar tudo para que não haja problemas e seja garantida a sobrevivência.

 

Conclusão:

Esperamos que este artigo tenha sido útil para ajudar a entender o que são RPO, RTO, MTD ou WRT e porque são conceitos importantes para a sobrevivência do seu negócio.

Recomendamos que continue a ler outros artigos desta coleção, que pode encontrar no nosso blog.

Categorias:Cloud e sistemas

Outros artigos que podem interessar-lhe

13 de Novembro de 2024
Temos novas distribuições em Servidores! Em resposta aos múltiplos pedidos de vários dos nossos parceiros, foi ativada a opção
13 de Novembro de 2024
Já é possível configurar modelos de diferentes softwares através do assistente de configuração de servidores. Inauguramos esta funcionalidade do
13 de Novembro de 2024
Integração com QNAP! Agora é possível criar cópias sincronizadas entre dispositivos de armazenamento local QNAP e o nosso serviço