Descubra o que é um array de discos distribuídos ou RAID de discos, alguns dos diferentes tipos que existem e quais as vantagens de cada um deles.
Um RAID de discos é uma matriz de discos independentes configurados como um grupo para fornecer redundância ou recursos de distribuição que não possuem de forma independente.
O nome RAID vem da sigla em inglês “Redundant Array of Independent Disks” que se pode traduzir como matriz redundante de discos independentes.
A vantagem original da utilização de um RAID de discos é que proporcionava os benefícios de sistemas mais recentes, de alta potência e com um preço exorbitante, com a utilização de tecnologias mais antigas, com materiais que já estavam disponíveis. Isto gerava um melhor ROI (retorno sobre o investimento) e, portanto, uma melhor utilização da infraestrutura.
Existem diferentes tipos de configuração, geralmente chamados níveis de RAID, que fazem o sistema comportar-se de uma forma ou de outra e, portanto, diferem nas suas propriedades em relação a outros tipos de RAID e, claro, ao uso de discos independentes.
Diferentes configurações de RAID buscam fornecer vantagens diferentes em relação aos discos independentes:
- Mais capacidade.
- Mais resistência a falhas.
- Mais velocidade de gravação e leitura.
A base dos níveis RAID é na verdade bastante simples e consiste em replicar ou distribuir os dados que neles devem ser armazenados, quer seja para ter um melhor desempenho (leitura, gravação ou ambos) ou para redundar os dados para lidar com possíveis avarias dos discos componentes.
Além disso, conforme descrito anteriormente, outra vantagem obtida ao trabalhar com configurações RAID é que o sistema operativo ou aplicações para as quais foi configurado veem a configuração dos discos (quer sejam dois ou mais) como um único volume lógico, quase como um único disco, o que torna as operações do disco significativamente mais simples.
Quais são os arranjos ou níveis de RAID de discos existentes?
Existem vários tipos de configurações disponíveis dependendo da sua origem. Neste caso não nos estamos a referir aos níveis, que dependem da sua configuração, estamos a falar da sua origem. Temos três tipos:
- Tipo 1: RAID padrão.
- Tipo 2: RAID combinados.
- Tipo 3: RAID proprietários.
Vamos abordar alguns tipos de cada tipo, pois falar de todos eles é totalmente impossível num só artigo.
RAID padrão:
Dentro dos níveis RAID padrão temos bastantes configurações possíveis: RAID 1, 2, 3, 4, 5, 6 e variações. Na realidade, quase todas as empresas usam as mesmas três configurações: RAID 0, RAID 1 e RAID 5. Vamos falar também sobre RAID 3, porque precisamos de o conhecer para falar sobre RAID 30. O resto das configurações são pouco utilizadas, por isso vamos ignorá-las neste artigo.
RAID 0:
Este é o nível mais básico de RAID, em que o objetivo não é redundar a informação, mas distribuí-la entre os diferentes discos que compõem o conjunto. É por isso que é denominado Spanned Volume ou Volume Estendido.
Neste nível, os dados gravados são distribuídos uniformemente entre os diferentes discos integrados na solução, gravando um dado no primeiro, o próximo no segundo, e assim por diante. O que ganhamos com isto? Está claro que não obtemos redundância, pois se um dos discos falhar, os dados podem ser perdidos. O que se consegue com este modelo é ganhar velocidade na escrita e leitura de dados, já que é possível aceder aos vários discos simultaneamente.
Em relação aos tamanhos e utilização de espaço, se tivermos dois discos de 1 TB, o tamanho total do RAID será de 2 TB. Se tiver dois discos, um de 1 TB e outro de 2 TB, o que vai acontecer é que será gerado um espaço de 2 TB, pois o espaço em disco que é útil e permite simetria é de 1 TB por disco, deixando uma soma de 2 TB e deixando 1 TB não utilizado, o que resultará num desperdício de 1 TB que representa 33% do espaço disponível.
Para fazer uma configuração RAID 0 são necessários dois discos, pois devemos ser capazes de distribuir as informações por vários discos.
RAID 1:
A segunda configuração mais simples e a primeira com certo nível de redundância é RAID nível 1. Este RAID consiste num grupo de dois ou mais discos em que todos recebem os mesmos dados, ou seja, o que é copiado para o primeiro disco é espelhado nos demais discos que compõem o RAID, por isso é conhecido como Mirrored ou Espelhado.
Ao criar este RAID, devem ser levadas em consideração duas coisas:
- Algum espaço em disco será desperdiçado porque os mesmos dados serão copiados duas vezes, que é o objetivo desta configuração: a redundância.
- Algum espaço em disco será desperdiçado se ambos tiverem tamanhos diferentes, pois como é necessário ter uma cópia idêntica dos dados, se usarmos dois discos de tamanhos diferentes, será tomado como referência aquele com menor capacidade. Ou seja, se usarmos um disco de 2 TB e outro de 1 TB, por exemplo, o RAID terá um tamanho de 1 TB.
Para fazer uma configuração RAID 1 são necessários dois discos, pois devemos ser capazes de guardar as informações em vários discos, transferindo uma cópia exata de um para o outro para conseguir a redundância.
NOTA: O tempo de reconstrução e recuperação desde o momento em que uma falha de disco é detetada e respondida, acrescido à substituição e reconstrução do conjunto RAID no novo disco que substitui o disco com falha, representa um período de vulnerabilidade para o conjunto RAID e, portanto, deve ser minimizado. Este tempo cresce proporcionalmente com o tamanho dos discos, pois será necessário “movimentar” mais volume de dados.
RAID 3:
O nível RAID 3 não é tão amplamente utilizado como os anteriores ou como o RAID 5, mas vamos analisá-lo, pois é usado para construir o RAID 30 ou RAID 3+0, que gozam de alguma popularidade.
O RAID 3 utiliza uma cópia de dados dividida entre todos os discos de dados disponíveis, mantendo também um disco adicional para paridade, pelo que poderíamos dizer que se trata de um RAID com capacidades superiores.
Como de costume, usar vários discos para copiar dados permitirá obter taxas de transferência muito mais altas do que se os copiarmos para um único disco.
Para fazer uma configuração RAID 3 são necessários três discos, já que devemos ser capazes de distribuir as informações por vários discos e adicionar um disco adicional para paridade.
RAID 5:
A próxima configuração amplamente usada é o RAID 5, comummente chamado de “volume distribuído com paridade”.
Neste modelo, os dados são divididos (distribuídos) por todos os discos disponíveis, acrescentando também uma unidade dedicada à paridade que permite a reconstrução em caso de desastre.
Quando começamos a falar sobre RAID no início do artigo, mencionamos que grande parte da popularidade do RAID é que este fornece redundância a um custo muito baixo, e pode-se dizer que este é um modelo que cumpre essa premissa.
Para criar uma configuração RAID 5, são necessários no mínimo três discos, pois devemos conseguir distribuir as informações por vários discos, além de adicionar um novo disco com as informações de paridade.
Este RAID, com 3 discos ou mais, permite ter uma falha num deles e não ter perda de dados. Por outro lado, e dado que existe um disco dedicado à paridade, teremos sempre uma disponibilidade inferior, já que esta é uma relação de “n-1” discos, ou seja, se tivermos 4 (como no diagrama), um deles será o disco de paridade, que não estará disponível para escrita de dados úteis.
Isto significa que, se tivermos uma distribuição de 4 discos de 1 TB, o tamanho disponível deveria ser de 4 TB, mas como um deles não está habilitado para uso e sim como paridade, passa a ser de 3 TB.
Este sistema permite que um dos discos falhe, mas se ocorrer uma segunda falha antes que o primeiro disco seja substituído e as operações de reconstrução sejam concluídas, haverá perda de dados.
RAID 6:
Agora que acabamos de ver o RAID 5, temos de dizer que o RAID 6 é semelhante, mas tem capacidade para suportar a perda de dois discos, pois se o RAID 5 tinha “n-1” discos úteis, no caso do RAID 6 são n-2. Assim, quando um disco falha, outro entra em operação, constituindo uma configuração RAID 5 + Spare.
Portanto, para fazer uma configuração RAID 6 são necessários no mínimo quatro discos, pois devemos conseguir distribuir as informações por vários discos, além de adicionar dois discos para tolerância a falhas.
Nem tudo são vantagens neste tipo de configurações: além do aumento de custo, devemos também ter em conta que o número de tarefas de escrita para cálculos de paridade e outros aumenta, portanto tem um processo de gravação mais lento que o RAID 5, embora este seja um pequeno preço a pagar em troca de maior redundância.
Desta forma, está feita a análise de alguns dos RAID padrão mais usados.
RAID combinados:
A seguir, vamos falar sobre alguns dos níveis de RAID combinados.
RAID 0+1:
A configuração deste nível RAID é algo simples. Consiste em criar uma configuração RAID 0 e por cima uma configuração RAID 1, ou seja, combinar os níveis.
Nesta estrutura, os discos são adicionados agrupados em pares, de forma que cada um deles forme um RAID 0, ou seja, uma estrutura de distribuição de dados para todos os discos. No segundo nível estruturamos o RAID 1, ou seja, uma cópia espelhada do anterior.
Para fazer uma configuração RAID 0+1, são necessários pelo menos quatro discos, pois devemos conseguir distribuir as informações por vários discos além de adicionar um segundo exatamente da mesma estrutura, para poder construir os dois níveis de RAID.
A estrutura desta configuração é capaz de suportar a falha de um disco, mas se um segundo disco falhar, todo o RAID ficará comprometido.
RAID 1+0:
Tal como acontece com o RAID 0+1, a configuração RAID 1+0 (também conhecido como RAID 10) consiste em criar uma configuração RAID 1 e uma configuração RAID 0, combinando ambos os níveis.
Para fazer uma configuração RAID 1+0 são necessários pelo menos quatro discos, portanto o custo é o mesmo de um RAID 6 mas, em troca, assim como nesse nível, podemos ter falhas em até dois discos sem problemas.
Esta configuração dá-nos a velocidade de acesso do RAID 0 e a tolerância a falhas do RAID 1, por isso acaba por ser um RAID mais ou menos seguro, com boa velocidade e boa capacidade de recuperação de falhas, pelo que é bastante utilizado em servidores de bases de dados.
RAID 30:
O nível RAID 30, também conhecido como RAID 3+0, é uma configuração de partição com conjunto de paridade, ou seja, a combinação de RAID 3 e RAID 0. O RAID 30 tem a vantagem de proporcionar altas taxas de transferência acompanhadas de alta fiabilidade e resiliência. Por outro lado, possui um alto custo de instalação, pois requer um grande volume de discos.
Numa configuração RAID 30, um disco pode falhar em cada conjunto RAID 3, e como acontece nesse tipo de configuração, até que o disco seja substituído e a informação seja reconstruída, existe a possibilidade de ocorrer um erro catastrófico que comprometa todo o conjunto.
Para fazer uma configuração RAID 30 são necessários seis discos, pois devemos poder distribuir a informação por vários discos e adicionar um disco adicional para paridade, além de replicar para um segundo grupo RAID 3 com o qual será composto o RAID.
RAID 50:
O nível RAID 50 que, como nos casos anteriores, é por vezes conhecido pela sua denominação RAID 5+0 por ser a combinação destas duas, é uma configuração RAID 0, que por sua vez se divide em elementos RAID 5.
O que torna este sistema robusto é que pode haver uma falha em cada conjunto RAID 5 sem afetar o sistema, mas no período entre o momento em que ocorre a falha até à sua substituição, que é o tempo de vulnerabilidade, a integridade de todo o conjunto global pode ser comprometida em caso de falha noutro disco.
Em termos de desempenho, o RAID 50 tem melhor desempenho que o RAID 5, principalmente na escrita, e também é muito interessante para aplicações que exigem uso intensivo de leitura de dados em posições não sequenciais.
Para fazer uma configuração RAID 50 são necessários doze discos, pois devemos poder gerar três blocos RAID 5 que também estão vinculados a um RAID 0.
RAID proprietários:
Os RAIDs que vimos até agora são configurações públicas que podem ser utilizadas sem problemas em qualquer tipo de sistema, desde que exista compatibilidade e suporte.
A seguir listaremos uma série de níveis de RAID que são proprietários, ou seja, possuem configurações ou especificações proprietárias desenvolvidas por uma ou mais empresas. Para estas configurações não iremos fornecer mais detalhes, já que a ideia é apenas enumerar alguns dos mais usados:
- RAID Z.
- RAID 50EE.
- RAID Matrix.
- RAID S.
- RAID 7.
- …
Com isto terminamos esta breve revisão dos principais tipos de RAID existentes.
Conclusões e próximos passos:
Ao longo deste artigo falámos sobre o que é RAID, quais são as suas diferentes configurações ou níveis (pelo menos os mais utilizados) e a sua utilidade.
Desta vez não vamos falar sobre como fazer a configuração em servidores Windows, já que isto foi abordado noutros tutoriais do nosso blog, como:
Recomendamos-lhe uma visita ao nosso blog para ver outros conteúdos relacionados com a administração de sistemas, cloud, etc.
Agradecemos a sua confiança!