A cada novo lançamento, surgem novas funcionalidades e aprimoramentos. Algumas capacidades e seus benefícios são óbvios, mas visam desafios e situações específicas. Outros aprimoramentos parecem sutis e talvez fáceis de ignorar, mas impactam múltiplas funcionalidades e beneficiam quase todos os clientes em suas tarefas diárias. O novo recurso Auto-RAID do vSAN no VMware Cloud Foundation (VCF) 9.1 se enquadra nesta última categoria e representa uma melhoria profunda na gestão da resiliência de dados para clusters vSAN. Vamos analisar o que é o Auto-RAID, o que ele faz e como ele muda a gestão da resiliência de dados no vSAN.

Contexto

As políticas de armazenamento desempenharam um papel crítico na gestão de dados do vSAN, pois definem o estado ou resultado desejado para uma ou mais VMs. Ao contrário do armazenamento tradicional que usa um sistema de arquivos de cluster como o VMFS, o vSAN permite que os clientes atribuam granularmente níveis de resiliência e outras configurações às suas VMs, dependendo de suas necessidades. Isso foi particularmente útil com a vSAN Original Storage Architecture (OSA) porque havia compensações de desempenho e eficiência na escolha de diferentes níveis de resiliência e tipos de posicionamento de dados. Embora flexíveis, as políticas de armazenamento frequentemente deixavam os clientes se perguntando qual seria a melhor política de armazenamento para configurar em seus clusters.

A vSAN Express Storage Architecture (ESA) eliminou as compensações técnicas entre espelhamento de dados e erasure coding, e reduziu a necessidade de múltiplas políticas personalizadas. O "Auto-Policy Management", introduzido no vSAN 8 U1, facilitou a gestão de políticas no vSAN ESA ao criar automaticamente uma política de armazenamento padrão específica para cada cluster vSAN, com base nas características do cluster. Embora tenha sido um passo na direção certa, era mais um motor de recomendação construído em torno de uma abordagem clássica às políticas de armazenamento.

Apresentando o Auto-RAID

O Auto-RAID no vSAN para VCF 9.1 oferece uma abordagem totalmente gerenciada pelo sistema para armazenar seus dados da maneira mais resiliente e eficiente em termos de espaço possível. Ele faz isso de uma maneira elegante que não era possível com o Auto-Policy Management. Vamos analisar algumas das características principais que tornam o Auto-RAID tão atraente.

Abordagem Escalável de Política de Armazenamento Única

Para o VCF 9.1, haverá uma única "vSAN ESA Auto RAID Policy" armazenada no vCenter Server que controlará todos os clusters vSAN 9.1, independentemente do tamanho e tipo do cluster. Esta política não possui configurações explícitas de resiliência, mas detecta e aplica as configurações ideais de resiliência para cada cluster com base em suas características, como tipo de cluster, contagem de hosts, etc. Essa abordagem ajuda a reduzir a desordem de dezenas ou centenas de políticas de armazenamento para acomodar diferentes tipos de clusters e condições.

Figura 1. Uma única política de armazenamento impulsionando múltiplos tipos e configurações de cluster

Acomoda Mudanças no Cluster Dinamicamente

Alterações em um cluster, como adicionar ou remover hosts, serão ajustadas automaticamente para a resiliência de dados ideal para a nova configuração. Imagine um cenário onde você está criando um novo cluster, inicializando um único host para a configuração inicial. O vSAN Auto-RAID permitirá que você crie novas VMs automaticamente sem a necessidade de uma regra de "Provisionamento Forçado" anteriormente exigida, para que você possa começar a construir o cluster facilmente. À medida que você adiciona hosts, ele usará automaticamente o erasure code apropriado para alcançar a quantidade máxima de resiliência de dados.

Configurações de Política Simplificadas

Com a resiliência de dados tratada automaticamente, as regras de política disponíveis se concentrarão em configurações específicas da VM. Essas regras de política incluem:

Limites de IOPS. Usados para limitar a E/S de armazenamento para VMs especificadas.
Reservas de Espaço de Objeto (OSR). Garante capacidade livre para VMs especificadas.
Localidade de Site de Stretched Cluster. Acomoda condições em que você pode ter algumas cargas de trabalho em um stretched cluster que residem apenas em um site, e não devem ter os dados espelhados para o outro site.

Se alguma das opções acima for necessária, você pode criar uma nova política de armazenamento, habilitar a opção "vSAN ESA Auto-RAID" e definir a configuração desejada, aplicando-a então às VMs específicas que você deseja.

Figura 2. Uma política de armazenamento impulsionada pelo Auto-RAID

Para clusters habilitados para Auto-RAID, outras regras de política de armazenamento que não são mais aplicáveis ao vSAN ESA não serão exibidas na política. Isso inclui:

Provisionamento forçado (agora tratado automaticamente)
Número de stripes de disco por objeto (não aplicável)
Reserva de cache de leitura flash (não aplicável)
Desabilitar checksum (não aplicável)
Compressão (agora um serviço de cluster sempre ativo no vSAN para VCF 9.1)

Configurações de Resiliência do Auto-RAID

A lógica que o Auto-RAID usa para as configurações de resiliência é notavelmente diferente das versões anteriores do vSAN ESA. Quando a resiliência é possível, ele sempre padronizará para erasure coding eficiente em termos de espaço para tudo, exceto resiliência de site para stretched clusters e resiliência de host para topologias de 2 nós. Nesses casos, a Tolerância a Desastres de Site será definida como um espelhamento.

Clusters padrão de site único:
- 6 ou mais hosts em um cluster – O Auto-RAID usará FTT=2 com RAID-6, resultando em um overhead de capacidade de objeto de 1.5x.
- 3-5 hosts em um cluster – O Auto-RAID usará FTT=1 com RAID-5, resultando em um overhead de capacidade de objeto de 1.5x.
- Menos de 3 hosts em um cluster – O Auto-RAID usará FTT=0, resultando em um overhead de capacidade de objeto de 1.0x.
Stretched clusters:
- 6 ou mais hosts por site/domínio de falha – O Auto-RAID usará uma tolerância a desastres de site de um espelhamento RAID-1, mais FTT=2 com RAID-6, resultando em um overhead de capacidade de objeto de 3.0x.
- 3-5 hosts por site/domínio de falha – O Auto-RAID usará uma tolerância a desastres de site de um espelhamento RAID-1, mais FTT=1 com RAID-5, resultando em um overhead de capacidade de objeto de 3.0x.
- Menos de 3 hosts por site/domínio de falha – O Auto-RAID usará uma tolerância a desastres de site de um espelhamento RAID-1, mais FTT=0, resultando em um overhead de capacidade de objeto de 2.0x.
Clusters de 2 nós:
- 6 ou mais dispositivos de armazenamento por host – O Auto-RAID usará uma tolerância a desastres de site de um espelhamento RAID-1, mais FTT=0, resultando em um overhead de capacidade de objeto de 2.0x. (Níveis secundários de resiliência não estão atualmente disponíveis para clusters de 2 nós usando Auto-RAID no 9.1.)
- 3-5 dispositivos de armazenamento por host – O Auto-RAID usará uma tolerância a desastres de site de um espelhamento RAID-1, mais FTT=0, resultando em um overhead de capacidade de objeto de 2.0x. (Níveis secundários de resiliência não estão atualmente disponíveis para clusters de 2 nós usando Auto-RAID no 9.1.)
- Menos de 3 dispositivos por host – O Auto-RAID usará uma tolerância a desastres de site de um espelhamento RAID-1, mais FTT=0, resultando em um overhead de capacidade de objeto de 2.0x.

Isso significa que o overhead padrão para clusters padrão será de 1.5x, stretched clusters será de 3x e clusters de 2 nós será de 2x. Este overhead de capacidade é anterior às economias de compressão e deduplicação. Um item notável é que, quando o Auto-RAID atribui FTT=1 usando RAID-5, ele sempre usará o esquema 2+1. O erasure code RAID-5 4+1 opcional em versões anteriores do vSAN ESA não é usado.

Overheads Simplificados Usando Aplicação em Todo o Cluster

O Auto-RAID assume a responsabilidade pelo nível ideal de resiliência para os dados no cluster e o aplica em todo o datastore. Um dos benefícios dessa abordagem são os overheads de capacidade consistentes dentro de um cluster. É um dos principais impulsionadores (e um requisito) da nova visualização "Effective Capacity" no vSAN para VCF 9.1, que renderiza o uso da capacidade de armazenamento em capacidade efetiva real, muito parecido com o armazenamento tradicional. Mais sobre este recurso em breve! Essa padronização de overheads também facilitará muito as estimativas de capacidade para exercícios de design e dimensionamento.

Auto-RAID em Clusters Novos Versus Existentes

Seja você começando do zero ou atualizando, o caminho para usar o Auto-RAID é projetado para ser flexível e não disruptivo. Todos os novos clusters serão configurados para usar o Auto-RAID por padrão. Clusters existentes manterão suas políticas de armazenamento auto-gerenciadas existentes ou sua política configurada por Auto-Policy Management. No entanto, haverá um alerta de saúde que recomendará o uso do Auto-RAID.

Existem duas maneiras de fazer a transição para usar o Auto-RAID com clusters atualizados para o VCF 9.1.

Opção 1: Alterar todos os objetos para a "vSAN ESA Auto RAID Policy" e a política padrão do datastore para "vSAN ESA Auto-RAID Policy". Isso garante que todos os objetos usem a única política que prescreve o nível ideal de resiliência para o cluster. Isso pode ser feito no vSphere Client clicando em "Datastores" e selecionando o datastore vSAN, seguido por clicar em Configure > General > Edit e escolhendo "vSAN ESA Auto-RAID Policy". Esta é a maneira mais limpa de fazer a migração, pois permitirá que você eventualmente remova políticas de armazenamento não utilizadas do vCenter Server.
Opção 2: Habilitar "Apply Auto-RAID to all objects". Este é um mecanismo simples e abrangente para garantir que todos os objetos estejam usando o Auto-RAID, independentemente das políticas de armazenamento auto-gerenciadas anteriores aplicadas. Encontrado ao destacar o cluster, clicando em Configure > vSAN > Services > Storage > Edit, ele ajuda a acomodar fluxos de trabalho legados e políticas personalizadas já existentes. Embora este método seja rápido e fácil, nomes de políticas de armazenamento antigos podem continuar vinculados a alguns de seus clusters. Isso também significa que desativar a configuração pode reconfigurar objetos de volta para sua configuração de política de armazenamento antiga. A abordagem descrita na "Opção 1" torna a opção irrelevante.

Figura 3. Opções de cluster com um cluster vSAN ESA no VCF 9.1

Recomendação: Se você habilitou a opção "Apply Auto-RAID to all objects" para clusters atualizados, mantenha-a ativada. Desativá-la pode iniciar reconfigurações de objetos no cluster e desabilitará sua capacidade de usar a nova visualização "Effective Capacity" no vSAN para VCF 9.1.

Para evitar picos de desempenho durante essas transições, o vSAN inteligentemente limita a reconfiguração de objetos existentes, garantindo que suas cargas de trabalho de produção mantenham seus níveis de desempenho enquanto os dados são movidos para seu novo estado ideal. Na maioria dos casos, este tipo de mudança não gerará muito tráfego de ressincronização. Por exemplo, um cluster vSAN ESA com seis ou mais hosts provavelmente já está usando algum tipo de política de armazenamento RAID-6. Nesse caso, alterá-lo para Auto-RAID não gerará nenhum tráfego de ressincronização. Apenas uma pequena mudança de metadados ocorrerá, associando esses objetos à nova política Auto-RAID.

Você pode notar na figura acima que o "Auto-Policy Management" ainda existe como uma opção de configuração. Isso deve ser usado em um ambiente VCF 9.1? Não. Ele permanece para fins de compatibilidade com clusters atualizados que estavam usando o recurso antes de uma atualização. Clusters existentes podem ser movidos para usar o Auto-RAID usando uma das duas opções descritas acima.

Para mais informações sobre o vSAN Auto-RAID no vSAN para VCF 9.1, consulte os documentos vSAN Availability Technologies, vSAN Space Efficiency Technologies e vSAN FAQs.

Resumo

Embora existam algumas limitações atuais, como resiliência secundária em clusters de 2 nós e fluxos de trabalho específicos de conversão de stretched para padrão, o Auto-RAID é o futuro para a resiliência de dados auto-gerenciada no vSAN. Ele simplifica a experiência do usuário, reduz o erro humano e garante que a "resiliência ideal" não seja apenas um objetivo, mas um estado permanente.

@vmpete Descubra mais no Blog VMware Cloud Foundation (VCF) Assine para receber as últimas postagens em seu e-mail. Digite seu e-mail… Assinar

Como parceiro certificado da VMware, a VirtuAllIT pode auxiliar sua empresa na avaliação, planejamento e implementação do vSAN Auto-RAID no VMware Cloud Foundation 9.1, garantindo uma transição suave e o aproveitamento máximo dos benefícios de resiliência e eficiência de armazenamento.

Auto-RAID no VMware vSAN para VCF 9.1 – Resiliência de Dados Gerenciada pelo Sistema Abrangente

Precisa de ajuda com suas soluções de TI?