Virtualização

O que Considerar em Switches de Rede para VMware vSAN

VMware
15 de dezembro de 2025
9 min de leitura
Compartilhar:
O que Considerar em Switches de Rede para VMware vSAN

A Escolha do Switch Top of Rack (ToR) Ideal para Ambientes VMware vSAN

Desde que a recente série de artigos sobre o networking do VMware vSAN foi lançada no início deste ano, uma das perguntas mais comuns que recebemos foi: “O que devo usar como switch de rede Top of Rack (ToR) no meu ambiente vSAN?”

Nosso Broadcom Compatibility Guide (BCG) para vSAN detalha a compatibilidade e os requisitos para os hosts que compõem um cluster vSAN, mas não aborda os switches de rede. Quase qualquer switch de rede funcionará com o vSAN, mas isso não significa que todos atendam aos requisitos do seu data center. Existem características nos switches de rede modernos que você deve considerar ao avançar com a sua mais recente atualização de hardware ou na construção de um novo cluster. Vamos analisar o que merece atenção e por que essas especificações são tão importantes.

Por Que os Switches de Rede São Tão Importantes para o vSAN

O vSAN é uma solução de storage distribuído. Ele armazena dados em múltiplos hosts dentro de um cluster para garantir resiliência e disponibilidade dos dados. Os hosts que compõem um cluster vSAN dependem de networking rápido e confiável para fornecer storage consistente e de baixa latência.

Figura 1. O modelo de storage distribuído do vSAN e sua dependência do networking.

O aumento dramático nas capacidades de hardware encontradas em servidores nas últimas duas décadas é impressionante. Os cores de CPU aumentaram entre 32 e 128 vezes em relação ao que eram há 20 anos. O mesmo se aplica à RAM. As capacidades de performance de um storage NVMe moderno melhoraram mais de 2.500 vezes nesse mesmo período.

A magnitude dessas melhorias é quase difícil de acreditar, mas elas foram rapidamente absorvidas por uma demanda cada vez maior das aplicações. Os administradores aumentaram os recursos virtuais atribuídos a essas VMs na tentativa de explorar o poder desse novo hardware e acompanhar as exigências de negócios.

O networking também fez melhorias massivas, mas as percepções sobre a necessidade de networking mais rápido estão lamentavelmente desatualizadas. Por exemplo, o padrão 10GbE sobre cobre foi ratificado em meados dos anos 2000 e se tornou mais prontamente disponível poucos anos depois.

Embora o hardware de servidor tenha melhorado em níveis extraordinários desde então, não é incomum que os clientes insistam que 10Gb ainda é bom o suficiente, mesmo que seu uso prático no data center tenha começado há quase duas décadas. Mesmo hoje, há uma relutância ocasional em migrar para 25Gb, e ainda mais hesitação em migrar para 100Gb. Isso geralmente se deve a alegações infundadas de que melhorias de performance de 4 a 10 vezes no networking não são necessárias, mesmo que outros hardwares tenham aumentado 20, 40 ou até 100 vezes mais no mesmo período.

Para a surpresa de muitos, os custos de switching moderno de 25/100Gb são bastante baixos, especialmente ao considerar alternativas não tradicionais (non-incumbent). Na verdade, esses switches representam frequentemente uma porcentagem muito pequena (de um dígito) do custo total dos hosts em cada rack, mas esses hosts dependem fortemente das capacidades dos switches. Em outras palavras, seus switches ToR não são o lugar para cortar custos.

Um projeto de rede complacente fará com que a rede se torne o bottleneck. Isso pode ser um problema para qualquer tipo de ambiente, mas pode se manifestar mais intensamente quando você usa um sistema de storage distribuído como o vSAN.

O Que Acontece Quando a Rede é o Bottleneck?

Em vez de confiar nos incríveis schedulers encontrados no vSphere e vSAN para compartilhar recursos, o sistema deve aguardar os mecanismos primitivos de controle de congestionamento do TCP.

Figura 2. Comparando uma rede subdimensionada com uma rede superdimensionada.

Por que isso é tão ruim? O impacto de depender do controle de congestionamento de rede é severo. Quando os links de rede estão saturados, pacotes são descartados e precisam ser retransmitidos.

Figura 3. O impacto da perda de pacotes de rede na performance do storage.

Você não apenas obtém uma performance de storage da VM ruim ou inconsistente, mas também acaba subutilizando recursos como CPU e memória nos quais você já investiu em seus hosts. Uma rede subdimensionada também pode experimentar tempos de reparo aumentados durante interrupções e pode ser muito mais difícil de solucionar problemas.

Recomendações para Switches ToR Usados com vSAN

A escolha do switch ToR correto para o vSAN fornecerá o conduto adequado para um storage consistente, de alta performance e baixa latência. Discernir um switch de outro pode ser difícil, pois a maioria é referenciada simplesmente pela largura de banda teórica que uma única porta downlink para um servidor pode fornecer.

Essa notação abreviada de “switches 10Gb”, “switches 25Gb” e “switches 100Gb” facilita a referência, mas desconsidera outras considerações que estão por trás e que têm um impacto material em suas capacidades de performance. Vamos analisar algumas das características que realmente importam.

Com algumas exceções, as informações abaixo não estabelecem mínimos recomendados para switches. Esta abordagem ajuda você a identificar o que observar para comparar um switch com outro, levando em conta as especificações de hardware em constante mudança com novos switches.

Contagem e Velocidade da Porta Downlink

A contagem e a velocidade da porta downlink representam o número de portas e sua respectiva velocidade nativa de wire speed de cada porta a ser usada para hosts em um rack. Elas são tipicamente expressas como [contagem de portas x wire speed], como “32x25Gb”.

Para switches modernos de 25Gb e 100Gb, as portas geralmente serão SFP28 ou QSFP28. Uma velocidade de porta mais alta será a mais benéfica para o tráfego de cluster, como vSAN e vMotion, que permanece dentro dos switches ToR.

Uma contagem de portas mais alta oferece mais flexibilidade e eficiência para servidores. Por exemplo, um par de switches ToR de 32 portas suportará 16 hosts por rack com um máximo de 4 portas por host. Enquanto um par de switches ToR de 48 portas suportará 16 hosts por rack com um máximo de 6 portas por host.

Observe que, com o aumento do número de portas utilizadas, será necessário estar atento à largura de banda total que os switches fornecem ao spine para garantir proporções de oversubscription adequadas. Consulte o artigo “vSAN Networking – Network Oversubscription” para obter mais informações.

Embora o networking 10Gb seja suportado no perfil ReadyNode menor, recomendamos fortemente networking 25Gb ou superior para vSAN ReadyNodes em todos os ambientes greenfield (novos). Consulte o artigo “Driving Down Storage Costs with Lower Hardware Requirements for vSAN” para obter mais informações.

Contagem e Velocidade da Porta Uplink

A contagem e a velocidade da porta uplink representam o número de portas como uplinks para o spine e sua velocidade nativa de wire speed. Elas são expressas da mesma forma que as contagens e velocidades das portas downlink.

Uma largura de banda uplink agregada mais alta para o spine garantirá um nível reduzido de oversubscription, o que melhorará a performance do storage, especialmente se o tráfego atravessar racks. Embora switches com níveis de largura de banda agregada menos do que ideais para o spine não sejam o cenário ideal, é possível limitar o impacto garantindo que os hosts vSAN sejam colocados em racks de maneira otimizada. Consulte o artigo “vSAN Networking – Optimal Placement of Hosts in Racks” para obter mais informações. Essa preocupação também pode ser abordada com o novo recurso de separação de tráfego de rede introduzido no vSAN para VCF 9.0.

Capacidade do Switch (Switch Capacity)

A capacidade do switch indica a taxa de dados mais alta que o switch é capaz de fornecer. Expressa em Gigabits por segundo (Gbps) ou Terabits por segundo (Tbps), um número mais alto indica que ele pode acomodar um volume ou throughput de tráfego mais alto.

Switches de menor performance tendem a ter uma capacidade de switch bem abaixo da largura de banda teórica agregada (line rate) de todas as portas downlink no switch, enquanto switches de maior performance podem atingir ou exceder essa largura de banda. Isso às vezes é conhecido como um switchnon-blocking”. Uma capacidade de switch mais alta também pode ajudar os pacotes a passar menos tempo nos buffers de porta, o que pode reduzir pacotes descartados e retransmissões devido a contenção.

Pacotes por Segundo (Packets Per Second - PPS)

Pacotes por segundo (PPS) representa o número máximo de pacotes que os ASICs do switch podem processar por segundo. Expressa em milhões (Mpps) ou bilhões (Gpps), um número mais alto indica uma taxa mais alta de pacotes que podem ser processados e encaminhados. O PPS efetivo de um switch está frequentemente ligado aos ASICs utilizados e à capacidade de switch anunciada.

Buffers de Porta (Port Buffers)

Os buffers de porta representam a quantidade de memória em um switch usada para pacotes de entrada. É expresso em Gigabytes (GB). Um valor maior ajuda a reduzir pacotes descartados se houver contenção durante o processamento ou encaminhamento. Ele pode reduzir a latência efetiva no storage somente se o tráfego de rede estiver sendo descartado devido a um buffer de porta incomumente pequeno. Tipicamente, um switch com um bufferultradeep” (4GB ou superior) é o mais apropriado para o tráfego vSAN.

Recomendação: Certifique-se de executar as atualizações mais recentes recomendadas em seus switches e garanta que seus adaptadores NIC em seus hosts estejam todos executando o firmware mais recente recomendado.

Resumo

Switches de rede modernos de alta velocidade não estão apenas amplamente disponíveis a um preço acessível, mas permitirão que você explore todo o potencial de performance de seus clusters executando vSAN ESA e evite depender do controle de congestionamento primitivo da rede. Nem todos os switches são criados iguais, mas sua escolha dos switches ToR adequados para o seu ambiente trará dividendos por muitos anos.

@vmpete

Descubra mais no VMware Cloud Foundation (VCF) Blog. Assine para receber as últimas postagens por e-mail.

Precisa de ajuda com suas soluções de TI?

A VirtuAllIT Solutions oferece consultoria especializada em virtualização, cloud computing e infraestrutura tecnológica.