Como um operador pode escalar sem reconstruir a rede

June 8, 2026
Solution Stingray SG Functionality
Como um operador pode escalar sem reconstruir a rede
Os operadores de telecomunicações modernos e os provedores de serviços enfrentam um crescimento contínuo no tráfego e nas exigências de processamento e análise. A plataforma Stingray da VAS Experts oferece uma solução que não apenas proporciona controle total do tráfego nos níveis L2–L7, mas também permite aumentar facilmente a capacidade conforme necessário.

Neste artigo, analisaremos como o dimensionamento da plataforma Stingray é implementado, quais componentes participam do esquema de cluster e como um operador pode aumentar o desempenho de um único nó até configurações de terabits.

O limite de um nó de processamento de tráfego

Imaginemos um operador regional. Ele possui vários milhares de assinantes, tráfego de pico noturno de dezenas de gigabits, IPTV, torrents, jogos online, videochamadas, clientes corporativos e requisitos legais para filtragem de recursos proibidos.

No início, um único nó Stingray pode funcionar como ponto unificado de processamento do tráfego de assinantes. Baseada na tecnologia de Inspeção Profunda de Pacotes (Deep Packet Inspection), a plataforma Stingray executa as seguintes funções:

  • BNG/BRAS (Broadband Network Gateway / Broadband Remote Access Server);
  • Carrier Grade NAT (tradução de endereços de rede IPv4);
  • Controle de largura de banda do canal (Quality of Service);
  • Filtragem de tráfego;
  • Coleta de estatísticas e análise (Network Visibility and Quality of Experience).

Em seguida, o operador começa a crescer. Novos bairros surgem, o consumo de vídeo aumenta, o volume de tráfego móvel e OTT cresce, clientes corporativos se conectam e a linha de tarifas se expande.

Quando o tráfego na rede aumenta, um único nó pode não conseguir mais lidar com seu processamento. O operador então precisa expandir os recursos computacionais ou alterar o esquema de processamento de tráfego.

volume de processamento de tráfego

Na primeira etapa, o operador geralmente utiliza o escalonamento vertical. O software Stingray é migrado para um servidor mais potente com maior margem em CPU, memória e interfaces de rede.

Abordagem Como funciona Quando se aplica Onde aparece o limite
Escalonamento vertical A licença Stingray é migrada para um servidor mais potente Quando um único servidor oferece desempenho suficiente CPU, memória, interfaces, custo e limitações físicas do servidor
Escalonamento horizontal O tráfego é distribuído entre vários servidores Quando um único servidor não oferece mais a margem necessária ou é necessária expansão O tráfego deve ser distribuído corretamente entre os servidores sem balanceadores de carga adicionais
Cluster com múltiplos NPBs (Balanceadores) NPBs e servidores adicionais são incluídos no esquema Quando é necessário crescer até valores de terabits O escalonamento depende do desempenho do NPB, do número de nós e da redundância N+X

Abordagens de escalonamento

Mas o crescimento vertical não é ilimitado. Um servidor tem um teto físico em termos de CPU, memória, lanes PCIe, placas de rede, resfriamento e custo de configuração.

Inicialmente, substituir um nó por um mais potente ajuda a absorver o crescimento da carga. Mas se cada novo aumento de tráfego for tratado apenas com a substituição de servidores, o custo da expansão cresce rapidamente e a margem de desempenho volta a ser temporária.

Ao mesmo tempo, a arquitetura não muda. Todo o processamento ainda está concentrado em um único ponto pelo qual passa um volume crítico de tráfego de assinantes.

Quando um único nó não oferece mais a margem necessária, o sistema é migrado para um esquema de cluster.

Como funciona o esquema de cluster com um Network Packet Broker (NPB)

A plataforma Stingray escala por meio da adição linear de balanceadores de tráfego NPB (Network Packet Broker) e servidores de processamento. Esse esquema permite aumentar o desempenho gradualmente, sem substituir os componentes centrais e sem reconstruir a lógica de rede — basta adicionar novos elementos ao cluster.

Para a rede do operador, a plataforma permanece como um dispositivo L2 transparente e continua operando em modo inline.

Os principais elementos que participam do escalonamento:

  • NPB — dispositivo de balanceamento de tráfego que distribui os fluxos entre os nós de processamento e mantém a passagem simétrica de sessões dentro de cada servidor Stingray. Em combinação com os switches de bypass, participa de um esquema tolerante a falhas para o fluxo de tráfego.
  • Servidores de processamento — servidores de uso geral x86_64 com placas de rede Mellanox/Intel executando o software Stingray para análise profunda de tráfego.
  • Switches de bypass — dispositivo que garante a continuidade da comunicação redirecionando automaticamente o tráfego diretamente pela rede em caso de falha do sistema de processamento.
  • O gerenciamento é realizado via NMS. Por meio da interface gráfica, são configurados perfis, políticas, regras de filtragem, listas, protocolos personalizados e parâmetros de monitoramento.

Cada nó da plataforma pode operar de forma independente ou fazer parte de um cluster. No esquema de cluster, o NPB distribui os fluxos entre os servidores com base no algoritmo de balanceamento e no estado atual dos nós.

A lógica de processamento típica é a seguinte:

  1. O tráfego do operador chega ao bypass óptico.
  2. Pelo bypass, é encaminhado ao NPB.
  3. O NPB distribui o tráfego entre os nós de processamento.
  4. O tráfego de saída e entrada de uma única sessão/assinante é direcionado para o mesmo nó de processamento Stingray.
  5. No nó Stingray, o tráfego é analisado, as políticas de QoS são aplicadas, a filtragem web é realizada, a tradução de endereços CG-NAT ou as funções completas de BNG/BRAS são executadas.
  6. Após o processamento, o tráfego retorna à linha pelo NPB e pelo BYPASS.

lógica de processamento de tráfego
Lógica de processamento do tráfego de rede utilizando NPB e DPI

Dependendo do cenário, o balanceamento pode ser estruturado de formas diferentes. Para cenários DPI, o balanceamento no nível de sessões individuais é aceitável. Para BNG e CG-NAT, é utilizado um esquema subscriber-aware, onde todo o tráfego de um único assinante é processado por um único nó.

Se houver assimetria de rotas na rede — por exemplo, o tráfego de entrada e saída passa por sites diferentes — é utilizado o espelhamento APENAS DO TRÁFEGO DE SAÍDA entre os NPBs de sites diferentes. Nesse caso, uma cópia do fluxo é transmitida entre os sites e usada para a análise correta da sessão. Após o processamento, o tráfego espelhado é descartado e não participa das estatísticas. Isso não implica custos adicionais significativos, pois o tráfego de saída não representa mais de 10% do tráfego de entrada.

Esse cenário é especialmente importante para redes distribuídas onde o tráfego de um assinante pode passar por diferentes pontos de presença.

Como o desempenho é escalado

O cluster se expande em etapas. Dentro do esquema atual, servidores para o Stingray podem ser adicionados. Quando a capacidade da camada de balanceamento se torna insuficiente, novos NPBs são adicionados.

Um NPB com 64 portas 100G é projetado para 1,2 Tbps de tráfego total, dos quais 1 Tbps é download e 200 Gbps é upload.

Um máximo de até 8 NPBs pode ser incluído em um cluster. Nessa configuração, a taxa de transferência total chega a 9,6 Tbps.

Exemplo de escalonamento de cluster
Exemplo de escalonamento de cluster com 4 NPBs: 4xNPB = 4,8 Tbps de tráfego total (4 Tbps de download + 800 Gbps de upload)

Para os servidores DPI, o cálculo é feito separadamente. Dependendo da configuração, a carga de trabalho calculada pode variar de 120 a 360 Gbps de tráfego total por nó. No entanto, o número final de nós sempre depende do perfil de tráfego, PPS, número de sessões, traduções NAT, do conjunto de funções habilitadas e do coeficiente de redundância que o operador deseja incluir.

Configuração Tráfego total Download Upload
1 NPB 1,2 Tbps 1 Tbps 200 Gbps
2 NPB 2,4 Tbps 2 Tbps 400 Gbps
3 NPB 3,6 Tbps 3 Tbps 600 Gbps
4 NPB 4,8 Tbps 4 Tbps 800 Gbps
8 NPB 9,6 Tbps 8 Tbps 1,6 Tbps

Por exemplo, se um operador constrói um cluster dimensionado exatamente para a carga atual, qualquer pico noturno ou falha de nó causará imediatamente uma sobrecarga. Por isso, os esquemas industriais incluem uma reserva N+X. Alguns nós de processamento são designados como reservas do cluster. Se um servidor falhar, o NPB redistribui os fluxos de tráfego para os nós restantes e o cluster continua a processar o tráfego.

Uma característica importante desta arquitetura é que o crescimento acontece em etapas. O operador não precisa adquirir antecipadamente a configuração máxima. A rede pode começar com um único NPB e alguns servidores de processamento de tráfego e, em seguida, receber nós adicionais conforme a base de assinantes ou as funções conectadas crescem.

Ao escalar um cluster, recomenda-se utilizar servidores de capacidade igual.

Redundância, Heartbeat e Bypass

O escalonamento não deve transformar a rede em uma estrutura onde a falha de um único servidor comprometa todo o segmento. Por isso, no esquema de cluster do Stingray, a redundância é construída em vários níveis.

BYPASS óptico externo e controle de integridade dos nós DPI

Para os cenários DPI e PCEF, é utilizado um BYPASS óptico externo. Os links do operador são conectados em modo break-in por meio de um switch de bypass. Ele monitora o estado do sinal na linha e o funcionamento de todos os componentes de todo o complexo. Se ocorrer uma falha crítica do servidor de processamento ou do balanceador, o bypass passa o tráfego diretamente, eliminando o impacto. A conectividade da rede é mantida, mas as funções DPI são temporariamente suspensas.

Passagem do tráfego pelo bypass óptico
Passagem do tráfego pelo bypass óptico nos modos habilitado e desabilitado

A integridade do cluster é monitorada por meio de um mecanismo de heartbeat. O NPB pode identificar quais servidores estão disponíveis e utiliza apenas os nós ativos. Se um dos nós parar de responder, o balanceador o remove do esquema de distribuição e direciona os novos fluxos de tráfego para os servidores restantes.

Redundância N+X

Para todas as funções da plataforma Stingray, é aplicada a redundância N+X. Recursos computacionais adicionais são incorporados ao cluster, permitindo que ele sobreviva à falha de nós individuais sem sobrecarregar imediatamente o sistema.

Ao projetar essa reserva, é importante considerar não apenas a carga atual, mas também o comportamento do cluster após uma falha.

Se após uma falha os servidores restantes receberem mais tráfego do que conseguem processar, a qualidade do processamento pode começar a se degradar mesmo enquanto o serviço permanece operacional. Por isso, recomenda-se planejar uma carga de 80% do desempenho máximo em cada nó Stingray.

Conclusão

O escalonamento do Stingray segue um esquema linear. Um operador pode começar com um único nó e depois migrar para um esquema de cluster com múltiplos NPBs e uma capacidade combinada de 9,6 Tbit/s.

Essa arquitetura fornece um caminho de expansão claro. A taxa de transferência cresce com a adição de componentes, o gerenciamento de políticas permanece centralizado e a própria plataforma continua operando como um dispositivo L2 transparente para a rede do operador.

Se o seu negócio requer um sistema que cresça com você — a arquitetura Stingray oferece uma estratégia de expansão pronta e comprovada sem reconstruir o esquema lógico da rede.