Neste artigo, analisaremos como o dimensionamento da plataforma Stingray é implementado, quais componentes participam do esquema de cluster e como um operador pode aumentar o desempenho de um único nó até configurações de terabits.
O limite de um nó de processamento de tráfego
Imaginemos um operador regional. Ele possui vários milhares de assinantes, tráfego de pico noturno de dezenas de gigabits, IPTV, torrents, jogos online, videochamadas, clientes corporativos e requisitos legais para filtragem de recursos proibidos.
No início, um único nó Stingray pode funcionar como ponto unificado de processamento do tráfego de assinantes. Baseada na tecnologia de Inspeção Profunda de Pacotes (Deep Packet Inspection), a plataforma Stingray executa as seguintes funções:
- BNG/BRAS (Broadband Network Gateway / Broadband Remote Access Server);
- Carrier Grade NAT (tradução de endereços de rede IPv4);
- Controle de largura de banda do canal (Quality of Service);
- Filtragem de tráfego;
- Coleta de estatísticas e análise (Network Visibility and Quality of Experience).
Em seguida, o operador começa a crescer. Novos bairros surgem, o consumo de vídeo aumenta, o volume de tráfego móvel e OTT cresce, clientes corporativos se conectam e a linha de tarifas se expande.
Quando o tráfego na rede aumenta, um único nó pode não conseguir mais lidar com seu processamento. O operador então precisa expandir os recursos computacionais ou alterar o esquema de processamento de tráfego.
Na primeira etapa, o operador geralmente utiliza o escalonamento vertical. O software Stingray é migrado para um servidor mais potente com maior margem em CPU, memória e interfaces de rede.
| Abordagem | Como funciona | Quando se aplica | Onde aparece o limite |
| Escalonamento vertical | A licença Stingray é migrada para um servidor mais potente | Quando um único servidor oferece desempenho suficiente | CPU, memória, interfaces, custo e limitações físicas do servidor |
| Escalonamento horizontal | O tráfego é distribuído entre vários servidores | Quando um único servidor não oferece mais a margem necessária ou é necessária expansão | O tráfego deve ser distribuído corretamente entre os servidores sem balanceadores de carga adicionais |
| Cluster com múltiplos NPBs (Balanceadores) | NPBs e servidores adicionais são incluídos no esquema | Quando é necessário crescer até valores de terabits | O escalonamento depende do desempenho do NPB, do número de nós e da redundância N+X |
Abordagens de escalonamento
Mas o crescimento vertical não é ilimitado. Um servidor tem um teto físico em termos de CPU, memória, lanes PCIe, placas de rede, resfriamento e custo de configuração.
Ao mesmo tempo, a arquitetura não muda. Todo o processamento ainda está concentrado em um único ponto pelo qual passa um volume crítico de tráfego de assinantes.
Quando um único nó não oferece mais a margem necessária, o sistema é migrado para um esquema de cluster.
Como funciona o esquema de cluster com um Network Packet Broker (NPB)
A plataforma Stingray escala por meio da adição linear de balanceadores de tráfego NPB (Network Packet Broker) e servidores de processamento. Esse esquema permite aumentar o desempenho gradualmente, sem substituir os componentes centrais e sem reconstruir a lógica de rede — basta adicionar novos elementos ao cluster.
Para a rede do operador, a plataforma permanece como um dispositivo L2 transparente e continua operando em modo inline.
Os principais elementos que participam do escalonamento:
- NPB — dispositivo de balanceamento de tráfego que distribui os fluxos entre os nós de processamento e mantém a passagem simétrica de sessões dentro de cada servidor Stingray. Em combinação com os switches de bypass, participa de um esquema tolerante a falhas para o fluxo de tráfego.
- Servidores de processamento — servidores de uso geral x86_64 com placas de rede Mellanox/Intel executando o software Stingray para análise profunda de tráfego.
- Switches de bypass — dispositivo que garante a continuidade da comunicação redirecionando automaticamente o tráfego diretamente pela rede em caso de falha do sistema de processamento.
- O gerenciamento é realizado via NMS. Por meio da interface gráfica, são configurados perfis, políticas, regras de filtragem, listas, protocolos personalizados e parâmetros de monitoramento.
Cada nó da plataforma pode operar de forma independente ou fazer parte de um cluster. No esquema de cluster, o NPB distribui os fluxos entre os servidores com base no algoritmo de balanceamento e no estado atual dos nós.
A lógica de processamento típica é a seguinte:
- O tráfego do operador chega ao bypass óptico.
- Pelo bypass, é encaminhado ao NPB.
- O NPB distribui o tráfego entre os nós de processamento.
- O tráfego de saída e entrada de uma única sessão/assinante é direcionado para o mesmo nó de processamento Stingray.
- No nó Stingray, o tráfego é analisado, as políticas de QoS são aplicadas, a filtragem web é realizada, a tradução de endereços CG-NAT ou as funções completas de BNG/BRAS são executadas.
- Após o processamento, o tráfego retorna à linha pelo NPB e pelo BYPASS.
Lógica de processamento do tráfego de rede utilizando NPB e DPI
Dependendo do cenário, o balanceamento pode ser estruturado de formas diferentes. Para cenários DPI, o balanceamento no nível de sessões individuais é aceitável. Para BNG e CG-NAT, é utilizado um esquema subscriber-aware, onde todo o tráfego de um único assinante é processado por um único nó.
Se houver assimetria de rotas na rede — por exemplo, o tráfego de entrada e saída passa por sites diferentes — é utilizado o espelhamento APENAS DO TRÁFEGO DE SAÍDA entre os NPBs de sites diferentes. Nesse caso, uma cópia do fluxo é transmitida entre os sites e usada para a análise correta da sessão. Após o processamento, o tráfego espelhado é descartado e não participa das estatísticas. Isso não implica custos adicionais significativos, pois o tráfego de saída não representa mais de 10% do tráfego de entrada.
Esse cenário é especialmente importante para redes distribuídas onde o tráfego de um assinante pode passar por diferentes pontos de presença.
Como o desempenho é escalado
O cluster se expande em etapas. Dentro do esquema atual, servidores para o Stingray podem ser adicionados. Quando a capacidade da camada de balanceamento se torna insuficiente, novos NPBs são adicionados.
Um NPB com 64 portas 100G é projetado para 1,2 Tbps de tráfego total, dos quais 1 Tbps é download e 200 Gbps é upload.
Um máximo de até 8 NPBs pode ser incluído em um cluster. Nessa configuração, a taxa de transferência total chega a 9,6 Tbps.
Exemplo de escalonamento de cluster com 4 NPBs: 4xNPB = 4,8 Tbps de tráfego total (4 Tbps de download + 800 Gbps de upload)
Para os servidores DPI, o cálculo é feito separadamente. Dependendo da configuração, a carga de trabalho calculada pode variar de 120 a 360 Gbps de tráfego total por nó. No entanto, o número final de nós sempre depende do perfil de tráfego, PPS, número de sessões, traduções NAT, do conjunto de funções habilitadas e do coeficiente de redundância que o operador deseja incluir.
| Configuração | Tráfego total | Download | Upload |
| 1 NPB | 1,2 Tbps | 1 Tbps | 200 Gbps |
| 2 NPB | 2,4 Tbps | 2 Tbps | 400 Gbps |
| 3 NPB | 3,6 Tbps | 3 Tbps | 600 Gbps |
| 4 NPB | 4,8 Tbps | 4 Tbps | 800 Gbps |
| 8 NPB | 9,6 Tbps | 8 Tbps | 1,6 Tbps |
Por exemplo, se um operador constrói um cluster dimensionado exatamente para a carga atual, qualquer pico noturno ou falha de nó causará imediatamente uma sobrecarga. Por isso, os esquemas industriais incluem uma reserva N+X. Alguns nós de processamento são designados como reservas do cluster. Se um servidor falhar, o NPB redistribui os fluxos de tráfego para os nós restantes e o cluster continua a processar o tráfego.
Ao escalar um cluster, recomenda-se utilizar servidores de capacidade igual.
Redundância, Heartbeat e Bypass
O escalonamento não deve transformar a rede em uma estrutura onde a falha de um único servidor comprometa todo o segmento. Por isso, no esquema de cluster do Stingray, a redundância é construída em vários níveis.
BYPASS óptico externo e controle de integridade dos nós DPI
Para os cenários DPI e PCEF, é utilizado um BYPASS óptico externo. Os links do operador são conectados em modo break-in por meio de um switch de bypass. Ele monitora o estado do sinal na linha e o funcionamento de todos os componentes de todo o complexo. Se ocorrer uma falha crítica do servidor de processamento ou do balanceador, o bypass passa o tráfego diretamente, eliminando o impacto. A conectividade da rede é mantida, mas as funções DPI são temporariamente suspensas.
Passagem do tráfego pelo bypass óptico nos modos habilitado e desabilitado
A integridade do cluster é monitorada por meio de um mecanismo de heartbeat. O NPB pode identificar quais servidores estão disponíveis e utiliza apenas os nós ativos. Se um dos nós parar de responder, o balanceador o remove do esquema de distribuição e direciona os novos fluxos de tráfego para os servidores restantes.
Redundância N+X
Para todas as funções da plataforma Stingray, é aplicada a redundância N+X. Recursos computacionais adicionais são incorporados ao cluster, permitindo que ele sobreviva à falha de nós individuais sem sobrecarregar imediatamente o sistema.
Se após uma falha os servidores restantes receberem mais tráfego do que conseguem processar, a qualidade do processamento pode começar a se degradar mesmo enquanto o serviço permanece operacional. Por isso, recomenda-se planejar uma carga de 80% do desempenho máximo em cada nó Stingray.
Conclusão
O escalonamento do Stingray segue um esquema linear. Um operador pode começar com um único nó e depois migrar para um esquema de cluster com múltiplos NPBs e uma capacidade combinada de 9,6 Tbit/s.
Essa arquitetura fornece um caminho de expansão claro. A taxa de transferência cresce com a adição de componentes, o gerenciamento de políticas permanece centralizado e a própria plataforma continua operando como um dispositivo L2 transparente para a rede do operador.
Se o seu negócio requer um sistema que cresça com você — a arquitetura Stingray oferece uma estratégia de expansão pronta e comprovada sem reconstruir o esquema lógico da rede.