Neste artigo, examinaremos dois componentes principais do monitoramento de rede, Stingray Service Gateway (uma plataforma baseada na tecnologia Deep Packet Inspection) e o módulo QoE (Quality of Experience) , e examinar um estudo de caso prático sobre como encontrar problemas de rede.
O Stingray Service Gateway (SSG) oferece a capacidade de analisar o tráfego em tempo real. Ele permite não apenas monitorar a taxa de estabelecimento de conexão e o número de perdas de conexões TCP, mas também identificar gargalos que são difíceis de detectar com ferramentas de monitoramento padrão.
O SSG pode ser instalado na lacuna (modo Inline) ou no espelho de tráfego (modo Mirror).
O modo Inline permite a conexão do dispositivo no intervalo de links ativos entre dois roteadores e é o esquema de instalação recomendado, proporcionando funcionalidade total do sistema,
Modo em linha
enquanto o modo de instalação de espelho limita a funcionalidade à filtragem do tráfego para cumprir a legislação e coletar estatísticas.
Modo espelho
O módulo de análise de QoE tem como objetivo avaliar a qualidade do serviço do usuário final com base nos dados recebidos do DPI. Ele avalia vários aspectos da experiência do usuário, como latência, taxa de dados, padrões de tráfego de protocolos de aplicativos e taxas de perda de pacotes, permitindo reagir rapidamente a problemas e otimizar o desempenho da rede para garantir um alto nível de qualidade de serviço.
O módulo QoE coleta as seguintes métricas:
- Métricas de tempo de ida e volta (RTT);
- Métricas de número de novas solicitações;
- Número de sessões, dispositivos, agentes, endereços IP por assinante;
- Distribuição de tráfego por aplicativo e protocolos de transporte;
- Distribuição do tráfego por direção e AS;
- Clickstream para cada assinante (SNI, CN, URL).
Como a rede é monitorada com SSG e QoE?
O monitoramento de rede usando as tecnologias do módulo SSG e QoE é um procedimento que inclui várias etapas:
1. Captura e balanceamento de tráfego
O tráfego é extraído do núcleo da rede e enviado para o balanceador de carga do SSG, que distribui a carga uniformemente entre vários servidores do SSG. O balanceador pode lidar com até 800 Gbps de tráfego espelhado.
Você pode saber mais sobre a operação do Load Balancer em nossa base de conhecimento
2. Coleta e análise de estatísticas
As estatísticas IPFIX (NetFlow v10) de cada servidor SSG são coletadas e transmitidas a um cluster de servidores QoE, onde as informações são acumuladas e armazenadas com a capacidade de personalizar o tempo de armazenamento.
Essas estatísticas contêm informações sobre o IPDR (Registro de detalhes do protocolo da Internet), que inclui RTT (tempo de ida e volta) e número de retransmissões.
Retransmits – retransmissão de pacotes em caso de perda de pacotes
Esses dados são usados para monitorar e determinar a qualidade dos serviços de comunicação.
Após a coleta e a análise das estatísticas, são gerados relatórios e os resultados são visualizados para facilitar a interpretação e a tomada de decisões pelos administradores de rede. Os dados obtidos permitem identificar e resolver prontamente os problemas da rede, otimizar sua operação e melhorar o nível de serviço para os usuários finais.
Os resultados do monitoramento e da análise de estatísticas também podem ser usados para prever a carga na rede e planejar seu dimensionamento no futuro.
Testando a eficiência da QoE – um estudo de caso prático
Vamos considerar um cenário real de monitoramento de estatísticas com o módulo QoE.
Descrição da conexão de QoE
O tráfego da infraestrutura virtual do cliente foi espelhado para a porta do servidor BareMetal com o SSG.
A única tarefa do SSG era coletar estatísticas do Netflow v10 usando campos personalizados, incluindo informações de RTT e retransmissão para sessões TCP. Essas estatísticas foram entregues a uma máquina virtual autônoma na qual o módulo de coleta de estatísticas do QoE Stor foi implantado.
Testes realizados
1. Verificação da correspondência entre a porcentagem de retransmissões e as perdas reais configuradas no host
Para o teste, foi usado um host no qual o Linux TC foi usado para definir parâmetros que reduzem artificialmente 30% do tráfego de entrada na interface.
#tc qdisc add dev eth0 root netem loss 30% #tc qdisc show dev eth0 qdisc netem 8003: root refcnt 2 limit 1000 loss 30%
O teste produziu resultados analíticos de QoE indicando uma taxa de retransmissão de 30% e também correspondendo ao RTT.
Esses resultados indicam a operação correta do módulo de análise de QoE.
Por padrão, o tempo de agregação de estatísticas é de 15 minutos; esse parâmetro pode ser reduzido para 1 minuto, mas o volume de dados acumulados aumentará.
2. Melhorar a conectividade com o host alterando a rota de tráfego
Um dos hosts estava sofrendo retransmissões em uma sessão TCP.
Às 13:00, foi realizado um redirecionamento do tráfego de saída do prefixo problemático para um caminho diferente, e a troca resultou no desaparecimento das retransmissões e na melhora do RTT. Essas métricas também foram confirmadas pelas estatísticas obtidas da QoE.
Vamos dar uma olhada visual nas alterações do caminho do tráfego:
“ANTES”
“DEPOIS”
Esses resultados também indicam a operação correta do módulo de análise de QoE e a capacidade de detectar problemas de conectividade na Internet.
Conclusões
A funcionalidade testada permite identificar gargalos na rede e pode ser uma ferramenta de monitoramento para detecção oportuna e trabalho proativo com áreas problemáticas.
Usando a API, é possível integrar o SSG ao sistema de monitoramento atual para controlar os momentos de degradação da conectividade na rede.