Dans cet article, nous examinerons deux éléments clés de la surveillance du réseau, Stingray Service Gateway (une plateforme basée sur la technologie Deep Packet Inspection) et le module QoE (Quality of Experience) , et examiner une étude de cas pratique sur la recherche de problèmes de réseau.
Stingray Service Gateway (SSG) permet d’analyser le trafic en temps réel. Il permet non seulement de surveiller le taux d’établissement des connexions et le nombre de pertes pour les connexions TCP, mais aussi d’identifier les goulets d’étranglement qui sont difficiles à détecter avec les outils de surveillance standard.
SSG peut être installé dans la brèche (mode Inline) ou sur le miroir de trafic (mode Mirror).
Le mode Inline permet de connecter le dispositif dans l’espace des liens actifs entre deux routeurs et constitue le schéma d’installation recommandé, offrant toutes les fonctionnalités du système,
Mode Inline
tandis que le mode d’installation en miroir limite les fonctionnalités au filtrage du trafic pour se conformer à la législation et à la collecte de statistiques.
Mode miroir
Le module d’analyse de la qualité de l’environnement vise à évaluer la qualité de service de l’utilisateur final sur la base des données reçues du DPI. Il évalue divers aspects de l’expérience de l’utilisateur, tels que la latence, le débit de données, les modèles de trafic des protocoles d’application et les taux de perte de paquets, ce qui vous permet de réagir rapidement aux problèmes et d’optimiser les performances du réseau afin de garantir un niveau élevé de qualité de service.
Le module QoE collecte les mesures suivantes :
- Temps de parcours aller-retour (RTT);
- Nombre de re-demandes;
- Nombre de sessions, nombre d’utilisateurs, etc.
- Nombre de sessions, d’appareils, d’agents, d’adresses IP par abonné ;
- Répartition du trafic par application et protocoles de transport;
- Distribution du trafic par direction et AS;
- Clickstream pour chaque abonné (SNI, CN, URL).
Comment le réseau est-il surveillé avec SSG et QoE?
La surveillance du réseau à l’aide des technologies SSG et du module QoE est une procédure qui comprend plusieurs étapes :
1. Capture et équilibrage du trafic
Le trafic est extrait du cœur du réseau et envoyé à l’équilibreur de charge SSG, qui répartit la charge de manière égale entre plusieurs serveurs SSG. L’équilibreur peut gérer jusqu’à 800 Gbps de trafic en miroir.
Vous pouvez en savoir plus sur le fonctionnement de l’équilibreur de charge dans notre base de connaissances
2. collecte et analyse des statistiques
Les statistiques IPFIX (NetFlow v10) de chaque serveur SSG sont collectées et transmises à un cluster de serveurs QoE, où les informations sont accumulées et stockées avec la possibilité de personnaliser le temps de stockage.
Ces statistiques contiennent des informations sur l’IPDR (Internet Protocol Detail Record), qui comprennent le RTT (round-trip time) et le nombre de retransmissions.
Retransmits – retransmission de paquets en cas de perte de paquets
Ces données sont utilisées pour surveiller et déterminer la qualité des services de communication.
Après la collecte et l’analyse des statistiques, des rapports sont générés et les résultats sont visualisés pour faciliter l’interprétation et la prise de décision par les administrateurs de réseau. Les données obtenues permettent d’identifier et de résoudre rapidement les problèmes du réseau, d’optimiser son fonctionnement et d’améliorer le niveau de service pour les utilisateurs finaux.
Les résultats de la surveillance et de l’analyse des statistiques peuvent également être utilisés pour prévoir la charge du réseau et planifier sa mise à l’échelle à l’avenir.
Tester l’efficacité de la qualité de l’expérience – une étude de cas pratique
Examinons un scénario réel de surveillance des statistiques avec le module QoE.
Description de la connexion QoE
Le trafic de l’infrastructure virtuelle du client a été mis en miroir sur le port du serveur BareMetal avec SSG.
La seule tâche du SSG consistait à collecter des statistiques Netflow v10 à l’aide de champs personnalisés, y compris les informations RTT et Retransmit pour les sessions TCP. Ces statistiques ont été livrées à une machine virtuelle autonome sur laquelle le module de collecte de statistiques QoE Stor a été déployé.
Tests effectués
1. Vérification de la correspondance entre le pourcentage de retransmissions et les pertes réelles configurées sur l’hôte
Pour le test, un hôte a été utilisé sur lequel Linux TC a été utilisé pour définir des paramètres qui suppriment artificiellement 30 % du trafic entrant sur l’interface.
#tc qdisc add dev eth0 root netem loss 30% #tc qdisc show dev eth0 qdisc netem 8003 : root refcnt 2 limit 1000 loss 30%
Le test a produit des résultats d’analyse de la qualité de l’expérience indiquant un taux de retransmission de 30 % et correspondant également au RTT.
Ces résultats indiquent que le module d’analyse de la qualité de l’expérience fonctionne correctement.
Par défaut, le temps d’agrégation des statistiques est de 15 minutes, ce paramètre peut être réduit à 1 minute, mais le volume de données accumulées augmentera alors.
2. Améliorer la connectivité avec l’hôte en modifiant l’itinéraire
L’un des hôtes a subi des retransmissions sur une session TCP.
À 13 heures, le trafic sortant du préfixe problématique a été réacheminé vers un chemin différent, ce qui a entraîné la disparition des retransmissions et une amélioration du temps de réponse. Ces mesures ont également été confirmées par les statistiques obtenues à partir de la qualité de l’expérience.
Jetons un coup d’œil visuel sur les changements de trajectoire du trafic :
« AVANT »
« APRÈS »
Ces résultats indiquent également le bon fonctionnement du module d’analyse de la qualité de l’expérience et la capacité à détecter les problèmes de connectivité sur l’internet.
Conclusions
La fonctionnalité testée permet d’identifier les goulets d’étranglement dans le réseau et peut servir d’outil de surveillance pour la détection opportune et le travail proactif sur les zones problématiques.
Grâce à l’API, il est possible d’intégrer SSG dans le système de surveillance actuel afin de contrôler les moments de dégradation de la connectivité sur le réseau.