Dans cet article, nous examinerons comment le dimensionnement de la plateforme Stingray est mis en œuvre, quels composants participent au schéma de cluster, et comment un opérateur peut augmenter les performances d’un seul nœud jusqu’à des configurations térabits.
La limite d’un nœud de traitement du trafic
Imaginons un opérateur régional. Il dispose de plusieurs milliers d’abonnés, d’un trafic de pointe en soirée de dizaines de gigabits, d’IPTV, de torrents, de jeux en ligne, d’appels vidéo, de clients professionnels et d’exigences légales pour le filtrage des ressources interdites.
Au départ, un seul nœud Stingray peut fonctionner comme point unique de traitement du trafic des abonnés. Basée sur la technologie d’inspection approfondie des paquets (Deep Packet Inspection), la plateforme Stingray remplit les fonctions suivantes :
- BNG/BRAS (Broadband Network Gateway / Broadband Remote Access Server) ;
- Carrier Grade NAT (traduction d’adresses réseau IPv4) ;
- Contrôle de la bande passante (Quality of Service) ;
- Filtrage du trafic ;
- Collecte de statistiques et analyse (Network Visibility and Quality of Experience).
Puis l’opérateur commence à croître. De nouveaux quartiers apparaissent, la consommation vidéo augmente, le volume du trafic mobile et OTT s’accroît, des clients professionnels se connectent et la gamme tarifaire s’élargit.
Lorsque le trafic sur le réseau augmente, un seul nœud peut ne plus être en mesure de gérer son traitement. L’opérateur doit alors élargir ses ressources informatiques ou modifier le schéma de traitement du trafic.
Dans un premier temps, l’opérateur utilise généralement la mise à l’échelle verticale. Le logiciel Stingray est migré vers un serveur plus puissant offrant une plus grande marge en CPU, mémoire et interfaces réseau.
| Approche | Fonctionnement | Quand elle s’applique | Où apparaît la limite |
| Mise à l’échelle verticale | La licence Stingray est migrée vers un serveur plus puissant | Quand un seul serveur offre des performances suffisantes | CPU, mémoire, interfaces, coût et limitations physiques du serveur |
| Mise à l’échelle horizontale | Le trafic est distribué sur plusieurs serveurs | Quand un seul serveur ne fournit plus la marge nécessaire ou qu’une expansion est requise | Le trafic doit être correctement distribué entre les serveurs sans équilibreurs de charge supplémentaires |
| Cluster avec plusieurs NPB (équilibreurs) | Des NPB et des serveurs supplémentaires sont ajoutés au schéma | Quand une croissance jusqu’aux valeurs térabits est nécessaire | La mise à l’échelle dépend des performances du NPB, du nombre de nœuds et de la redondance N+X |
Approches de mise à l’échelle
Mais la croissance verticale n’est pas infinie. Un serveur a un plafond physique en termes de CPU, mémoire, voies PCIe, cartes réseau, refroidissement et coût de configuration.
Dans le même temps, l’architecture ne change pas. Tout le traitement reste concentré en un point unique par lequel passe un volume critique de trafic d’abonnés.
Lorsqu’un seul nœud ne fournit plus la marge nécessaire, le système passe à un schéma de cluster.
Fonctionnement du schéma de cluster avec un Network Packet Broker (NPB)
La plateforme Stingray évolue grâce à l’ajout linéaire d’équilibreurs de trafic NPB (Network Packet Broker) et de serveurs de traitement. Ce schéma permet d’augmenter les performances progressivement, sans remplacer les composants centraux ni reconstruire la logique réseau — il suffit d’ajouter de nouveaux éléments au cluster.
Pour le réseau de l’opérateur, la plateforme reste un dispositif L2 transparent et continue de fonctionner en mode inline.
Les principaux éléments participant à la mise à l’échelle :
- NPB — dispositif d’équilibrage du trafic qui distribue les flux entre les nœuds de traitement et maintient le passage symétrique des sessions au sein de chaque serveur Stingray. En combinaison avec les commutateurs bypass, il participe à un schéma de passage du trafic tolérant aux pannes.
- Serveurs de traitement — serveurs x86_64 à usage général équipés de cartes réseau Mellanox/Intel exécutant le logiciel Stingray pour l’analyse approfondie du trafic.
- Commutateurs bypass — dispositif assurant la continuité des communications en redirigeant automatiquement le trafic directement à travers le réseau en cas de défaillance du système de traitement.
- La gestion est assurée via le NMS. L’interface graphique permet de configurer les profils, les politiques, les règles de filtrage, les listes, les protocoles personnalisés et les paramètres de surveillance.
Chaque nœud de la plateforme peut fonctionner de manière indépendante ou faire partie d’un cluster. Dans le schéma de cluster, le NPB distribue les flux entre les serveurs en fonction de l’algorithme d’équilibrage et de l’état actuel des nœuds.
La logique de traitement typique est la suivante :
- Le trafic de l’opérateur arrive au bypass optique.
- Via le bypass, il est transmis au NPB.
- Le NPB distribue le trafic entre les nœuds de traitement.
- Le trafic sortant et entrant d’une même session/abonné est dirigé vers le même nœud de traitement Stingray.
- Au niveau du nœud Stingray, le trafic est analysé, les politiques QoS sont appliquées, le filtrage web est effectué, la traduction d’adresses CG-NAT ou les fonctions complètes BNG/BRAS sont exécutées.
- Après traitement, le trafic est renvoyé sur la ligne via le NPB et le BYPASS.
Logique de traitement du trafic réseau utilisant NPB et DPI
Selon le scénario, l’équilibrage peut être structuré différemment. Pour les scénarios DPI, l’équilibrage au niveau des sessions individuelles est acceptable. Pour BNG et CG-NAT, un schéma subscriber-aware est utilisé, où tout le trafic d’un abonné est traité par un seul nœud.
Si une asymétrie de routes existe dans le réseau — par exemple, le trafic entrant et sortant passe par des sites différents — un miroir DU TRAFIC SORTANT UNIQUEMENT entre les NPB de différents sites est utilisé. Dans ce cas, une copie du flux est transmise entre les sites et utilisée pour l’analyse correcte des sessions. Après traitement, le trafic en miroir est supprimé et ne participe pas aux statistiques. Cela n’entraîne pas de coûts supplémentaires significatifs, car le trafic sortant ne représente pas plus de 10 % du trafic entrant.
Ce scénario est particulièrement important pour les réseaux distribués où le trafic d’un abonné peut transiter par différents points de présence.
Comment les performances sont mises à l’échelle
Le cluster s’étend ensuite par étapes. Dans le schéma actuel, des serveurs pour Stingray peuvent être ajoutés. Lorsque la capacité de la couche d’équilibrage devient insuffisante, de nouveaux NPB sont ajoutés.
Un NPB avec 64 ports 100G est conçu pour 1,2 Tbps de trafic total, dont 1 Tbps en téléchargement et 200 Gbps en envoi.
Un maximum de 8 NPB peut être inclus dans un cluster. Dans cette configuration, le débit total atteint 9,6 Tbps.
Exemple de mise à l’échelle du cluster avec 4 NPB : 4xNPB = 4,8 Tbps de trafic total (4 Tbps en téléchargement + 800 Gbps en envoi)
Pour les serveurs DPI, le calcul est effectué séparément. Selon la configuration, la charge de travail calculée peut aller de 120 à 360 Gbps de trafic total par nœud. Cependant, le nombre final de nœuds dépend toujours du profil de trafic, du PPS, du nombre de sessions, des traductions NAT, de l’ensemble des fonctions activées et du coefficient de redondance que l’opérateur souhaite inclure.
| Configuration | Trafic total | Téléchargement | Envoi |
| 1 NPB | 1,2 Tbps | 1 Tbps | 200 Gbps |
| 2 NPB | 2,4 Tbps | 2 Tbps | 400 Gbps |
| 3 NPB | 3,6 Tbps | 3 Tbps | 600 Gbps |
| 4 NPB | 4,8 Tbps | 4 Tbps | 800 Gbps |
| 8 NPB | 9,6 Tbps | 8 Tbps | 1,6 Tbps |
Par exemple, si un opérateur crée un cluster dimensionné exactement pour la charge actuelle, tout pic de soirée ou défaillance de nœud entraînera immédiatement une surcharge. C’est pourquoi les schémas industriels incluent une réserve N+X. Certains nœuds de traitement sont désignés comme réserves du cluster. En cas de défaillance d’un serveur, le NPB redistribue les flux de trafic vers les nœuds restants et le cluster continue de traiter le trafic.
Lors de la mise à l’échelle d’un cluster, il est recommandé d’utiliser des serveurs de capacité égale.
Redondance, Heartbeat et Bypass
La mise à l’échelle ne doit pas transformer le réseau en une structure où la défaillance d’un seul serveur brise l’ensemble du segment. C’est pourquoi, dans le schéma de cluster Stingray, la redondance est construite sur plusieurs niveaux.
BYPASS optique externe et contrôle de l’état des nœuds DPI
Pour les scénarios DPI et PCEF, un BYPASS optique externe est utilisé. Les liaisons de l’opérateur sont connectées en mode break-in via un commutateur bypass. Il surveille l’état du signal sur la ligne et le bon fonctionnement de tous les composants de l’ensemble du complexe. En cas de défaillance critique du serveur de traitement ou de l’équilibreur, le bypass fait passer le trafic directement, éliminant ainsi l’impact. La connectivité réseau est maintenue, mais les fonctions DPI sont temporairement suspendues.
Passage du trafic via le bypass optique en modes activé et désactivé
L’état du cluster est surveillé via un mécanisme de heartbeat. Le NPB peut voir quels serveurs sont disponibles et n’utilise que les nœuds actifs. Si l’un des nœuds cesse de répondre, l’équilibreur le retire du schéma de distribution et dirige les nouveaux flux de trafic vers les serveurs restants.
Redondance N+X
Pour toutes les fonctions de la plateforme Stingray, une redondance N+X est appliquée. Des ressources informatiques supplémentaires sont intégrées dans le cluster, lui permettant de survivre à la défaillance de nœuds individuels sans surcharger immédiatement le système.
Si après une défaillance les serveurs restants reçoivent plus de trafic qu’ils ne peuvent en traiter, la qualité du traitement peut commencer à se dégrader même si le service reste opérationnel. Il est donc recommandé de planifier une charge de 80 % des performances maximales sur chaque nœud Stingray.
Conclusion
La mise à l’échelle de Stingray suit un schéma linéaire. Un opérateur peut démarrer avec un seul nœud, puis passer à un schéma de cluster avec plusieurs NPB et une capacité combinée de 9,6 Tbps.
Cette architecture fournit une voie d’expansion claire. Le débit augmente en ajoutant des composants, la gestion des politiques reste centralisée et la plateforme elle-même continue de fonctionner comme un dispositif L2 transparent pour le réseau de l’opérateur.
Si votre entreprise a besoin d’un système qui évolue avec vous — l’architecture Stingray fournit une stratégie d’expansion éprouvée et prête à l’emploi sans reconstruire le schéma logique du réseau.