Informations et recherche

La déprime du lundi avec Comcast : comment nous sommes restés productifs pendant une interruption de FAI

carte décrivant des interruptions

Le message Slack disait : « Passez sur le hotspot de votre smartphone si vous avez Comcast ». C’était le lundi 8 novembre, il était 21 h 45.

À première vue, cela ressemblait à une plaisanterie, mais cela provenait d’une source légitime : notre équipe informatique. Nous étions en train de participer à un appel Zoom très important afin de peaufiner les détails de dernière minute de l’événement de lancement du produit « No Interruptions » programmé pour mardi matin. 

Le message suivant nous a avertis : « Nous constatons des interruptions en cascade pour les utilisateurs de Comcast dans tout le nord de la Californie ; vous risquez d’être bientôt affecté. »

La perturbation et la difficulté de coordination qui s’ensuivrait pour effectuer notre travail auraient été une gêne bien inutile pour nous. En réponse à l’alerte, nous avons basculé sur nos hotspots et avons poursuivi nos réunions tandis que l’interruption s’étendait à toute la Californie du Nord. 

Les interruptions imprévues de plusieurs heures des FAI sont rares de nos jours, mais lorsqu’elles se produisent, surtout alors que la plupart d’entre nous travaillent à domicile, l’impact sur la productivité est considérable. 

L’interruption de Comcast nous a rappelé qu’il est important de se préparer aux situations imprévisibles. Mais comment se préparer à des interruptions aléatoires ?  

Dans le monde de la surveillance de l’expérience digitale (DEM pour Digital Experience Monitoring), la surveillance proactive constitue l’approche la plus efficace pour anticiper les interruptions et les perturbations inattendues. Mais la garantie d’une recherche continue des signes annonciateurs de problèmes est difficile à croire tant qu’on ne l’a pas vue à l’œuvre. 

L’interruption de Comcast a constitué une opportunité inespérée pour l’équipe qui, dès le lendemain, mettait la dernière main au lancement des mises à niveau de notre solution de surveillance. Alors, comment l’équipe informatique a-t-elle procédé ? Voyons comment l’équipe a utilisé une surveillance cloud-native proactive pour nous permettre de rester productifs durant l’interruption.

Nous utilisons Zscaler Digital Experience (ZDX) au sein de Zscaler pour suivre et diagnostiquer les performances des applications utilisées par nos employés. Dans la soirée du 8 novembre, nous avons commencé à constater une forte dégradation des performances, affectant plusieurs applications critiques qu’utilisaient nos employés. ZDX a révélé des problèmes dans tout le pays, mais avec un cluster notable dans la région de la baie de San Francisco. Étant donné la concentration de nos employés dans cette région, nous avons décidé d’enquêter. Le score ZDX de ces applications critiques, généralement vert, avait chuté brusquement dans la catégorie OK/faible, accompagné d’une forte augmentation des temps de chargement des pages. Voir la figure 1.

Figure 1 : le score ZDX et le temps de chargement des pages présentent une baisse considérable vers 21 h PT (ou 12 h ET).

ZDX surveille l’expérience de chacun des employés de Zscaler, ceux-ci servant « d’yeux » et « d’oreilles » pour surveiller les dégradations des applications. Dans ce cas, ZDX a constaté un comportement anormal provenant des zones de forte utilisation de Comcast, réparties dans toute la baie de San Francisco. Sur les figures 2 et 3, nous pouvons observer l’expérience des employés de Zscaler avant l’interruption et pendant l’interruption : 

Figure 2 : les employés de Zscaler dans la région de la baie enregistrent de bonnes performances dans des conditions normales.
 

Figure 3 : les employés de Zscaler dans la région de la baie de San Francisco subissent les répercussions de l’interruption de Comcast dans la soirée du 8 novembre 2021.

Une fois que nous avons établi qu’un nombre important d’employés dans une région concentrée rencontrait des problèmes, l’étape suivante a consisté à isoler la cause du problème. Comme ZDX exploite le même agent qui alimente notre solution de cybersécurité, Zscaler Internet Access (ZIA), nous avons eu accès à une mine de données en temps quasi réel à analyser sur l’ensemble de notre base d’employés. ZDX procède à des mesures sous trois différentes perspectives : l’application, le réseau et le terminal de l’utilisateur. Une analyse rapide a permis d’exclure l’application et le terminal de l’utilisateur, ce qui nous a permis de conclure à un problème de réseau qu’il nous fallait analyser.

Nous avons examiné les données de ZDX CloudPath, qui mesure la latence saut par saut et la perte de paquets entre le terminal de l’utilisateur et l’application, et avons rapidement mis en évidence un problème de FAI. CloudPath nous a permis d’exclure les problèmes liés au Wi-Fi, à Zscaler Cloud et au réseau Internet. Il nous a révélé que chaque utilisateur affecté était un client Comcast et que toute la dégradation se produisait entre la passerelle de l’utilisateur et Comcast. 

La figure 4 montre comment CloudPath révèle que le saut entre la passerelle de l’utilisateur et Comcast est en cause, affichant une latence et une perte extrêmes (il n’y avait parfois pas de connexion du tout). Elle indique également un Wi-Fi sain (avec une latence minimale), et souligne qu’une connexion en aval de Comcast vers Zscaler Cloud n’était pas possible.


 

Figure 4 : cet employé a pu établir une connexion avec Comcast, mais avec une latence et une perte extrêmes.

Nous considérons Internet comme une chose acquise, d’autant plus que la plupart des FAI construisent des réseaux extrêmement résilients pour fournir à nos foyers une connectivité haut débit rapide. Mais, comme tout système complexe, dès qu’une perturbation survient, les performances Internet se dégradent et deviennent imprévisibles. La surveillance proactive, combinée aux effets sur le réseau de la surveillance de chaque utilisateur, contribue à fournir une mesure de contrôle et de prévisibilité. 

Consultez Zscaler Digital Experience pour découvrir comment contribuer à la productivité de votre personnel distribué.

Restez au courant des dernières astuces et informations concernant la transformation digitale.

En envoyant le formulaire, vous acceptez notre politique de confidentialité.