Architecture d'analyses d'événements à faible latence

Construire des pipelines de données pour de grands sites physiques est difficile.

Un événement de 20 000 personnes pose des problèmes différents d'une application web standard. Dans une application web, les utilisateurs sont répartis sur différents fuseaux horaires. Dans un lieu physique, des milliers de personnes créent des pics de données simultanément.

Le traitement par lots (batch processing) ou le long-polling entraînera des retards. En matière de gestion de foule, un délai de 15 minutes est un échec. Vous finissez par réagir à des problèmes passés au lieu de les empêcher.

Pour obtenir une vitesse inférieure à la seconde, vous avez besoin d'un flux continu allant du matériel en périphérie (edge) jusqu'à votre tableau de bord.

Voici le schéma directeur pour un pipeline de télémétrie résilient.

Couche 1 : Edge Compute avec priorité au mode hors ligne

Vous avez besoin d'une latence inférieure à 5 ms. Vous devez également gérer les coupures de réseau. Utilisez des nœuds edge avec un cache local en mémoire comme Redis. Répliquez votre base de données cloud sur ces nœuds avant le début de l'événement.

Lorsqu'un participant scanne un badge, le système consulte le cache local. Cela permet de contourner Internet et de maintenir la fluidité des entrées.

Couche 2 : Ingestion asynchrone via MQTT

Les réseaux des sites sont souvent instables. Utilisez MQTT car il est léger. Les nœuds edge publient des messages vers un broker cloud. Le broker achemine ensuite les données vers vos files d'attente d'ingestion.

Couche 3 : WebSockets Full-Duplex

Ne demandez pas à votre frontend de solliciter des mises à jour. Utilisez les WebSockets pour maintenir une connexion persistante avec votre passerelle API. Cela garantit que l'équipe opérationnelle voit les changements sur le terrain en moins d'une seconde.

Cette configuration permet aux équipes de repérer immédiatement les pics de foule ou les baisses d'engagement. Vous pouvez rediriger le personnel avant qu'un goulot d'étranglement ne se forme.

Comment optimisez-vous votre matériel IoT pour les foules denses ? Partagez vos réflexions ci-dessous.

Source : https://dev.to/stampiq/architecting-low-latency-real-time-event-analytics-at-scale-from-edge-rfid-to-websockets-3098