Résumé de la stack de monitoring

Schéma résumant la stack monitoring

Une TSDB est une base de donnée spécialisée dans le stockage de valeurs associées à un point dans le temps.

VictoriaMetrics

Cette TSDB est spécialisée dans le stockage de métriques, chaque métrique étant associée à un ensemble de labels

Loki

Cette TSDB est spécialisée dans le stockage de logs, chaque ligne de log étant associée à un ensemble de labels

C’est un service qui génère à intervalle régulier un fichier contenant des métriques selon différents labels, ce fichier est ensuite disponible via HTTP.

Exporter de service

Génère les métriques associées à un service (concernant les données d’utilisation de Mattermost par exemple). Voir cette page pour plus de détails.

Blackbox

Génère des métriques sur le statut d’un service (up ou down). Voir cette page pour plus de détails.

Exporter machine

Génère les données concernant la machine (utilisation RAM, CPU, disque, …). Voir cette page pour plus de détails.

Exporter Proxmox

Proxmox est le système d’exploitation de nos hyperviseurs, il permet de gérer les VM. L’exporter Proxmox nous donne des données sur les différentes VM. Voir cette page pour plus de détails.

C’est un service chargé de récupérer les métriques depuis différents exporter et de les stocker dans la TSDB

Génère une alerte si une métrique dépasse un certain seuil

gère les différentes alertes, fait du tri, déduplique, …

récupère les différents logs des services et des machines et les envoie à Loki

Permet de visualiser les métriques et les logs stockés dans les TSDB

  • technique/adminsys/monitoring/resume.txt
  • de rdelaage