technique:adminsys:monitoring:start

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
technique:adminsys:monitoring:start [2021/01/05 17:19] qduchemitechnique:adminsys:monitoring:start [2022/04/29 15:47] (Version actuelle) qduchemi
Ligne 1: Ligne 1:
 # Monitoring de l'infrastructure # Monitoring de l'infrastructure
-====== Monitoring de l'infrastructure Picasoft ======  
  
 Dans le but de surveiller l'activité de l'infrastructure, il a été décidé de mettre en place une infrastructure de monitoring. Il existe plusieurs manières de faire du monitoring :  Dans le but de surveiller l'activité de l'infrastructure, il a été décidé de mettre en place une infrastructure de monitoring. Il existe plusieurs manières de faire du monitoring : 
Ligne 8: Ligne 7:
   * collecter des données sur les erreurs qui surviennent sur les machines (messages de logs système)   * collecter des données sur les erreurs qui surviennent sur les machines (messages de logs système)
   * collecter des données sur les erreurs qui surviennent dans l’exécution des services (messages de logs des services)   * collecter des données sur les erreurs qui surviennent dans l’exécution des services (messages de logs des services)
 +
 +<bootnote>
 +Cette section détaille le fonctionnement de tous les outils utilisés pour le monitoring, mais les pages n'ont pas beaucoup d'intérêt sans vision d'ensemble. Voir [[technique:adminsys:monitoring:metrologie:stack-picasoft|cette page]] qui récapitule l'infrastructure mise en place chez Picasoft.
 +</bootnote>
  
 Bien entendu, tout ceci est **complémentaire**. Chaque type de données listé ici permet de fournir des informations d'un type particulier sur l'infrastructure. C'est la combinaison de tout ou partie de ces données qui forme le monitoring. Bien entendu, tout ceci est **complémentaire**. Chaque type de données listé ici permet de fournir des informations d'un type particulier sur l'infrastructure. C'est la combinaison de tout ou partie de ces données qui forme le monitoring.
-Comme ces données sont de types différents, les manières de les collecter, analyser et restituer sont différentes. On distingue de ce fait 2 grands axes dans le monitoring : la métrologie et le //logging//. 
  
-===== Métrologie =====+Comme ces données sont de types différents, les manières de les collecter, analyser et restituer sont différentes. 
  
-La métrologie est la partie du monitoring qui va se charger de **mesurer** l'infrastructure. À intervalle réguliers (quelques secondes ou minutes), on effectue des mesures de différentes valeurs charge du CPU, nombre de compte crées sur un service, espace disque restant, etc. Toutes ces mesures seront stockées, avec la date exacte de la mesure. Les mesures successives vont ainsi permettre de tracer une évolution dans le temps de la valeur qui est mesurée  +<bootnote> 
-En multipliant les valeurs mesurées, on obtient ainsi une vision complète de l'état de fonctionnement de l'infrastructure et des services, mais aussi un historique pour analyser l'évolution de son état.+À ce jour, de nombreux essais (en particulier des TX en [[txs:infra:monitoring_p17:accueil|P17]] et [[txs:infra:monitoring_p20:accueil|P20]]) de mettre en place une solution de //logging// ont été menés à PicasoftCependant aucune solution n'a pour le moment été réellement déployée et mise en utilisation. 
 +</bootnote>
  
-En métrologie (dans le contexte du monitoring d'infrastructure informatique), la succession des mesures de chaque type de sonde (par exemple "la charge CPU") s'appelle une //timeserie// (une série dans le temps donc). La succession des mesures pour une sonde très précise (par exemple "la charge CPU sur le serveur `pica01`) s'appelle une métrique.+===== Métrologie =====
  
-Picasoft a mis en place, au fil du temps, une stack de métrologie complète pour mesurer ses serveurs et ses servicesLe détail est proposé dans [[technique:adminsys:monitoring:metrologie:stack-picasoft|la section dédiée]].+La métrologie consiste à **mesurer** l'infrastructureTout ce qui joue le rôle de sonde et qui permet d'enregistrer les mesures effectuées rentre dans la catégorie « métrologie ».
  
-===== Logging =====+## Alerting
  
-Le //logging// est la partie du monitoring qui se charge de collectertraiteret restituer les messages de logs produits par l'infrastructure (logs systèmes et applicatifs). Les logs permettent de détecter lorsqu'un évènement se produit dans une application ou au niveau d'une machine, le traitement de ces messages permet donc de tracer la succession d'évènements qui se sont produits, en particulier les erreurs. +L'alerting, ou supervision, est la partie du monitoring qui se charge d'évaluer des règles à intervalles réguliers pour détecter des situations que l'on considère comme problématiques (disque pleinCPU trop élevétrop de code d'erreurs HTTP, etc). Quand une règle est évaluée positivement, le système d'alerte décide que faireEn généralil s'agit de transmettre l'information à l'équipe technique en étant le plus parcimonieux possible pour ne pas surcharger. Le détail est proposé dans [[technique:adminsys:monitoring:alerting:start|la section dédiée]].
- +
-À ce jour, de nombreux essais (en particulier des TX en [[txs:infra:monitoring_p17:accueil|P17]] et [[txs:infra:monitoring_p20:accueil|P20]]) de mettre en place une solution de //logging// ont été menés à Picasoft. Cependant aucune solution n'a pour le moment été réellement déployée et mise en utilisation.+
  
 {{indexmenu>:technique:adminsys:monitoring|js#bitrix msort tsort nsort notoc nomenu nocookie navbar}} {{indexmenu>:technique:adminsys:monitoring|js#bitrix msort tsort nsort notoc nomenu nocookie navbar}}
  • technique/adminsys/monitoring/start.1609863593.txt.gz
  • de qduchemi