Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente |
technique:adminsys:monitoring:metrologie:collect:blackbox [2021/08/29 23:04] – qduchemi | technique:adminsys:monitoring:collect:blackbox [2022/05/24 21:04] (Version actuelle) – ppom |
---|
{{indexmenu_n>30}} | {{indexmenu_n>30}} |
| |
# Santé des services HTTP/DNS | # Santé des services |
| |
Si les métriques exposées par les services permettent de rendre compte du nombre d'utilisateurs, de requêtes, etc, elles ne sont pas très pratiques pour savoir si le service en question est en bonne santé. | Si les métriques exposées par les services permettent de rendre compte du nombre d'utilisateurs, de requêtes, etc, elles ne sont pas très pratiques pour savoir si le service en question est en bonne santé. |
Blackbox est avant tout un *exporter*, c'est-à-dire un serveur web qui expose des métriques quand on lui demande. | Blackbox est avant tout un *exporter*, c'est-à-dire un serveur web qui expose des métriques quand on lui demande. |
| |
Ainsi, on ne détaille pas dans cette documentation la mise en place avec Docker et Traefik, qui est exactement la même que pour les [[technique:adminsys:monitoring:metrologie:collect:service_metrics|exporters des services]]. Seules les cibles `vmagent` changent, voir plus bas. | Ainsi, on ne détaille pas dans cette documentation la mise en place avec Docker et Traefik, qui est exactement la même que pour les [[technique:adminsys:monitoring:collect:service_metrics|exporters des services]]. Seules les cibles `vmagent` changent, voir plus bas. |
</bootnote> | </bootnote> |
| |
| |
<bootnote> | <bootnote> |
On peut imaginer des modules plus compliqués. `tcp`, par exemple, permet d'initier une session TCP et de vérifier la réponse du serveur. On pourrait par exemple vérifier qu'un serveur Postfix fonctionne, s'il renvoie `220 .+ ESMTP Postfix (Debian/GNU)` après l'initiation de la connexion... | On peut imaginer des modules plus compliqués. `tcp`, par exemple, permet d'initier une session TCP et de vérifier la réponse du serveur. On pourrait par exemple vérifier qu'un serveur Postfix fonctionne, s'il renvoie `220 .+ ESMTP Postfix (Debian/GNU)` après l'initiation de la connexion... Un tel module commencerait comme ça : |
| |
| ```yaml |
| smtp_check: |
| prober: tcp |
| tcp: |
| query_response: |
| - expect: "^220 ([^ ]+) ESMTP (.+)$" |
| ``` |
| |
| C'est effectivement ce genre de choses qu'on utilise pour [vérifier que le serveur mail](https://gitlab.utc.fr/picasoft/projets/services/monitoring/-/blob/master/blackbox.yml) est fonctionnel. |
</bootnote> | </bootnote> |
| |
## Récupération des métriques | ## Récupération des métriques |
| |
Comme pour les [[technique:adminsys:monitoring:metrologie:collect:service_metrics#configuration_vmagent|exporters des services]], il suffirait de créer autant de jobs que de services, du style : | Comme pour les [[technique:adminsys:monitoring:collect:service_metrics#configuration_vmagent|exporters des services]], il suffirait de créer autant de jobs que de services, du style : |
| |
```yaml | ```yaml |
| |
Sur [[technique:adminsys:monitoring:metrologie:grafana|Grafana]], on pourra importer [ce dashboard](https://grafana.com/grafana/dashboards/13659) comme base, qui reprend la plupart des métriques récoltées dans un format lisible. | Sur [[technique:adminsys:monitoring:metrologie:grafana|Grafana]], on pourra importer [ce dashboard](https://grafana.com/grafana/dashboards/13659) comme base, qui reprend la plupart des métriques récoltées dans un format lisible. |
| |
| ## Debug |
| |
| On peut ajouter `&debug=true` à n'importe quelle URL de récupération des métriques pour avoir une idée de ce qui ne va pas. |
| |
| La page d'accueil de Blackbox, `blackbox.picasoft.net`, permet de visualiser les derniers probes et de visualiser ceux qui ont raté. |
| |
| Les identifiants sont ceux du pass (`Tech/Prometheus/Blackbox`). |