Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédenteDernière révisionLes deux révisions suivantes |
technique:adminsys:monitoring:metrologie:victoriametrics [2022/02/03 13:41] – qduchemi | technique:adminsys:monitoring:metrologie:victoriametrics [2022/04/29 15:45] – ↷ Liens modifiés en raison d'un déplacement. qduchemi |
---|
| |
Cette méthode d'ingestion est à privilégier pour toute nouvelle collecte de métrique : elle est légère, simple à mettre en place, et plutôt sécurisante pour l'infrastructure (modèle //pull// plutôt que //push//). Elle nécessite quelques lignes de configuration côté serveur, et un simple mécanisme de sécurité côté exporter pour que seul le serveur `monitoring` puisse accéder à celui-ci. Cette méthode est utilisée pour collecter les métriques suivantes : | Cette méthode d'ingestion est à privilégier pour toute nouvelle collecte de métrique : elle est légère, simple à mettre en place, et plutôt sécurisante pour l'infrastructure (modèle //pull// plutôt que //push//). Elle nécessite quelques lignes de configuration côté serveur, et un simple mécanisme de sécurité côté exporter pour que seul le serveur `monitoring` puisse accéder à celui-ci. Cette méthode est utilisée pour collecter les métriques suivantes : |
* les [[technique:adminsys:monitoring:metrologie:collect:system_metrics|métriques systèmes]] des machines virtuelles | * les [[technique:adminsys:monitoring:collect:system_metrics|métriques systèmes]] des machines virtuelles |
* les [[technique:adminsys:monitoring:metrologie:collect:service_metrics|métriques internes des services]] | * les [[technique:adminsys:monitoring:collect:service_metrics|métriques internes des services]] |
* les [[technique:adminsys:monitoring:metrologie:collect:proxmox_metrics|métriques de Proxmox]] | * les [[technique:adminsys:monitoring:collect:proxmox_metrics|métriques de Proxmox]] |
* les [[technique:adminsys:monitoring:metrologie:collect:blackbox|métriques de santé]] des serveurs web/DNS | * les [[technique:adminsys:monitoring:collect:blackbox|métriques de santé]] des serveurs web/DNS |
====== Administration ====== | ====== Administration ====== |
| |
Victoria Metrics ne nécessite pas particulièrement de maintenance, hormis des mises à jour. On note cependant l'existence d'un outil pour certaines opérations, comme par exemple la migration depuis une ancienne TSDB : [[https://github.com/VictoriaMetrics/vmctl|vmctl]]. | Victoria Metrics ne nécessite pas particulièrement de maintenance, hormis des mises à jour. On note cependant l'existence d'un outil pour certaines opérations, comme par exemple la migration depuis une ancienne TSDB : [[https://github.com/VictoriaMetrics/vmctl|vmctl]]. |
| |
====== Debug ====== | ====== Effectuer des requêtes via l'API (debug) ====== |
| |
On peut faire des requêtes sur les données de Victoria Metrics à des fins de debug : | On peut faire des requêtes sur les données de Victoria Metrics à des fins de debug : |
| |
- `curl` permet de requêter l'API qui écoute sur le port 8428, | - `curl` permet de requêter l'API qui écoute sur le port 8428, |
- l'endpoint `/api/v1/query` permet d'effectuer une requête Prometheus classique, | - l'endpoint `/api/v1/query` permet d'effectuer une requête Prometheus classique et de récupérer la dernière valeur connue, |
- `--data-urlencode` permet de passer un paramètre GET | - `--data-urlencode` permet de passer un paramètre GET |
- `jq` permet de formater le JSON de retour. | - `jq` permet de formater le JSON de retour. |
* Le requêtage s'effectue comme expliqué ici : https://prometheus.io/docs/prometheus/latest/querying/basics/ | * Le requêtage s'effectue comme expliqué ici : https://prometheus.io/docs/prometheus/latest/querying/basics/ |
* L'API a d'autres possibilités ; voir ici : https://prometheus.io/docs/prometheus/latest/querying/api | * L'API a d'autres possibilités ; voir ici : https://prometheus.io/docs/prometheus/latest/querying/api |
| </bootnote> |
| |
| <bootnote learn> |
| D'autres endpoints existent en fonction des besoins : |
| * L'endpoint `/api/v1/query_range` permet de récupérer les valeurs sur une période de temps données : https://prometheus.io/docs/prometheus/latest/querying/api/#range-queries |
| * L'endpoint `/api/v1/admin/tsdb/delete_series` permet de supprimer des valeurs insérées par mégardes : https://prometheus.io/docs/prometheus/latest/querying/api/#delete-series |
| * ... |
</bootnote> | </bootnote> |
| |
{{:technique:adminsys:monitoring:metrologie:blackbox_alert.jpg|}} | {{:technique:adminsys:monitoring:metrologie:blackbox_alert.jpg|}} |
| |
Cette alerte est levée quand la métrique `probe_success` d'un service vaut 0, c'est-à-dire que le service ne répond pas. C'est [[technique:adminsys:monitoring:metrologie:collect:blackbox|Blackbox]] qui insère cette métrique. Or, Blackbox est configuré pour surveiller les sites web, le LDAP... mais pas lui-même ! Que veut dire ce `blackbox.picasoft.net:443` ? Il n'est pas dans la configuration... | Cette alerte est levée quand la métrique `probe_success` d'un service vaut 0, c'est-à-dire que le service ne répond pas. C'est [[technique:adminsys:monitoring:collect:blackbox|Blackbox]] qui insère cette métrique. Or, Blackbox est configuré pour surveiller les sites web, le LDAP... mais pas lui-même ! Que veut dire ce `blackbox.picasoft.net:443` ? Il n'est pas dans la configuration... |
| |
<bootnote question> | <bootnote question> |