check_ganglia_metric

Logiciel capture d'écran:
check_ganglia_metric
Détails logiciels:
Version: 2012.02.28
Date de transfert: 15 Apr 15
Développeur: Michael T. Conigliaro
Licence: Gratuit
Popularité: 1

Rating: 3.0/5 (Total Votes: 1)

check_ganglia_metric est un plugin Nagios qui vous permet de déclencher des alertes sur toute Ganglia métrique.
check_ganglia_metric a été fortement inspiré par la check_ganglia_metric.php de Vladimir Vuksan, mais il est livré avec un certain nombre d'améliorations.

Installation

# Pip installer check_ganglia_metric
... Ou:
# Easy_install check_ganglia_metric
Configuration Ganglia
À moins que votre serveur Nagios et Ganglia Meta Daemon sont exécutés sur le même hôte, vous avez probablement besoin de modifier votre gmetad.conf pour permettre les connexions à distance de votre serveur Nagios.
Pour autoriser les connexions de nagios-server.example.com:
trusted_hosts nagios-server.example.com
Pour autoriser les connexions de tous les hôtes (probablement des risques de sécurité):
all_trusted sur
Les essais sur la ligne de commande
Tout d'abord, nous allons voir si check_ganglia_metric peut communiquer avec le Ganglia Meta Daemon:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle
Statut Ok, CPU Idle = 99,3% | 99,3% cpu_idle = ;;;;
Le message "Etat OK" indique que check_ganglia_metric travaille. Si vous ne arrivez pas que cela fonctionne, essayez à nouveau avec la journalisation détaillée activée (--verbose) afin d'obtenir un meilleur aperçu de ce qui va mal.
Essayons maintenant de fixer un seuil d'alerte:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle --critical = 99
État critique, CPU Idle = 99,6% | 99,6% cpu_idle = 99 ;; ;;
Nous avons dit check_ganglia_metric de retourner un état "critique" si le CPU Idle était supérieure à 99. Le message "état critique" indique que cela a fonctionné. Notez que check_ganglia_metric analyse gammes et seuils selon les directives officielles Nagios de développement de plugin.
Pour voir la liste complète des options de ligne de commande avec de brèves explications, exécutez check_ganglia_metric avec l'option --help.
Configuration Nagios
D'abord, créez une définition de commande:
commande define {
& Nbsp; command_name check_ganglia_metric
& Nbsp; command_line /usr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ HOSTADDRESS $ --metric_name = $ ARG1 $ --warning = $ ARG2 $ --critical = $ ARG3 $
}
Maintenant, vous pouvez utiliser la commande ci-dessus dans vos définitions de service:
define service {
& Nbsp; service_description CPU ralenti - Ganglia
& Nbsp; l'utilisation some_template
! & Nbsp; check_command check_ganglia_metric cpu_idle 0: 20 0: 0!
& Nbsp; host_name host.example.com
}
Cela fonctionne bien jusqu'à ce que quelque chose va mal avec check_ganglia_metric (par exemple, le fichier cache ne peut être lu / écrit, les ganglions Meta démon ne peut pas être atteint, etc.). À ce moment, tous les services qui se appuie sur check_ganglia_metric échouera, peut-être vous inonder avec des alertes. On peut éviter cela par l'utilisation de dépendances de service.
La première chose que nous avons besoin est une définition de commande pour vérifier l'âge d'un fichier:
commande define {
& Nbsp; command_name check_file_age
& Nbsp; command_line / usr / lib / nagios / plugins / check_file_age -f $ ARG1 $ -w $ ARG2 $ -c $ ARG3 $
}
Ensuite, nous définissons un service qui vérifie l'âge du fichier de cache de check_ganglia_metric. Notez que pour être vraiment efficace, ce service doit être vérifié au moins aussi (de préférence plus) fréquemment que tous les autres contrôles qui se appuient sur check_ganglia_metric:
define service {
& Nbsp; Cache service_description pour check_ganglia_metric
& Nbsp; l'utilisation some_template
& Nbsp;!!! Check_command check_file_age /var/lib/nagios/.check_ganglia_metric.cache 60 120
& Nbsp; host_name localhost
& Nbsp; check_interval 1
& nbsp; une max_check_attempts
}
Et enfin, nous avons créé la dépendance de service effectif. Notez que je ai activé use_regexp_matching dans Nagios, qui me permet d'utiliser des expressions régulières dans mes directives. En collant "- Ganglia" à la fin de chaque service qui se appuie sur check_ganglia_metric, je peux me sauver beaucoup d'efforts:
define servicedependency {
& Nbsp; host_name localhost
& Nbsp; Cache service_description pour check_ganglia_metric
& Nbsp; dependent_host_name *.
& Nbsp;. Dependent_service_description * - Ganglia $
& Nbsp; execution_failure_criteria c, p
}
Maintenant, si quelque chose va mal avec check_ganglia_metric, une seule alerte sera envoyé sur le fichier de cache, et tous les contrôles de service à charge sera suspendue jusqu'à ce que vous résoudre le problème qui a causé check_ganglia_metric à l'échec. Une fois que le problème est résolu, vous aurez besoin de mettre à jour l'horodatage sur le fichier de cache afin de mettre le "Cache pour check_ganglia_metric« service nouveau dans un état OK (ce qui permettra de vérifier de services dépendants de continuer):
& Nbsp; contact /var/lib/nagios/.check_ganglia_metric.cache
Trucs et astuces
Il est possible d'obtenir une liste complète des hôtes et des paramètres disponibles en activant la journalisation "plus verbeux" (-vv). Depuis les options de metric_host et METRIC_NAME sont nécessaires, vous avez un peu d'une "poule et l'oeuf" problème ici, mais ce est OK. Juste fournir quelques données factices. Le plugin erreur à la fin avec un «hôte / métrique introuvable" d'erreur, mais pas avant qu'elle déverse son cache:
& Nbsp; check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = --metric_name fictif = -vv fictif

Quoi de neuf dans cette version:

  • Ajouter - l'option -metrics_max_age
  • Fusionner CHANGELOG.rst dans README.rst

Exigences :

  • Python
  • Nagios

Limites :

  • Ne fonctionne pas avec Python 2.4

Logiciel similaire

firewall
firewall

3 Jun 15

QSupervisorControl
QSupervisorControl

20 Feb 15

check_tcptraffic
check_tcptraffic

15 Apr 15

graphite-metrics
graphite-metrics

20 Feb 15

Commentaires à check_ganglia_metric

Commentaires non trouvées
Ajouter un commentaire
Tourner sur les images!