check_ganglia_metric

Скріншот програми:
check_ganglia_metric
Дані програми:
Версія: 2012.02.28
Дата завантаження: 15 Apr 15
Розробник: Michael T. Conigliaro
Ліцензія: Безкоштовно
Популярність: 1

Rating: 3.0/5 (Total Votes: 1)

check_ganglia_metric є плагін Nagios, що дозволяє видавати попередження на будь-якому гангліїв метрики.
check_ganglia_metric був сильно натхненний check_ganglia_metric.php Володимира Vuksan, але він приходить з низкою вдосконалень.

Установка

# Пункт встановити check_ganglia_metric
... Або:
# Easy_install check_ganglia_metric
Конфігурація Ганглії
Якщо ваш сервер Nagios і Ganglia мета демона, працюють на одному хості, Ви, ймовірно, не потрібно редагувати gmetad.conf для віддалених підключень з вашого сервера Nagios.
Щоб вирішити з'єднання від nagios-server.example.com:
trusted_hosts nagios-server.example.com
Щоб вирішити з'єднання від усіх хостів (ймовірно, ризику безпеки):
all_trusted на
Тестування в командному рядку
По-перше, давайте подивимося, якщо check_ganglia_metric може спілкуватися з гангліях Мета-демона:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
І NBSP; - metric_host = host.example.com --metric_name = cpu_idle
Статус Ok, CPU Idle = 99,3% | cpu_idle = 99,3% ;;;;
"Ok Статус" повідомлення означає, що check_ganglia_metric працює. Якщо у вас виникли проблеми з отриманням щоб це працювало, спробуйте ще раз з веденням докладного журналу включено (--verbose) для того, щоб отримати більш повне уявлення, що відбувається не так.
Тепер давайте спробуємо установки порогових значень для оповіщення:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
І NBSP; - metric_host = host.example.com --metric_name = cpu_idle --critical = 99
Статус Критичний, CPU Idle = 99,6% | cpu_idle = 99,6% ;; 99 ;;
Ми сказали check_ganglia_metric повернути «критичної» статус, якщо Idle CPU була більше, ніж 99. "критичному стані" повідомлення означає, що він працював. Зверніть увагу, що check_ganglia_metric аналізує діапазони і порогові значення згідно з офіційними протоколами з розробки плагінів для Nagios.
Щоб побачити повний список опцій командного рядка з короткими поясненнями, у віданні check_ganglia_metric з опцією --help.
Конфігурація Nagios
По-перше, створити визначення команди:
визначити команду {
І NBSP; command_name check_ganglia_metric
І NBSP; command_line /usr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ HOSTADDRESS $ --metric_name = $ ARG1 $ --warning = $ ARG2 $ --critical = $ Арг3 $
}
Тепер ви можете використовувати цю команду у визначеннях послуг:
визначити службу {
І NBSP; service_description CPU Idle - Ганглії
І NBSP; використання some_template
! & NBSP; check_command check_ganglia_metric cpu_idle 0: 20 0: 0!
І NBSP; host_name host.example.com
}
Це буде чудово працювати, поки щось піде не так з check_ganglia_metric (наприклад, кеш-файл не може бути прочитаний / запис, Ганглії мета демона, не може бути досягнутий, і т.д.). У той момент, кожна послуга, яка спирається на check_ganglia_metric не вдасться, можливе затоплення вас з попередженнями. Ми можемо запобігти цьому за рахунок використання послуг залежностей.
Перше, що нам потрібно, це визначення команди для перевірки віку файлу:
визначити команду {
І NBSP; command_name check_file_age
І NBSP; command_line / USR / Lib / Nagios / плагіни / check_file_age -f $ ARG1 $ -w $ ARG2 $ -c $ Арг3 $
}
Далі, ми визначаємо послугу, яка перевіряє вік файлів кеша check_ganglia_metric-х років. Зверніть увагу, що для того, щоб бути по-справжньому ефективною, ця служба повинна бути перевірена принаймні, (бажано більше) частіше, ніж усіх інших перевірок, які покладаються на check_ganglia_metric:
визначити службу {
І NBSP; service_description Кеш check_ganglia_metric
І NBSP; використання some_template
120 check_command check_file_age /var/lib/nagios/.check_ganglia_metric.cache 60; & NBSP !!
І NBSP; host_name локальний
І NBSP; check_interval 1
і NBSP; max_check_attempts 1
}
І, нарешті, ми створили реальну залежність служби. Зверніть увагу, що я включений use_regexp_matching в Nagios, який дозволяє мені використовувати регулярні вирази в своїх директив. Дотримуючись "- Ganglia" в кінці кожної служби, яка спирається на check_ganglia_metric, я можу врятувати себе багато зусиль:
визначити servicedependency {
І NBSP; host_name локальний
І NBSP; service_description Кеш check_ganglia_metric
І NBSP; dependent_host_name *.
І NBSP ;. Dependent_service_description * - Ганглії $
І NBSP; execution_failure_criteria C, P
}
Тепер, якщо щось піде не так з check_ganglia_metric, тільки одне попередження буде розісланий про фото кешу, і всі залежні контрольні перевірки буде припинена до тих пір, поки виправити проблему, яка привела check_ganglia_metric на провал. Після того, як проблема буде усунена, вам потрібно оновити модифікації файлу кеша для того, щоб поставити "кеш для check_ganglia_metric" послуга назад в стані ОК (що дозволить залежні контрольні перевірки для продовження):
І NBSP; сенсорний /var/lib/nagios/.check_ganglia_metric.cache
Поради та хитрості
Це можливо, щоб отримати повний список доступних хостів і метрик, дозволяючи "більш докладний" реєстрація (-vv). З потребуючим metric_host і METRIC_NAME опції, ви можете трохи про «курку і яйце» проблеми тут, але це нормально. Просто поставити деякі фіктивні дані. Плагін буде помилка в кінці з "господаря / метрична не найден", але не раніше, ніж він скидає кеш:
І NBSP; check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
І NBSP; - metric_host = манекен --metric_name = манекен -vv

Що нового У цьому випуску:

  • Додати - -metrics_max_age пункт
  • Merge CHANGELOG.rst в README.rst

Вимоги

  • Python
  • Nagios

Обмеження

  • Не работает с Python 2.4

Схожі програми

cciss_vol_status
cciss_vol_status

20 Feb 15

Comedi
Comedi

2 Jun 15

Ortro
Ortro

14 Apr 15

FW1-Loggrabber
FW1-Loggrabber

3 Jun 15

check_ganglia_metric

Коментар не знайдено
додати коментар
Включіть картинки!