riemann.io совсем хипстары опухли, написали, панимаешь, систему монитооринга на кожуре и еще предлагают ее скриптовать кожурой, кто этим пользоваться будет?!
Надо: мониторинг сервера на рам-диск-сру-ла + мониторинг запущенных там сервисов (запущенность процесса по имени, слушанье на ТЦП порту, успешный ТЦП цоннект по порту) + мониторинг сложных случаев скриптом.
Обязательно умение автоподхватывания новых инстансов (а-ля через заббикс-агент).
Скорее всего залезли через nrpe (Nagios remote plugin executor). Вот что значит не доконца настроеный фаервол.
bugzilla.redhat.com чота ржу(
exchange.nagios.org Директория с плагинами для нагиоса
Решение:
my solution (http://forums.meulie.net/viewtopic.php?f=61&t=6538&start=0):
# cat /etc/sysconfig/selinux
[...]
SELINUX=disabled
# /etc/init.d/nagios start
nagios wurde angehalten
nagios starten: [ OK ]
nrpe.cfg:
command[autoruns_HRManagers]=cmd /c "C:\Program Files\ICW\watch_autoruns.cmd" d:\\SharedFs\\HRManagers
(можно было бы использовать параметр и описать в одной строчке разом все каталоги, но паранойя не дремлет)
Рецепт:
Сервисы в нагиос (понятно)
Сам "антивирус" watch_autoruns.cmd (лол)
@SET PTH=%1
@SET PTH=%PTH:\=\\%
@IF EXIST %1\autorun.inf ( @GOTO :bad )
:ok
@REM все нормально
@echo NO autorun.inf IN %PTH% FOUND
@exit /b 0
:bad
@REM file exists
@for /F "tokens=4" %%a in ('dir /q %1 ^| findstr "autorun.inf"') do @set VAR=%%a
@del /f /q %1\autorun.inf
@echo FILE %PTH%\\autorun.inf EXISTS! Evildoer was %var:\=\\%. I will try to delete it — if the message persists, deleting fails
@exit /b 2
P.S. Если это кому пригодится — берите. Хотя кому такой детсад нужен...
NSClient — ERROR: Could not get data for 5 perhaps we don't collect data this far back? или
NSClient — ERROR: Failed to get PDH value.
сделай на проверяемом хосте lodctr /R
Nagios запищал после того как я зашел в серверную и включил монитор кнопкой:
* PROBLEM Service Alert: scusrv/APC LOAD is WARNING * WARNING — Load: 41.6%
Выключил монитор:
* RECOVERY Service Alert: scusrv/APC LOAD is OK * OK — Load: 38.3%
// Dumb Nagios script for Juick's state monitoring
$frontPage = file_get_contents("http://juick.com");
preg_match('#<div class="msgtxt">(.*?)</div>#', $frontPage, $matches);
$juickCurrent = $matches[1];
$juickPrev = file_get_contents("/tmp/juick_prev");
if ($juickCurrent == $juickPrev) {
echo "ERROR: Juick is down\n";
exit(2);
} else {
file_put_contents("/tmp/juick_prev", $juickCurrent);
echo "OK\n";
exit(0);
}
?>
#!/bin/sh
rm -rf /var/cache/nagios3/objects.cache/*
rm /var/lib/nagios3/retention.dat
freshports.org но не делающее новое подключение к irc на каждую проверку, а постоянно висящее? Меня уже слегка начинают напрягать постоянные сообщения о подключении/отключении этого check_nick.
Жуйк, а есть что-то вроде Error: Could not stat() command file '/var/lib/nagios3/rw/nagios.cmd'!
Решение поближе к телу:
[root@28741-1 ~] # /etc/init.d/nagios3 stop
Stopping nagios3 monitoring daemon nagios3 Waiting for nagios3 daemon to die........
[root@28741-1 ~] # dpkg-statoverride --update --add nagios www-data 2710 /var/lib/nagios3/rw
[root@28741-1 ~] # dpkg-statoverride --update --add nagios nagios 751 /var/lib/nagios3
[root@28741-1 ~] # /etc/init.d/nagios3 start
Ничего сложного, но кучу заёбывающих мелочей, гарантирую.
[stanis@dinexi ~/Downloads] % ls -la /usr/lib/nagios/plugins/check_dummy [17:28:59]
-rwxr-xr-x 1 root root 18416 2010-08-31 01:18 /usr/lib/nagios/plugins/check_dummy
Естественно, ELF.
Зачем, спрашивается, так сурово? На чём угодно наглядном — низя? :-D
да-да. это о nagios, не надо тут пошлостей!
Голова не хочет думать.