to post messages and comments.

как люди живут вообще? Вот вижу утром был скачок нагрузки на некоторой машине с кучей сервисов. Память уходила в ноль, загружен проц. Что это было? Нет способа определить, симптомов вроде не проявлялось. Но память в нуле это опасно, не хочется чтоб это повторялось. Что хочется — нажимешь на моменте времени, видишь top процессов по процу, по памяти, по диску и сетке бы тоже. Почему нихуя нету опять базовейших инструментов в 2016?..
Ну пилю, чё

есть у кого примеры, как бы оптимально рисовать детальную утилизацию проца для одного хоста? Сложность в том, что ядер несколько, и по каждому несколько метрик (user+nice, system, iowait, irq, softirq, steal — даже если схлопнуть обе irq в sys, получается 4). Пока придумал, что надо агрегировать по ядрам по метрикам min/med/max, но как это дальше выводить, чтоб не получалась шумная каша?

обмазывался кто-нибудь prometheus'ом? Нихера не могу найти, что будет если, например, сетка между Prometheus server и экспортером на целевом хосте приляжет на время — данные метрик в экспортере накопятся, и он в следущий раз их все заберёт, или они радостно просрутся? И вообще, экспортер семплит систему по своему интервалу или когда приходит server?
Почему долбоёбы-авторы не задокументили это? (это риторический вопрос) При этом записано какое-то кукареканье про pull vs push advantages, но главного нету

influxdb.com
If you’ve installed InfluxDB locally, the influx command should be available
[email protected]:~$ dpkg -l | grep influx
ii influxdb 0.9.1 amd64 Distributed time-series database
[email protected]:~$ influx
influx: command not found

images5.fanpop.com

Very excited to announce InfluxDB has raised an $8.1M Series A from MayfieldFund 8 дек. 2014 г.
Блеать... Ебучие криворукие goблины.
Ну ладно, ок, у меня уже выработался рефлекс, иду репортить. Зашёл в ишьюс. Полистал. Иии чё-то призадумался, а стоит ли продолжать. Но ведь какие альтернативы, нету ведь ничерта

Thoughts on Time-series Databases @ hn
just migrated 20 million rows of Magic: the Gathering price data from influxDB to postgres this week. For a few days of effort, I decreased my query latency by an order of a magnitude; a full set query, roughly 270 cards, went from 30 to 3 seconds with a cold cache.С другой стороны, в influxDB готоый функционал и интеграция с grafana.

brendangregg.com
эх, да уж, какая же помойка, скока спущенных в унитаз лет и миллионов бачей ещё понадобится для хотя бы базовых удобств

The performance monitoring industry has dozens of companies focused on application performance monitoring, and on network performance monitoring and diagnostics. Gartner has previously estimated these industries to be $1.8 billion and $1 billion respectively. Many of their products include some form of server or instance analysis capabilities, however, most are just sar metrics.
I asked one monitoring vendor why they hadn't included latency heat maps, and their answer was that they build what customers ask for, and not enough customers had asked. This reminded me of the quote:
If I had asked people what they wanted, they would have said faster horses.

Кто-нибудь пользовался сервисами или программами для отслеживания новых объявлений на авито и иже с ним? Порылся в сети, есть несколько сервисов, но они или платные, или с намеком на последующую бамбардировку спамом. Что посоветуете?

О! Летом настроил на нескольких серверах мониторинг параметров через Munin. Сейчас смотрю — с АвиаПорта сообщение в почту «No space left…» Ночью зевнул ошибку и в /var/www/logs за несколько часов улетело 17Гб места. Успел почистить и исправить ошибку :) Надо, что ли, рассылку на SMS для критических параметров присобачить…

Хочу запробовать проектик shinken для мониторинга своего хозяйства, среди прочих приятных вещей, вроде поддержки нагиосовских плагинов и конфигураций, shinken исполнен на питоне, что не может не радовать меня с позиции разработчика.

Интернет-радио это кончено же интересно, но лучше бы крутили не одну музыку/юмор, а еще б транслировали ведение радиопереговоров (желательно с указанием частот, откуда было взято). А то свой сканер, похоже, ещё не скоро куплю... :-(

Смотрю я на альфа-версию веб-интерфейса icinga (форк nagios) и какие-то странные ощущения возникают. Красиво все сделано, особенно status map, но все куда-то нетуда направлено: пара схем в nagvis дает куда большее предствление о состоянии сети. Посмотреть на интерфейс можно здесь: alpha.icinga.org (пользователь: guest, пароль: guestuser)