The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Выпуск системы мониторинга Zabbix 3.4, opennews (??), 23-Авг-17, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


13. "Выпуск системы мониторинга Zabbix 3.4"  +/
Сообщение от abu (?), 23-Авг-17, 14:49 
Да неужто? Валить все данные в одну (две - хистори и тренд) таблицу это более типовое использование?

Как мне кажется, partitioning - один из основных, как по мне, залогов успеха в использовании zabbix'a. Можно, конечно, тратить деньги на SAS-винты (а они недешевы) и =усиление= остального железа. Но хотя бы помесячная разбивка history - почему бы и нет? Даже без partitioning, а просто - новый месяц - новая таблица? Мб, конечно, я что-то не понимаю в этом, тогда прошу просветить меня в этом вопросе.

Ответить | Правка | Наверх | Cообщить модератору

20. "мониторинга Zabbix... "  +/
Сообщение от Andrey Mitrofanov (?), 23-Авг-17, 16:03 
> Да неужто? Валить все данные в одну (две - хистори и тренд)
> таблицу это более типовое использование?

А-ага. для 3-4-20 хостов и sqlite-а -- самое то.

Ну, и о себе:

4x history + 2x trends. +их индексы.  => 99%+ бд.

            relname             |    size    |     size_b
trends_uint                     | 22 GB      | 24 074 412 032
history                         | 17 GB      | 17 982 316 544
history_1                       | 13 GB      | 14 055 489 536
history_uint                    | 11 GB      | 12 208 955 392
history_uint_1                  | 11 GB      | 11 488 436 224
trends                          | 11 GB      | 11 354 144 768
trends_uint_pkey                | 10 GB      | 10 905 575 424
trends_pkey                     | 4910 MB    | 5 148 925 952
history_text                    | 918 MB     | 962 666 496
alerts                          | 418 MB     | 438 370 304
history_str                     | 326 MB     | 341 729 280
history_text_pkey               | 285 MB     | 298 926 080
history_str_1                   | 259 MB     | 271 941 632
events                          | 233 MB     | 244 039 680

> Как мне кажется, partitioning - один из основных, как по мне, залогов
> успеха в использовании zabbix'a. Можно, конечно, тратить деньги на SAS-винты (а
> они недешевы) и =усиление= остального железа. Но хотя бы помесячная разбивка
> history - почему бы и нет? Даже без partitioning, а просто
> - новый месяц - новая таблица? Мб, конечно, я что-то не
> понимаю в этом, тогда прошу просветить меня в этом вопросе.

Здесь history [в массе] 3 day(*) и сбор раз в минуту, trends 365d.

Все history - 54гига из 104~(**)  --  "горячие", переписываются полностью (float/int по кр.мере; 51.9ГБ) каждые 3 дня...  тормозят и фрагментируются...... . . . . . .....

housekeeper-ы, vacuum-ы, pg_repack-и -- ужос, ухос, ужос.  А, да! thin lvm + fstrim!11

Работаем!            //"А, чтобы попасть куда-нибудь, нужно бежать вдвое быстрее."

(*) какое там "новый месяц".  И трендсы, месяца ч-з 3 после репака, - тоже тормозят.
(**) "из 104~" - репак неделю тому, .../base/ size был 93.7ГБ.  NVPS="1.12 K", avg(1mnth)  Да, тот самый кейс для партишенинга... Да...  Обдумываю. Третий год!  Но 8 шпинделей и 128ГБ озу -- много проще и :) "безопаснее".

Ответить | Правка | Наверх | Cообщить модератору

40. "мониторинга Zabbix... "  +/
Сообщение от Abu (?), 24-Авг-17, 03:12 
Кстати, похожая картина, только 7 дней хистори и оперативы поменьше. У меня в наследство остался старый Zabbix еще версии 1.8. БД на postgres'e, большая, более 100 гиг, две таблицы забиты всерьез - history_uint и trends_uint. Принялся настраивать тестовый, посвежее, и =очевидно= же (: , что грузит людей не пиво, а housekeeper да vacuum. С vacuum все понятно, с housekeeper пишут все кто во что горазд. Да, пока спасают SAS-винты, но когда они начинают подламываться, то обращаешь внимание на цену и оптимизацию.

Мои рассуждения тут не новы - надо отстегивать старую статистику, как последние вагоны в =Чапаеве и Пустоте= - решительно и бесповоротно, без всяких housekeeper'ов, с помощью partitioning. А partitioning - тоже на него смотрю и обдумываю, но какая-то документация про него на zabbix'e староватая.

Ответить | Правка | Наверх | Cообщить модератору

53. "мониторинга Zabbix... "  +/
Сообщение от amonymous (?), 24-Авг-17, 10:33 
8 шпинделей и 128 ГБ? А сколько у вас values/second?

MariaDB. RAID 10 из четырёх стареньких SAS 300, и 300 Гб. Два шестиядерника, потому что из базы регулярно забираются данные для внешних графиков и отчётов.

history_uint - в TokuDB - ~90 гиг со сжатием LZMA, хистори партиционируется и хранится за месяц. Вся база с трендами и прочими хисторями весит ~130 гиг.

Не чихает.

Number of hosts (enabled/disabled/templates)    6296    5423 / 777 / 96
Number of items (enabled/disabled/not supported)    192574    164756 / 25101 / 2717
Number of triggers (enabled/disabled [problem/ok])    36556    36475 / 81 [323 / 36152]
Required server performance, new values per second    1036.44    

top - 09:33:23 up 91 days, 14:00,  3 users,  load average: 9.00, 6.63, 6.60
Tasks: 1438 total,  23 running, 1412 sleeping,   0 stopped,   3 zombie
%Cpu(s): 32.0 us, 35.2 sy,  0.0 ni, 29.3 id,  0.3 wa,  0.0 hi,  2.5 si,  0.8 st
KiB Mem : 28555988 total,  1020028 free, 25595728 used,  1940232 buff/cache
KiB Swap:  1048572 total,   865316 free,   183256 used.  1964288 avail Mem

df -h | grep DB
/dev/mapper/DB-DB        197G  138G   59G  71% /db

Ответить | Правка | К родителю #20 | Наверх | Cообщить модератору

55. "мониторинга Zabbix... "  +/
Сообщение от amonymous (?), 24-Авг-17, 10:58 
Фак.

Вторую строчку читать так:

---
MariaDB. RAID 10 из четырёх стареньких SAS 300, и 32 Гб RAM. Два шестиядерника, потому что из базы регулярно забираются данные для внешних графиков и отчётов.
---

Ответить | Правка | Наверх | Cообщить модератору

57. "мониторинга Zabbix... "  +/
Сообщение от Andrey Mitrofanov (?), 24-Авг-17, 12:16 
> 8 шпинделей и 128 ГБ? А сколько у вас values/second?

2 zabbix-а на одинаковом железе
NVPS(*):  "1.12 K";  "1.26 K"  //avg/month
Required server performance, nvps:  832.11 ;  1480.13

(*) - который zabbix[requiredperformance] - фактические insert-ы в базу, не то же самое, что "Required server performance" - айтемы поделенные на интервалы.

> MariaDB. RAID 10 из четырёх стареньких SAS 300, и 300 Гб. Два
> шестиядерника, потому что из базы регулярно забираются данные для внешних графиков
> и отчётов.

Какие-то диски на каком то megaraid-е, кажется, в raid-$каком-то... Вообще не копенгаген.

> history_uint - в TokuDB - ~90 гиг со сжатием LZMA, хистори партиционируется
> и хранится за месяц. Вся база с трендами и прочими хисторями
> весит ~130 гиг.

vanila Pg 9.1. Соответственно, ни сжатия, ни партиций.

> Не чихает.

С LA > 6 ?  А вот пользователь открывает скрин с 5-7 графиками по 5-10 айтемов, да за год -- и ждёт, ждёт, ждёт. :) Да?

[два сервера: #1; #2]
Number of users online:   17;  10

> Number of hosts (enabled/disabled/templates) 6296 5423 / 777 / 96
> Number of items (enabled/disabled/not supported) 192574 164756 / 25101 / 2717
> Number of triggers (enabled/disabled [problem/ok]) 36556 36475 / 81 [323 / 36152]
> Required server performance, new values per second 1036.44

[два сервера: #1; #2]
hosts (en,/dis./templates)  2265  1653 / 144 / 468;   1052  838 / 87 / 127
items (en,/dis./not sup.)   73326  71170 / 1359 / 797;   90769  81400 / 6559 / 2810
triggers (en,/dis.)       44245  41907 / 2338;   9267   8703 / 564
Required server performance, nvps:  832.11 ;  1480.13


> top - 09:33:23 up 91 days, 14:00,  3 users,  load
> average: 9.00, 6.63, 6.60

LA5, avg(month):  3.53;  0.97
[на втором web-юзеров, видимо, меньше; скриптов меньше, возможно... может, ещё чего... са мне знаю]

Переход с Zb 2.0 на 3.0 снизил LA, кстати: 4.67 => 3.52;  1.48 => 1.04

После крайнего pg_repack-а (вкл.trends-ы) -
LA5, за почти 8/10 посл.дней, avg/max:  2.83 / 6.45 ;  0.91 / 2.82
недедя прямо до репака, avg/max: 4.1 / 9.8;  1.04 / 3.49

> df -h | grep DB
> /dev/mapper/DB-DB        197G  138G  
>  59G  71% /db

base/ + pg_xlog/ -
   до репака: 108.7G + 12..27GB;  96.6G + 11.8G
   сразу после репака:  93.7G + 11.8G;  85.4G + 11.8G
сейчас (почти 8;почти 10 дней) base/ вырос до:  104G ;  95G

Ответить | Правка | К родителю #53 | Наверх | Cообщить модератору

61. "мониторинга Zabbix... "  –1 +/
Сообщение от Аноним (-), 24-Авг-17, 12:45 

> vanila Pg 9.1. Соответственно, ни сжатия, ни партиций.

Ээээ... Апстрим как бы в следующем месяце 9.2 торжественно отправляет на свалку, а вы до сих пор на 9.1 хромаете.

Ответить | Правка | Наверх | Cообщить модератору

63. "мониторинга Zabbix... "  +/
Сообщение от Andrey Mitrofanov (?), 24-Авг-17, 13:01 
>> vanila Pg 9.1. Соответственно, ни сжатия, ни партиций.
> Ээээ... Апстрим как бы в следующем месяце 9.2 торжественно отправляет на свалку,
> а вы до сих пор на 9.1 хромаете.

И вам не кашлять.

2017-08-10 https://github.com/credativ/postgresql-lts/releases/tag/REL9...
2017-08-10 https://lists.debian.org/debian-lts-announce/2017/08/msg0000...
2017-08-12 https://debconf17.debconf.org/talks/54/

Ответить | Правка | Наверх | Cообщить модератору

72. "мониторинга Zabbix... "  –1 +/
Сообщение от Аноним (-), 24-Авг-17, 17:47 
Это что за ссылки на левак? Смотрите в первоисточник: https://www.postgresql.org/about/news/1712/ а так-то ничто не мешает в боевую бросать работать 6.4. Будет очень винтажно-лампово.

====
This is also the last update for the PostgreSQL 9.1 series as it is now end-of-life.
====

Нет у PG такого понятия как LTS. Пять лет на каждую ветку и ни неделей больше - https://www.postgresql.org/support/versioning/

Ответить | Правка | Наверх | Cообщить модератору

76. "мониторинга Zabbix... "  +/
Сообщение от Andrey Mitrofanov (?), 24-Авг-17, 18:53 
> Это что за ссылки на левак?
> Нет у PG такого понятия как LTS. Пять лет на каждую ветку
> и ни неделей больше - https://www.postgresql.org/support/versioning/

Ну, пусть подают в суд за ТМ.  Какие ко мне-то претензии.  Ты не адвокат, нет?

"Суслика видишь? Нет, А он есть!"

Та же история: "у PG" lts-а нет, а Pg-9.1.24lts2 есть.

Ответить | Правка | Наверх | Cообщить модератору

71. "мониторинга Zabbix... "  –1 +/
Сообщение от amonymous (?), 24-Авг-17, 17:44 
>>> С LA > 6 ?  А вот пользователь открывает скрин с 5-7 графиками по 5-10 айтемов, да за год -- и ждёт, ждёт, ждёт. :) Да?

Именно, с LA > 6. Иногда и > 12. Весьма здоровая установка, LA в данном случае (сотни поллеров и пингеров) - показатель совершенно не адекватный. Может отчасти потому, что всё крутится под XenServer, хз.

Основной показатель для меня то, что сервер при этом прекрасно отзывается на любые раздражители, а очередь Zabbix не растёт.

Там ещё и пачка тяжёлых отчётов крутится. Причём их запуск на собственно работу Zabbix не влияет, очередь не растёт.

К слову, графики вытащены на внешний сервер, в RRD, но и на самом Zabbix при необходимости генерятся быстро. Даже приоритеты мучать не пришлось.

Для расчёта нагрузки смотрю на конкретные perCPU показатели, они все в рамках нормы. Wait'а около 0, в основном user и system (сеть/диск). Running processes болтается в диапазоне 5-25, из-за тех же резво бегающих пингеров.

Чуть побольше топа для понимания ситуации с загрузкой:

top - 16:38:58 up 91 days, 21:06,  3 users,  load average: 3.58, 5.34, 6.14
Tasks: 1426 total,   7 running, 1418 sleeping,   0 stopped,   1 zombie
%Cpu0  :  5.1 us,  3.7 sy,  0.0 ni, 90.9 id,  0.0 wa,  0.0 hi,  0.0 si,  0.3 st
%Cpu1  :  8.8 us,  8.8 sy,  0.0 ni, 80.4 id,  0.0 wa,  0.0 hi,  1.4 si,  0.7 st
%Cpu2  :  4.5 us,  4.8 sy,  0.0 ni, 90.1 id,  0.0 wa,  0.0 hi,  0.0 si,  0.7 st
%Cpu3  :  7.8 us,  5.1 sy,  0.0 ni, 81.2 id,  5.5 wa,  0.0 hi,  0.0 si,  0.3 st
%Cpu4  : 23.3 us,  5.7 sy,  0.0 ni, 70.7 id,  0.0 wa,  0.0 hi,  0.0 si,  0.3 st
%Cpu5  : 12.8 us,  4.7 sy,  0.0 ni, 82.1 id,  0.0 wa,  0.0 hi,  0.0 si,  0.3 st
%Cpu6  :  5.1 us,  5.1 sy,  0.0 ni, 89.5 id,  0.0 wa,  0.0 hi,  0.0 si,  0.3 st
%Cpu7  :  8.5 us,  3.9 sy,  0.0 ni, 78.2 id,  0.4 wa,  0.0 hi,  8.8 si,  0.4 st
%Cpu8  :  9.1 us,  5.7 sy,  0.0 ni, 84.9 id,  0.0 wa,  0.0 hi,  0.0 si,  0.3 st
%Cpu9  : 55.5 us,  2.0 sy,  0.0 ni, 42.2 id,  0.0 wa,  0.0 hi,  0.0 si,  0.3 st
%Cpu10 :  5.4 us,  4.7 sy,  0.0 ni, 89.5 id,  0.0 wa,  0.0 hi,  0.0 si,  0.3 st
%Cpu11 :  7.2 us,  3.8 sy,  0.0 ni, 84.0 id,  4.8 wa,  0.0 hi,  0.0 si,  0.3 st
KiB Mem : 28555988 total,  1311012 free, 25342528 used,  1902448 buff/cache
KiB Swap:  1048572 total,   861052 free,   187520 used.  2216968 avail Mem

  PID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND
26558 mysql     20   0 44.388g 0.011t   5360 S  72.4 41.8 211816:03 /usr/sbin/mysqld
24084 zabbix    20   0  565792  12464   7468 S  12.0  0.0   0:00.39 /opt/httpd/bin/httpd -f /etc/httpd/php70/httpd.conf -DFOREGROUND
20440 zabbix    20   0   93332    936    724 S   6.2  0.0 896:49.85 /usr/sbin/zabbix_agentd: active checks #1 [idle 1 sec]
24161 zabbix    20   0  565792  12516   7484 S   4.5  0.0   0:00.14 /opt/httpd/bin/httpd -f /etc/httpd/php70/httpd.conf -DFOREGROUND
23986 root      20   0  159340   3796   1644 R   2.3  0.0   0:00.78 top
24048 zabbix    20   0  565792  12940   7624 S   2.3  0.0   0:00.11 /opt/httpd/bin/httpd -f /etc/httpd/php70/httpd.conf -DFOREGROUND
24072 zabbix    20   0    7984    708    584 S   1.9  0.0   0:00.07 /usr/sbin/fping -C3
24090 zabbix    20   0    7984    708    580 S   1.9  0.0   0:00.06 /usr/sbin/fping -C3
23982 zabbix    20   0    7984    724    584 R   1.6  0.0   0:00.15 /usr/sbin/fping -C3
24010 zabbix    20   0    7984    724    584 S   1.6  0.0   0:00.12 /usr/sbin/fping -C3
24019 zabbix    20   0    7984    720    584 S   1.6  0.0   0:00.11 /usr/sbin/fping -C3
24023 zabbix    20   0    7984    724    584 S   1.6  0.0   0:00.11 /usr/sbin/fping -C3
24036 zabbix    20   0    7984    720    584 S   1.6  0.0   0:00.09 /usr/sbin/fping -C3
24045 zabbix    20   0    7984    720    584 S   1.6  0.0   0:00.09 /usr/sbin/fping -C3
24049 zabbix    20   0  565792  12608   7472 S   1.6  0.0   0:00.12 /opt/httpd/bin/httpd -f /etc/httpd/php70/httpd.conf -DFOREGROUND
24066 zabbix    20   0    7984    720    584 S   1.6  0.0   0:00.07 /usr/sbin/fping -C3
24068 zabbix    20   0    7984    720    584 S   1.6  0.0   0:00.07 /usr/sbin/fping -C3
24076 zabbix    20   0    7984    724    584 S   1.6  0.0   0:00.05 /usr/sbin/fping -C3
24079 zabbix    20   0    7984    724    584 S   1.6  0.0   0:00.05 /usr/sbin/fping -C3
24086 zabbix    20   0  565792  12680   7368 S   1.6  0.0   0:00.08 /opt/httpd/bin/httpd -f /etc/httpd/php70/httpd.conf -DFOREGROUND
24147 zabbix    20   0  565792  12964   7672 S   1.6  0.0   0:00.05 /opt/httpd/bin/httpd -f /etc/httpd/php70/httpd.conf -DFOREGROUND
24153 zabbix    20   0  565792  12680   7368 S   1.6  0.0   0:00.05 /opt/httpd/bin/httpd -f /etc/httpd/php70/httpd.conf -DFOREGROUND
24184 zabbix    20   0    7984    700    584 R   1.6  0.0   0:00.05 /usr/sbin/fping -C3
24222 zabbix    20   0  299940  13740   8660 R   1.6  0.0   0:00.05 /opt/php70/bin/php /usr/lib/zabbix/externalscripts/mass_sip_check.php -H 1
24224 zabbix    20   0  297860  13796   8720 R   1.6  0.0   0:00.05 /opt/php70/bin/php /usr/lib/zabbix/externalscripts/mass_sip_check.php -H 2
24226 zabbix    20   0  299408  12180   7732 R   1.6  0.0   0:00.05 /opt/php70/bin/php /usr/lib/zabbix/externalscripts/mass_sip_check.php -H 3

Ответить | Правка | К родителю #57 | Наверх | Cообщить модератору

82. "мониторинга Zabbix... "  –3 +/
Сообщение от www2 (ok), 24-Авг-17, 20:37 
Держите нас в курсе.

Ответить | Правка | Наверх | Cообщить модератору

83. "мониторинга Zabbix... "  +/
Сообщение от anomymous (?), 24-Авг-17, 21:14 
Обязательно. Как только заплатите.
Ответить | Правка | Наверх | Cообщить модератору

73. "мониторинга Zabbix... "  +/
Сообщение от amonymous (?), 24-Авг-17, 17:59 
832 и 1480 - да, неплохо, у нас явно сопоставимые инсталляшки.

Попробуйте MariaDB + TokuDB где-то на "небоевой", если есть возможность, вполне возможно, что вас устроит. Единственное что - при таких объёмах надо сразу закладывать партиционирование, а встроенный очищальщик через "DELETE" выключать нафиг.

---

По графикам , кстати, основной набор графиков у нас, как и говорил, на внешней системе - их просто очень много, там тысячи графиков, в RRD на 3 года. Данные в RRD сливаются с Zabbix, запросами в базу - таким образом разгружаем системы за счёт запроса данных оптом, а не по каждому элементу.

Ответить | Правка | К родителю #57 | Наверх | Cообщить модератору

74. "мониторинга Zabbix... "  +/
Сообщение от Andrey Mitrofanov (?), 24-Авг-17, 18:48 
>> 8 шпинделей и 128 ГБ? А сколько у вас values/second?
> 2 zabbix-а на одинаковом железе
> NVPS(*):  "1.12 K";  "1.26 K"  //avg/month
> Required server performance, nvps:  832.11 ;  1480.13

2013-04-29  http://www.opennet.ru/openforum/vsluhforumID13/848.html#1 "Давно сидим..."(ц)

а перед тем как раз разделил сервер пополам -
2013-04-11  NVPS "до":     770
2013-04-xx  NVPS "после":  313  +  461

Ответить | Правка | К родителю #57 | Наверх | Cообщить модератору

69. "мониторинга Zabbix... "  +/
Сообщение от shutdownow (?), 24-Авг-17, 15:41 
12 HDD, 32GB RAM.
Размер базы в пределах 1.5 TB.
Год назад реализовал partitioning на pg + pg_partman. Жить можно.
                   relation                    |   size
-----------------------------------------------+----------
public.history_uint_p2017_05                  | 114 GB
public.history_uint_p2017_05_itemid_clock_idx | 113 GB
public.history_uint_p2017_07                  | 112 GB
public.history_uint_p2017_07_itemid_clock_idx | 111 GB
public.history_uint_p2017_06                  | 109 GB
public.history_uint_p2017_06_itemid_clock_idx | 108 GB
public.history_uint_p2017_08                  | 86 GB
public.history_uint_p2017_08_itemid_clock_idx | 85 GB
public.history_str_p2017_05                   | 7883 MB
public.history_str_p2017_07                   | 7035 MB
public.history_str_p2017_06                   | 6861 MB
public.history_str_p2017_05_itemid_clock_idx  | 6739 MB
public.history_p2017_05                       | 6173 MB
public.history_p2017_05_itemid_clock_idx      | 5986 MB
public.history_str_p2017_07_itemid_clock_idx  | 5978 MB
public.history_p2017_07                       | 5963 MB
Ответить | Правка | К родителю #53 | Наверх | Cообщить модератору

34. "Выпуск системы мониторинга Zabbix 3.4"  +1 +/
Сообщение от YetAnotherOnanym (ok), 23-Авг-17, 20:10 
> хотя бы помесячная разбивка history

Может быть, Вы на своих серверах ещё и ротацию логов делаете?

Ответить | Правка | К родителю #13 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру