В какой-то момент прилетает lock на одном из томов LVM, в итоге весь rgmanager ставится раком на кластере, fence не отрабатывает так как не видит проблем, clustat рапортует что все гуд, group_tool ls тоже самое, а lvm стоит раком, потом начинается зловещий поиск какая нода заблокировала том. Также посмотрите внимательно pvestatd, он раз в 10 секунд дергает всю инфу о машинах с lvm томов и так на каждой ноде, в итоге пока у тебя мало нод все работает сносно, как только количество нод вырастает начинается такие чудеса что LVM стоит раком. Под LVM для кластера подразумевается clvm кто еще не понял, штука очень редкая как оказалось и глючная, к тому же не дает достаточно информации чтобы понять какая именно нода дала сбой в работе.
|