Настроил кластер на базе drbd+heartbeat. Почти все нормально нормально работает: монтируется ресурс /dev/drbd0 то к одной ноде, то нормально переезжает на другую...
в статусе drbd на основной ноде видим: service drbd status
drbd driver loaded OK; device status:
version: 8.0.13 (api:86/proto:86)
GIT-hash: ee3ad77563d2e87171a3da17cc002ddfd1677dbe build by buildsvn@c5-i386-
build, 2008-10-02 13:31:44
m:res cs
st
ds
p mounted fstype
0:r0 Connected Primary/Secondary UpToDate/UpToDate C /mnt/drbd0 ext4
Далее проводим следующие тесты:
1. На основной ноде выключаем heartbeat (service heartbeat stop), виртуальный интерфейс eth1:0 нормально переходит на другую ноду, ресурс /dev/drbd0 нормально переплыл..secondary нода перешла в режим primary. Т.е. все нормально
2. Выполняем команду ifdown eth0 на основной ноде, виртуальный интерфейс переехал на другую ноду, ресурс примонтировался..но при поднятии интерфейса ifup eth0 на отключенной ноде происходит якобы разрыв двух нод, они перестают пинговаться, service drbd status показывает состояние WFConnection. И как сделать чтобы такого не было, и кластер работал в полноценном режиме не могу додуматься, поэтому прошу помощи...
Конфиги:
/etc/ha.d/haresources
node1.company.ru IPaddr::192.168.146.140/24/eth1:0 drbddisk::r0 \
Filesystem::/dev/drbd0::/mnt/drbd0::ext3::defaults httpd
/etc/ha.d/ha.cf
logfacility local0
keepalive 2
deadtime 30
initdead 120
bcast eth0
auto_failback on
node node1.company.ru
node node2.company.ru
respawn hacluster /usr/lib/heartbeat/ipfail
use_logd yes
logfile /var/log/ha.log
debugfile /var/log/ha-debug.log
/etc/drbd.conf
global { usage-count yes; }
common { syncer { rate 20M; } }
resource r0 {
protocol C;
startup {
}
disk {
on-io-error detach;
}
net {
}
on node1.company.ru {
device /dev/drbd0;
disk
/dev/sdb;
address 192.168.146.150:7789;
meta-disk internal;
}
on node2.company.ru {
device /dev/drbd0;
disk
/dev/sdb;
address 192.168.146.134:7789;
meta-disk internal;
}
}
Заранее спасибо за помощь