High availability cluster con FreeBSD

Riccardo Torrini riccardo a torrini.org
Ven 8 Ott 2004 10:54:07 CEST


On Fri, Oct 08, 2004 at 12:51:35AM +0200, Guido Bolognesi [Zen] wrote:

> Ora, mi pare evidente che a seconda delle esigenze ...

Tanto per fare traffico vi racconto una esperienza personale: circa
tre anni fa il firewall della sede di Genova era una macchina pagata
una 20na di milioni, doppio controller scsi a doppio canale, 8 dischi
in raid (2 in mirror per il sistema e due raid5 da 3), doppio power
supply da 750w (totali  :-), doppia cpu PPro/200 _SENZA_ ventola ma
con aletta stile motorino da 40cm (le ventole di solito sono la prima
cosa che si stronca bloccando tutto).  Insomma una macchina che a
prima vista avrebbe fatto dormire tranquillo chiunque...  Errore  :-)

Dopo un build/reinstall/reboot smise di rispondere...  Dovetti
prendere la macchina ed andare a vedere: ferma al bios con il
messaggio "keyboard error, press any key".  Il problema era un
componente da meno di 1 US$ che non era ovviamente ridondato.
Risultato?  3 giorni fermi ad aspettare la MoBo nuova (dove la
metti quella roba se non su quella macchina?  Un PC normale(!)
non ha modo di reggere tutti quei dischi etc etc.
(in realta' il problema era il bios pessimo che non permetteva
di specificare: halt all but keyboard).

Adesso abbiamo tutte macchine uguali 1U, due dischi in mirror, ed un
paio libere.  Se si rompe un disco di cambia a caldo, se si rompe
tutto il resto si spostano i dischi ed i cavi di rete.  Male che
vada in 10 minuti riparte.  Ridondarne 50 non avrebbe avuto senso.
Sono tutti servizi critici ma abbiamo valutato che anche un'ora
di fermo sarebbe stata accettabile (ed economicamente preferibile).

Tanto in ogni caso se non hai tutto doppio (dal gruppo di continuita'
che porta linee diverse ai rack al cablaggio strutturato agli switch
all'impianto antincendio alla macchinetta del caffe' e non so che
altro) qualcosa che non avevi previsto si scassa creando un danno
incalcolabile  :(  Ed in ogni caso in due "site" diversi...

Abbiamo anche 3 condizionatori industriali da 6kVA che funzionano due
alla volta a girare e una volta se ne bloccarono due insieme...
(questo per dire che non le pensi mai tutte, e a meno che tu non
abbia budget infinito e illimitato e' meglio non cominciare nemmeno)

Ah, dimenticavo: devi essere come minimo dual-homed ed avere banda
da due ISP diversi e farci load balancing o fail over altrimenti il
CED da millemilamilioni resta isolato al primo scavo che trancia una
fibra per la strada...

Inoltre abbiamo un paio di pezzi unici che per ridondarli ci voleva
veramente troppo (un GS80, alpha con 4 cpu) e una sun con tanto
spazio disco (troppo IMHO  :-)


> almeno 2 alimentatori, 2 cpu (ovviamente sostituibili a caldo), come 
> minimo 2 schede di rete (piu` quelle per la sincronia), 2 controller 
> verso lo storage...

E se si rompe la ram?  O una scheda PCI?  Ci sono macchine che fanno
cambiare a caldo anche quelle ma ne vale davvero la pena?


-- 
Riccardo. ( http://www.GUFI.org/~vic/ )



Maggiori informazioni sulla lista esperti