freebsd 8 e inconsueta situazione

Ferruccio Zamuner nonsolosoft a diff.org
Mar 15 Giu 2010 11:04:02 CEST


Ciao,

ieri notte ho notato che un dump -L di una partizione di cui effettuo il 
  backup quotidianamente impiegava troppo tempo e proprio non sembrava 
procedere.

CRTL-C non interrompeva il comando e il mksnap_ufs era in corso.

Inizio a cercare di liberare risorse dato che so che il carico su quel 
server e' poco, ma la swap invece  abbastanza piena.

Uccido qualche processo utente delle jail che so che posso rilanciare 
facilmente ma vedo che alcuni di essi non muoiono, tento di chiudere 
alcune jail ma queste via ezjail non smontano i loro mount point via nullfs.

/usr/local/etc/rc.d/postgresql stop non risponde e non ritorna
cosi' allo stesso modo anche altri servizi.

decido per un reboot ma anche il comando "reboot" dato da root rimane 
come appeso in attesa di qualcosa.

prendo i numerosi processi apache e lighttpd e non rispondono al kill, 
manco al kill -9

Decido uno shutdown -r now che viene eseguito e rientro nel sistema con 
un rescue e quindi con i dischi smontati.

Dal rescuo attivo gmirror, effettuo l'fsck di tutte le partizioni. 
Quindi riavvio disabilitando quasi tutto da rc.conf (disabilitato 
ezjail, postgresql, ntpd etc).

Al riavvio pero' cron e' l'ultimo comando che appare sulla console poi 
il sistema sembra nuovamente fermo in attesa di qualcosa che ignoro.
Invio un CRTL-C e mi segnala che e' stato interrotto qualcosa sul 
securelevel (che e' sempre stato a -1 e non ci sono comandi in rc.conf o 
altrove per variarlo).

I servizi che erano attivi sono ripartiti tutti pare (sendmail, dovecot, 
  named, sshd), ma se avvio:
  /usr/local/etc/rc.d/postgresql.sh start
o
  /usr/local/etc/rc.d/ezjail.sh start
o anche solo una singola jail
  /usr/local/etc/rc.d/ezjail.sh start jail1
o pure
  cd /etc/mail ; make restart

ognuno di questi comandi si ferma e non pare venire eseguito fino a 
quando non invio un ctrl-c e spesso con questo il comando parte.

da #freebsd mi hanno consigliato di analizzare il problema con ktrace
cosa che ho fatto e pare che ogni comando si fermi con la costante delle
seguenti righe:

2577 sendmail RET   pread 4096/0x1000
   2577 sendmail CALL  close(0x3)
   2577 sendmail RET   close 0
   2577 sendmail CALL  fstat(0,0x7fffffffbee0)
   2577 sendmail STRU  struct stat {dev=50396928, ino=109, 
mode=crw--w---- , nlink=1, uid=1002, gid=4, rdev=109, atime=1276590857, 
stime=1276590857, ctime=1276590857, birthtime=-1, size=0, blksize=4096, 
blocks=0, flags=0x0 }
   2577 sendmail RET   fstat 0
   2577 sendmail CALL  ioctl(0,TIOCGETA,0x7fffffffbf30)
   2577 sendmail RET   ioctl 0
   2577 sendmail CALL  read(0,0x801270000,0x1000)

anche sulle jail dove sendmail e' stato disabilitato con 
sendmail_enable="NO" nel loro rc.conf.

Da #sendmail dicono di verificare il dns, cosa che ho fatto ma sia 
quello di cache locale che quello dell'ISP rispondono e anche rapidamente.

Non ho idee, su come risolvere, voi?


Ciao,               \ferz

PS: fino ad un paio di giorni fa questa macchina funzionava bene.
-------------- parte successiva --------------
Un allegato non testuale  stato rimosso....
Nome:        nonsolosoft.vcf
Tipo:        text/x-vcard
Dimensione:  456 bytes
Descrizione: non disponibile
URL:         <http://mailman.gufi.org/pipermail/esperti/attachments/20100615/81bcaac0/attachment.vcf>


Maggiori informazioni sulla lista Esperti