Koozali.org: home of the SME Server

Server si riavvia: cosa cercare tra i log?

Offline Milano1971

  • *****
  • 252
  • +0/-0
Server si riavvia: cosa cercare tra i log?
« on: March 12, 2014, 04:35:41 PM »
Continuo a ricevere email da un server relative allo stato del raid. Ogni ora circa, il server risincronizza il raid: 20,40,60,80,finisced! Dalla console in remoto ho notato che il server si riavvia. Cosa posso controllare nei log per verificarne la causa e cercare di capirne il motivo? Il server è sotto ups, quindi dubito a sbalzi di tensione o interventi manuali, in quanto accade ogni ora già da qualche giorno.

Offline Stefano

  • *
  • 10,894
  • +3/-0
Re: Server si riavvia: cosa cercare tra i log?
« Reply #1 on: March 12, 2014, 04:51:53 PM »
il riavvio avviene secondo "intervalli" standard o casuali?

come stiamo a temperature?

guarderei le uiltime righe in /var/log/messages prima del riavvio

P.S.: se il server è in remoto e non hai controllo fisico, assicurati che l'ups sia ok.. mi è capitato di avere un ups (non monitorato) con batterie ko... quando saltava la corrente.....

Offline Milano1971

  • *****
  • 252
  • +0/-0
Re: Server si riavvia: cosa cercare tra i log?
« Reply #2 on: March 12, 2014, 08:12:01 PM »
Mar 12 18:06:44 server ntpd[2651]: ntpd 4.2.2p1@1.1570-o Fri Nov 18 13:21:16 UTC 2011 (1)
Mar 12 18:06:44 server ntpd[2651]: logging to file /dev/stdout
Mar 12 18:06:44 server smbd[2944]: [2014/03/12 18:06:44.550586,  0] smbd/server.c:1082(main)
Mar 12 18:06:44 server smbd[2944]:   standard input is not a socket, assuming -D option
Mar 12 18:06:52 server esmith::event[3074]: Processing event: local 
Mar 12 18:06:52 server esmith::event[3074]: Running event handler: /etc/e-smith/events/actions/generic_template_expand
Mar 12 18:06:52 server esmith::event[3074]: expanding /etc/sysconfig/kernel 
Mar 12 18:06:53 server esmith::event[3074]: expanding /boot/grub/grub.conf 
Mar 12 18:06:53 server esmith::event[3074]: generic_template_expand=action|Event|local|Action|generic_template_expand|Start|1394644012 10173|End|1394644013 247949|Elapsed|1.237776
Mar 12 18:06:53 server esmith::event[3074]: Running event handler: /etc/e-smith/events/local/S50clear-pptp-interfaces
Mar 12 18:06:53 server esmith::event[3074]: S50clear-pptp-interfaces=action|Event|local|Action|S50clear-pptp-interfaces|Start|1394644013 248842|End|1394644013 418352|Elapsed|0.16951
Mar 12 18:06:53 server esmith::event[3074]: Running event handler: /etc/e-smith/events/actions/adjust-services
Mar 12 18:06:53 server esmith::event[3074]: adjusting supervised yum (once) 
Mar 12 18:06:53 server esmith::event[3074]: adjust-services=action|Event|local|Action|adjust-services|Start|1394644013 419299|End|1394644013 979612|Elapsed|0.560313
Mar 12 18:38:41 server syslogd 1.4.1: restart.
Mar 12 18:38:41 server kernel: klogd 1.4.1, log source = /proc/kmsg started.
Mar 12 18:38:41 server kernel: Inspecting /boot/System.map-2.6.18-348.1.1.el5
Mar 12 18:38:41 server kernel: Loaded 30875 symbols from /boot/System.map-2.6.18-348.1.1.el5.
Mar 12 18:38:41 server kernel: Symbols match kernel version 2.6.18.
Mar 12 18:38:41 server kernel: No module symbols loaded - kernel modules not enabled.
Mar 12 18:38:41 server kernel: Linux version 2.6.18-348.1.1.el5 (mockbuild@builder17.centos.org) (gcc version 4.1.2 20080704 (Red Hat 4.1.2-54)) #1 SMP Tue Jan 22 16:24:03 EST 2013
Mar 12 18:38:41 server kernel: BIOS-provided physical RAM map:
Mar 12 18:38:41 server kernel:  BIOS-e820: 0000000000010000 - 000000000009fc00 (usable)
Mar 12 18:38:41 server kernel:  BIOS-e820: 000000000009fc00 - 00000000000a0000 (reserved)
Mar 12 18:38:41 server kernel:  BIOS-e820: 00000000000e6000 - 0000000000100000 (reserved)
Mar 12 18:38:41 server kernel:  BIOS-e820: 0000000000100000 - 000000001bfb0000 (usable)
Mar 12 18:38:41 server kernel:  BIOS-e820: 000000001bfb0000 - 000000001bfc0000 (ACPI data)
Mar 12 18:38:41 server kernel:  BIOS-e820: 000000001bfc0000 - 000000001bff0000 (ACPI NVS)
Mar 12 18:38:41 server kernel:  BIOS-e820: 000000001bff0000 - 000000001c000000 (reserved)
Mar 12 18:38:41 server kernel:  BIOS-e820: 00000000fee00000 - 00000000fee01000 (reserved)
Mar 12 18:38:41 server kernel:  BIOS-e820: 00000000ff780000 - 0000000100000000 (reserved)


Dovrei aver preso la parte di un restart... che ne dici?
Il problema alimentazione lo escludo, fa così ogni 2 ore circa da giorni. Le temperature purtroppo da remoto non posso controllarle.
« Last Edit: March 12, 2014, 08:13:48 PM by Milano1971 »

Offline Fumetto

  • *
  • 899
  • +1/-0
Re: Server si riavvia: cosa cercare tra i log?
« Reply #3 on: March 13, 2014, 08:42:54 AM »
...Le temperature purtroppo da remoto non posso controllarle.
sme8admin ti potrebbe essere utile...

Offline Milano1971

  • *****
  • 252
  • +0/-0
Re: Server si riavvia: cosa cercare tra i log?
« Reply #4 on: March 13, 2014, 10:45:06 AM »
stanotte ho ricevuto questa email:

/etc/cron.daily/logrotate:

error: samba_audit:1 duplicate log entry for /var/log/samba/samba_audit
error: found error in /var/log/samba/samba_audit , skipping

non so se centri qualcosa con i riavii

Offline Stefano

  • *
  • 10,894
  • +3/-0
Re: Server si riavvia: cosa cercare tra i log?
« Reply #5 on: March 13, 2014, 11:33:28 AM »
Il problema alimentazione lo escludo, fa così ogni 2 ore circa da giorni. Le temperature purtroppo da remoto non posso controllarle.

un riavvio "ciclico" di questo genere è al 99,9999999999999% (mi mantengo un piccolo margine di errore) un problema hw:
- temperature
- memoria andata
- ups rintronato

o problema "ambientale" (eh, la tauromachia e la gente che mette le mani dove non dovrebbe)

nel log da te postato non c'è nulla di interessante..
ripeto, problema hw o ambientale, indaga

p.s. BACKUP (che quei riavvii non fanno bene alla macchina)

Offline pepz

  • *****
  • 419
  • +0/-0
Re: Server si riavvia: cosa cercare tra i log?
« Reply #6 on: March 13, 2014, 10:44:11 PM »
si, dai...  quasi sicuramente e' bollito l' hardware ....
quanti anni ha la macchina?
E' un server  '' vero '' , oppure e' un pc con una bella scheda madre?

Offline Milano1971

  • *****
  • 252
  • +0/-0
Re: Server si riavvia: cosa cercare tra i log?
« Reply #7 on: March 21, 2014, 12:35:26 PM »
Il problema è stato risolto. Era un banco di memoria ram che faceva riavviare la macchina.
Ogni notte il server mi manda comunque questa email:

/etc/cron.daily/logrotate:

error: samba_audit:1 duplicate log entry for /var/log/samba/samba_audit
error: found error in /var/log/samba/samba_audit , skipping

Perché?

Offline Stefano

  • *
  • 10,894
  • +3/-0
Re: Server si riavvia: cosa cercare tra i log?
« Reply #8 on: March 21, 2014, 12:47:27 PM »