OVH Community, votre nouvel espace communautaire.

symptomes d'une future panne de disque dur


Toorop
22/03/2004, 08h19
David.A écrivait :
Quand un des discs durs d'un serveur dedié meurt, il y a un autre disc dur qui contient les infos ?
Si tu as un serveur RAID, si un des disques lache le second continue a travailler. Sinon point de salut.
Ou on perd toutes nos informations présentes sur le disc dur?
Ca depend de l'etendue des degats mais dans tous les cas il est fortement conseillé de faire des sauvegardes...
Dans le cas ou un deuxième disc dur travaille en paralelle, il prend le relai tout seul ? ou on a un temps à "vide" ?
Dans le cas des serveurs RAID OVH (raid 1) les deux disques travaillent en paralelle, donc si un lache ce n'est pas perceptible (ie pas de coupure de service) par contre il faut changer le disks HS dans les plus brefs delais.
Pour surveiller votre RAID : http://forum.ovh.com/showthread.php?s=&threadid=900

benji52
21/03/2004, 17h32
bonjour,

oui bien sur, il faut juste mettre votre mail la ou c'est ecrit email=

a+

trakiss
21/03/2004, 17h28
une question, la si y a un blem ca me previendra par mail vraiment ou faut ajouter un truc ?

trakiss
21/03/2004, 17h24
perdu c /var/log/messages

benji52
21/03/2004, 16h29
re,

un petit détail, c'est testé sur une debian, donc il y a une petite modif. à faire pour une redhat.

il faut remplacer :

cd /var/log
search1=`tail -5000 syslog |grep "ide seek error"`
search2=`tail -5000 syslog |grep "Remounting filesystem read-only"`
search3=`tail -5000 syslog |grep "SeekComplete DataRequest Error"`
search4=`tail -5000 syslog |grep "EXT3-fs error"`

par

cd /home/log
search1=`tail -5000 messages |grep "ide seek error"`
search2=`tail -5000 messages |grep "Remounting filesystem read-only"`
search3=`tail -5000 messages |grep "SeekComplete DataRequest Error"`
search4=`tail -5000 messages |grep "EXT3-fs error"`


il me semble que les logs du systeme sur redhat c'est /home/log/messages (à confirmer)

bonne journée

trakiss
21/03/2004, 16h23
merci bcp

benji52
21/03/2004, 16h12
salut,

voila une premiere ébauche :

---------------------------------------------

#!/bin/bash

####################################
PATH=/bin:/usr/bin:/usr/ucb:/usr/local/bin:$HOME/bin:.
export PATH

# Parametres
serveur=`hostname | awk -F "." '{ print $1 }'`
heure=`date | awk '{print $4}'`
date=`date | awk '{print $1,$2,$3}'`
email=email@admin

####################################
cd /var/log
search1=`tail -5000 syslog |grep "ide seek error"`
search2=`tail -5000 syslog |grep "Remounting filesystem read-only"`
search3=`tail -5000 syslog |grep "SeekComplete DataRequest Error"`
search4=`tail -5000 syslog |grep "EXT3-fs error"`

if [ "$search1" -o "$search2" -o "$search3" -o "$search4" ] ; then
# Suspicion d'un probleme sur le disque
# On prévient l'admin
echo "
Suspicion d'un probleme sur le disque de $serveur
On est le $date et il est $heure

Voici les erreurs trouvées dans syslog :

$search1
$search2
$search3
$search4

Lancez un badblocks pour plus d'informations" | mail -s "Suspicion d'un probleme sur le disque" $email

fi

exit

---------------------------------------------

a mettre en cron par ex

bonne journée

Christophe
18/03/2004, 18h17
D'apres le "man dmesg"


NOM
dmesg - Afficher et contrôler le tampon des messages du noyau.

EricZone
18/03/2004, 15h23
C sencé aficher quoi dmesg ?

Germain
17/03/2004, 10h31
EricZone écrivait :
J'ai le dernier noyeau de chez ovh
Il faut prévenir le support alors.

EricZone
17/03/2004, 00h22
J'ai le dernier noyeau de chez ovh

David.A
16/03/2004, 21h54
c'est pas mal ça

quand un des discs durs d'un serveur dedié meurt, il y a un autre disc dur qui contient les infos ? ou on perd toutes nos informations présentes sur le disc dur?

dans le cas ou un deuxième disc dur travaille en paralelle, il prend le relai tout seul? ou on a un temps à "vide" ?

trakiss
16/03/2004, 18h39
benji52 écrivait :
bonsoir à tous,

voila j'ai un serveur qui a crashé il y a pas longtemps (disque HS), et
j'aurais bien aimé être prévenu, en effet il y avait des signes précurseurs
dans les différents logs.
Je vais donc réaliser un petit script shell basique, permettant de
surveiller ça régulièrement et de prévenir un Admin. en cas de problème.

Pour le moment, j'ai trouvé ce type d'erreurs dans les logs en cas de
problème d'un disque : "IDE seek error"
Mais il doit en avoir pas mal d'autres, si vous pouviez me dire les erreurs
les plus fréquentes qu'on retrouve dans ce cas, pour que je termine mon
script.

Le script une fois fini sera bien sur distribué gratuitement sur ce forum

bonne soirée
ca serais vraiment cool ca !

pourras tu le poster ici pour quon soit prévenu par mail ou nous lenvoyer en mp ?

++

Germain
16/03/2004, 15h05
EricZone écrivait :
Moi j'ai çà dans dmesg, c grave docteur ?

hda: drive not ready for command
ide0: reset: success
hda: dma_timer_expiry: dma status == 0x20
hda: timeout waiting for DMA
hda: timeout waiting for DMA
hda: (__ide_dma_test_irq) called while not waiting
hda: status timeout: status=0xd0 { Busy }
Quel version de noyau tu as ?

EricZone
16/03/2004, 12h10
Moi j'ai çà dans dmesg, c grave docteur ?

hda: drive not ready for command
ide0: reset: success
hda: dma_timer_expiry: dma status == 0x20
hda: timeout waiting for DMA
hda: timeout waiting for DMA
hda: (__ide_dma_test_irq) called while not waiting
hda: status timeout: status=0xd0 { Busy }

Fraser
16/03/2004, 00h04
Mais dans le fond de la salle, on peut entendre par nuit:
ide-smart... ide-smart...

benji52
15/03/2004, 22h12
salut,

en fait mon disque marche très bien

mon but est que si un jour ça se reproduit je sois prévenu avant que ça lache.
Donc je fais un script assez simple, qui cherche des occurences de par exemple "ide seek error" dans les logs, si il trouve c'est pas bon signe et alors il prévient l'admin pour un controle plus poussé.
J'avais vu d'autres erreurs en rapport avec le disque à l'époque mais je me souviens plus (nottamment des erreurs d"écriture sur le disque)

Voila

bonne soirée

Oles
15/03/2004, 22h06
Salut,
Regarde ce que dmesg te sort. Si tu as des erreurs hda c'est le moment pour contacter le support pourqu'on te change le disque (c'est gratuit).

Sinon nous avons plusieurs tests qui nous permettent valider un disque. Le test dure plus de 24h et il faut passer en single. Normalement c'est un test qui "finit" les disques qui commencent à souffrir. Je ne pense que pas que tu cherches ça

Amicalement
Octave

benji52
15/03/2004, 21h53
bonsoir à tous,

voila j'ai un serveur qui a crashé il y a pas longtemps (disque HS), et
j'aurais bien aimé être prévenu, en effet il y avait des signes précurseurs
dans les différents logs.
Je vais donc réaliser un petit script shell basique, permettant de
surveiller ça régulièrement et de prévenir un Admin. en cas de problème.

Pour le moment, j'ai trouvé ce type d'erreurs dans les logs en cas de
problème d'un disque : "IDE seek error"
Mais il doit en avoir pas mal d'autres, si vous pouviez me dire les erreurs
les plus fréquentes qu'on retrouve dans ce cas, pour que je termine mon
script.

Le script une fois fini sera bien sur distribué gratuitement sur ce forum

bonne soirée