symptomes d'une future panne de disque dur
David.A écrivait :
Quand un des discs durs d'un serveur dedié meurt, il y a un autre disc dur qui contient les infos ?
Si tu as un serveur RAID, si un des disques lache le second continue a travailler. Sinon point de salut.
Ou on perd toutes nos informations présentes sur le disc dur?
Ca depend de l'etendue des degats mais dans tous les cas il est fortement conseillé de faire des sauvegardes...
Dans le cas ou un deuxième disc dur travaille en paralelle, il prend le relai tout seul ? ou on a un temps à "vide" ?
Dans le cas des serveurs RAID OVH (raid 1) les deux disques travaillent en paralelle, donc si un lache ce n'est pas perceptible (ie pas de coupure de service) par contre il faut changer le disks HS dans les plus brefs delais.
Pour surveiller votre RAID :
http://forum.ovh.com/showthread.php?s=&threadid=900
bonjour,
oui bien sur, il faut juste mettre votre mail la ou c'est ecrit email=
a+
une question, la si y a un blem ca me previendra par mail vraiment ou faut ajouter un truc ?
perdu c /var/log/messages
re,
un petit détail, c'est testé sur une debian, donc il y a une petite modif. à faire pour une redhat.
il faut remplacer :
cd /var/log
search1=`tail -5000 syslog |grep "ide seek error"`
search2=`tail -5000 syslog |grep "Remounting filesystem read-only"`
search3=`tail -5000 syslog |grep "SeekComplete DataRequest Error"`
search4=`tail -5000 syslog |grep "EXT3-fs error"`
par
cd /home/log
search1=`tail -5000 messages |grep "ide seek error"`
search2=`tail -5000 messages |grep "Remounting filesystem read-only"`
search3=`tail -5000 messages |grep "SeekComplete DataRequest Error"`
search4=`tail -5000 messages |grep "EXT3-fs error"`
il me semble que les logs du systeme sur redhat c'est /home/log/messages (à confirmer)
bonne journée
salut,
voila une premiere ébauche :
---------------------------------------------
#!/bin/bash
####################################
PATH=/bin:/usr/bin:/usr/ucb:/usr/local/bin:$HOME/bin:.
export PATH
# Parametres
serveur=`hostname | awk -F "." '{ print $1 }'`
heure=`date | awk '{print $4}'`
date=`date | awk '{print $1,$2,$3}'`
email=email@admin
####################################
cd /var/log
search1=`tail -5000 syslog |grep "ide seek error"`
search2=`tail -5000 syslog |grep "Remounting filesystem read-only"`
search3=`tail -5000 syslog |grep "SeekComplete DataRequest Error"`
search4=`tail -5000 syslog |grep "EXT3-fs error"`
if [ "$search1" -o "$search2" -o "$search3" -o "$search4" ] ; then
# Suspicion d'un probleme sur le disque
# On prévient l'admin
echo "
Suspicion d'un probleme sur le disque de $serveur
On est le $date et il est $heure
Voici les erreurs trouvées dans syslog :
$search1
$search2
$search3
$search4
Lancez un badblocks pour plus d'informations" | mail -s "Suspicion d'un probleme sur le disque" $email
fi
exit
---------------------------------------------
a mettre en cron par ex
bonne journée
Christophe
18/03/2004, 18h17
D'apres le "man dmesg"
NOM
dmesg - Afficher et contrôler le tampon des messages du noyau.
EricZone
18/03/2004, 15h23
C sencé aficher quoi dmesg ?
EricZone écrivait :
J'ai le dernier noyeau de chez ovh
Il faut prévenir le support alors.
EricZone
17/03/2004, 00h22
J'ai le dernier noyeau de chez ovh
c'est pas mal ça
quand un des discs durs d'un serveur dedié meurt, il y a un autre disc dur qui contient les infos ? ou on perd toutes nos informations présentes sur le disc dur?
dans le cas ou un deuxième disc dur travaille en paralelle, il prend le relai tout seul? ou on a un temps à "vide" ?
benji52 écrivait :
bonsoir à tous,
voila j'ai un serveur qui a crashé il y a pas longtemps (disque HS), et
j'aurais bien aimé être prévenu, en effet il y avait des signes précurseurs
dans les différents logs.
Je vais donc réaliser un petit script shell basique, permettant de
surveiller ça régulièrement et de prévenir un Admin. en cas de problème.
Pour le moment, j'ai trouvé ce type d'erreurs dans les logs en cas de
problème d'un disque : "IDE seek error"
Mais il doit en avoir pas mal d'autres, si vous pouviez me dire les erreurs
les plus fréquentes qu'on retrouve dans ce cas, pour que je termine mon
script.
Le script une fois fini sera bien sur distribué gratuitement sur ce forum
bonne soirée
ca serais vraiment cool ca !
pourras tu le poster ici pour quon soit prévenu par mail ou nous lenvoyer en mp ?
++
EricZone écrivait :
Moi j'ai çà dans dmesg, c grave docteur ?
hda: drive not ready for command
ide0: reset: success
hda: dma_timer_expiry: dma status == 0x20
hda: timeout waiting for DMA
hda: timeout waiting for DMA
hda: (__ide_dma_test_irq) called while not waiting
hda: status timeout: status=0xd0 { Busy }
Quel version de noyau tu as ?
EricZone
16/03/2004, 12h10
Moi j'ai çà dans dmesg, c grave docteur ?
hda: drive not ready for command
ide0: reset: success
hda: dma_timer_expiry: dma status == 0x20
hda: timeout waiting for DMA
hda: timeout waiting for DMA
hda: (__ide_dma_test_irq) called while not waiting
hda: status timeout: status=0xd0 { Busy }
Mais dans le fond de la salle, on peut entendre par nuit:
ide-smart... ide-smart...
salut,
en fait mon disque marche très bien
mon but est que si un jour ça se reproduit je sois prévenu avant que ça lache.
Donc je fais un script assez simple, qui cherche des occurences de par exemple "ide seek error" dans les logs, si il trouve c'est pas bon signe et alors il prévient l'admin pour un controle plus poussé.
J'avais vu d'autres erreurs en rapport avec le disque à l'époque mais je me souviens plus (nottamment des erreurs d"écriture sur le disque)
Voila
bonne soirée
Salut,
Regarde ce que dmesg te sort. Si tu as des erreurs hda c'est le moment pour contacter le support pourqu'on te change le disque (c'est gratuit).
Sinon nous avons plusieurs tests qui nous permettent valider un disque. Le test dure plus de 24h et il faut passer en single. Normalement c'est un test qui "finit" les disques qui commencent à souffrir. Je ne pense que pas que tu cherches ça
Amicalement
Octave
bonsoir à tous,
voila j'ai un serveur qui a crashé il y a pas longtemps (disque HS), et
j'aurais bien aimé être prévenu, en effet il y avait des signes précurseurs
dans les différents logs.
Je vais donc réaliser un petit script shell basique, permettant de
surveiller ça régulièrement et de prévenir un Admin. en cas de problème.
Pour le moment, j'ai trouvé ce type d'erreurs dans les logs en cas de
problème d'un disque : "IDE seek error"
Mais il doit en avoir pas mal d'autres, si vous pouviez me dire les erreurs
les plus fréquentes qu'on retrouve dans ce cas, pour que je termine mon
script.
Le script une fois fini sera bien sur distribué gratuitement sur ce forum
bonne soirée