OVH Community, votre nouvel espace communautaire.

Tout perdu, 2 disques morts


fritz2cat
08/09/2014, 17h42
J'ai sauté sur une occasion limitée: un "kimsufi bon plan" avec un processeur Atom et un disque de 2 TB à BHS (OVH Canada)
Disons que le risque n'est pas géographique non plus, même si mes oeufs sont dans le même panier OVH.

PGombeer
08/09/2014, 17h29
Citation Envoyé par fritz2cat
oui, tu es le seul et c'est absolument faux
[Edit: vous êtes peut-être deux: Risson et toi]
OK, mais sa formulation est peu claire... Faire un backup via FTP sur le deuxième disque installé dans le serveur n'a pas beaucoup de sens.

Citation Envoyé par fritz2cat
Par contre que ce soit un backup vers un 2è disque ou un FTP, (ou n'importe quoi d'ailleurs) il faut surveiller
- que ça "backupe" correctement
- qu'on est capable de restaurer quelque chose à partir de ces backups.
Comme disait l'autre, le problème n'est pas de prendre des backups, ça tout le monde peut le faire...

Sinon pour info, ma politique de backup, c'est backup daily de mes serveurs sur un NAS 1 TB OVH (avec versioning & recovery point in time), + backup weekly chez Amazon S3 (histoire de pouvoir me tirer d'affaire lors d'un désastre majeur datacenter OVH avec le minimum de pots cassés).

fritz2cat
08/09/2014, 17h09
Citation Envoyé par PGombeer
Suis-je le seul à comprendre que le deuxième "disque" qui aurait lâché serait en fait l'espace FTP mis à disposition par OVH pour les backups ?
oui, tu es le seul et c'est absolument faux
[Edit: vous êtes peut-être deux: Risson et toi]

Par contre que ce soit un backup vers un 2è disque ou un FTP, (ou n'importe quoi d'ailleurs) il faut surveiller
- que ça "backupe" correctement
- qu'on est capable de restaurer quelque chose à partir de ces backups.

PGombeer
08/09/2014, 16h56
Citation Envoyé par Risson
Merci pour vos réponses.

Non les disques n'était pas en raid (je crois), le second était le disque de backup ftp sur lequel était programmé des sauvegarde régulière. Il semble impossible qu'un des disques ai claquer sans que l'on s'en rende compte car soit notre site aurait été coupé, soit la sauvegarde aurait envoyé un échec et non une réussite de la tache.
Suis-je le seul à comprendre que le deuxième "disque" qui aurait lâché serait en fait l'espace FTP mis à disposition par OVH pour les backups ?

derinhger
05/09/2014, 08h41
Bon vue que c'est vendredi, c'est gratuit:

Petits scripts que j'utilise sur mes KS (pas de carte RAID, donc a adapter si tu en as).
Il faut aussi installer update-notifier pour un bien.
A savoir que je n'utilise que du DEBIAN, a voir si sa fonctionne correctement sur d'autre distrib a base de DEBIAN.

/etc/rc.local
Code:
#!/bin/bash -e
#
# rc.local
#
# This script is executed at the end of each multiuser runlevel.
# Make sure that the script will "exit 0" on success or any other
# value on error.
#
# In order to enable or disable this script just change the execution
# bits.
#
# By default this script does nothing.

true > /etc/motd

echo -e "                        Debian GNU/Linux $(cat /etc/debian_version)">  /etc/motd
echo                                              >> /etc/motd
echo "Kernel    : `uname -r`"                     >> /etc/motd
echo "server    : `cat /root/.mdg 2>/dev/null`"   >> /etc/motd
echo "hostname  : `hostname`"                     >> /etc/motd
#
# search interfaces that are connected
#
for net_interface in `ip link show | grep eth | grep UP | awk {'print $2'} | sed 's/://g'`
do
        # IPv4
        IPV4=`ip addr show ${net_interface} | grep 'inet ' | grep -Eo '\<[[:digit:]]{1,3}(\.[[:digit:]]{1,3}){3}\>' | head -1 `
        echo "${net_interface} IPv4 : ${IPV4}"                  >> /etc/motd
done
echo "Update    : `/usr/local/bin/check_update`"        >> /etc/motd
#echo "Backup    : `/usr/local/bin/check_backup`"        >> /etc/motd
echo                                              >> /etc/motd
/usr/local/bin/hdd                                >> /etc/motd
echo                                              >> /etc/motd
cp /etc/motd /etc/issue

exit 0
/usr/local/bin/hdd
Code:
#!/bin/bash
vert='\e[1;32m'
rouge='\e[0;31m'
neutre='\e[0;m'
echo -e "######################################################################"
printf "%s%22s%10s%22s%10s\n" "Disque" "Serial" "Smart" "Reallocated Sector" "Age"
# Detection des disques
SD=$(ls /dev/sd[a-z]) # test la presence des disques de sda a sdz

# Lancement des tests disques
for dd in $SD
do
# Recuperation du serial
serial=$(smartctl -a -d ata $dd | egrep 'Serial' | awk '{ print $3 }')
# test smart du disque
smart=$(smartctl -a -d ata $dd | egrep 'No Errors Logged|Non-medium error count')
if [ "$smart" = "No Errors Logged" ]
then
smart_result="DONE"
else
smart_result="FAILED"
fi
# test Reallocated Sector
reallocated=$(smartctl -a -d ata $dd | egrep 'Reallocated_Sector' | awk '{ print $10 }')
if [ "$reallocated" = "0" ]
then
reallocated_result="DONE"
else
reallocated_result="FAILED($reallocated)"
fi
# Nombre d'heure de vie du disque
age=$(smartctl -a -d ata $dd | egrep 'Power_On_Hours' | awk '{ print $10 }')
if [ "$smart_result" = "FAILED" ]
then
color="$rouge"
elif [ "$reallocated_result" = "FAILED($reallocated)" ]
then
color="$rouge"
else
color="$vert"
fi
# Affiche des resultats pour le disque
#echo -e $color
printf "$color%s%20s%10s%22s%10s\n\e[m" $dd $serial $smart_result $reallocated_result $age
done
printf "$neutre\e[m"
echo -e "######################################################################"
exit 0
/usr/local/bin/check_update
Code:
#!/bin/bash
unset sec plur; maj=$(/usr/lib/update-notifier/apt-check 2>&1); [ ${maj%;*} -gt 1 ] && plur=1; [ ! ${maj#*;} -eq 0 ] && sec=${maj#*;}; echo "${maj%;*} mise${plur:+"s"} a jour disponible${sec:+", dont ${sec} de séccurité"}"
exit 0
C'est pas forcement le script le script le mieux réaliser au monde, mais au moins quand tu te connecte en SSH sa te permet de voir un minimum si ta machine vas bien.

J'ai désactiver l'affichage du check des backup, car mon script est plein d'idenfiants, et la pas le temps de tous les retirer.

Aller bon week a tous, et si certains veulent modifier/corriger le script, aller y de bon coeur

Résultat du script a la connection en SSH:
Code:
Linux xxxxxxxxxx 3.2.0-4-amd64 #1 SMP Debian 3.2.60-1+deb7u3 x86_64
                        Debian GNU/Linux 7.6

Kernel    : 3.2.0-4-amd64
server    : xxxxxxx
hostname  : xxxxxxxxx
eth0 IPv4 : xxxxxxxxx
Update    : 5 mises a jour disponible, dont 5 de séccurité
Backup    : Tous les backup sont OK et sauvegarder sur xxxxxxxxxxx

######################################################################
Disque                Serial     Smart    Reallocated Sector       Age
/dev/sda      TV650BXFG1BS3R      DONE                  DONE      4483
/dev/sdb      PN2134P6JLKV0T      DONE                  DONE       273
######################################################################

Philipp1
04/09/2014, 19h06
Citation Envoyé par Abazada
Parce qu'une sauvegarde de plusieurs To d'un dédiés c'est loin d'être gratuit! et que cela impliquerait une augmentation du prix de l'ensemble des dédiés pour un service dont beaucoup n'ont pas besoin. Les personnes qui louent des dédiés sont supposées savoir comment les gérer et être les mieux placées pour savoir comment assurer de manière optimale la sauvegarde de leurs données.

Je fais partie de ceux qui pensent que le Raid et un Backup distant sont indispensables pour tout dédiés. Perso mes disques sont tous surdimensionnés (la faute à OVH qui fournit des To à foison ) donc j'en profite pour y faire des Snapshots avec historique; et des sauvegardes croisées entre serveurs.

Sinon bien désolé pour ton cas. 2 disques qui lâchent en un court intervalle quand ils sont en Raid ce n'est pas si rare. Dans ton cas, avec un disque qui aurait dû être beaucoup moins sollicité, c'est un peu surprenant. Je rejoins l'hypothèse émise plus haut que le disque de sauvegarde était probablement malade avant ce soucis.
+1 même en RAID il faut faire des sauvegardes externes, c'est presque irresponsable de pas le faire ou alors les données sont vraiment pas critiques..

De plus OVH fourni le serveur (en principe en état de fonctionnement) après le client doit se démerder et c'est bien normal.. C'est comme une voiture, vous avez les controles périodiques à effectuer, il faut prendre soin de sa voiture etc.. c'est pas au constructeur de la voiture de revenir vers vous toutes les jours/semaines pour vérifier que tout est fonctionnel.

Pour les 2 disques qui tombent en panne en même temps, ça peut arriver même si c'est très très rare mais là vu que l'état des disques avait pas l'air d'être surveillé, celui qui faisait usage de backup devait être mort depuis un moment..

Pour en revenir à la remarque "le dédié est plus cher que le mutu et il y a rien comme sauvegarde", si OVH devait backupait tous les serveurs des clients, le prix serait largement plus élevé.. OVH est le meilleur rapport prix/puissance, on put pas tout avoir.. va voir les autres hébergeurs (à part online) tu verras que les prix varient du simple au double pour un serveur équivalent à services équivalent

Abazada
04/09/2014, 18h47
Citation Envoyé par Risson
Je ne comprend pas bien pourquoi sur une offre pro en mutu il y a des snapshot et des sauvegarde dans différent data center, alors que sur un dédié (pas le même coût du tout !) il n'y a rien, si ce n'est le disque de sauvegarde (qui claque en même temps que le principal). Etrange.
Parce qu'une sauvegarde de plusieurs To d'un dédiés c'est loin d'être gratuit! et que cela impliquerait une augmentation du prix de l'ensemble des dédiés pour un service dont beaucoup n'ont pas besoin. Les personnes qui louent des dédiés sont supposées savoir comment les gérer et être les mieux placées pour savoir comment assurer de manière optimale la sauvegarde de leurs données.

Je fais partie de ceux qui pensent que le Raid et un Backup distant sont indispensables pour tout dédiés. Perso mes disques sont tous surdimensionnés (la faute à OVH qui fournit des To à foison ) donc j'en profite pour y faire des Snapshots avec historique; et des sauvegardes croisées entre serveurs.

Sinon bien désolé pour ton cas. 2 disques qui lâchent en un court intervalle quand ils sont en Raid ce n'est pas si rare. Dans ton cas, avec un disque qui aurait dû être beaucoup moins sollicité, c'est un peu surprenant. Je rejoins l'hypothèse émise plus haut que le disque de sauvegarde était probablement malade avant ce soucis.

bbr18
04/09/2014, 18h05
ce que je ne comprends pas bien c'est que tu as 2 disques dans ton serveur et tu ne les avais pas mis en Raid ? Le Raid n'est pas une sauvegarde mais il permet de limiter le dowtime, ensuite tu dois faire des sauvegardes sur un autre serveur, ou espace de ton choix, perso j'ai 2 serveurs qui récupèrent les sauvegardes l'un l'autre, plus un serveur de backup (si petit budget, un petit ks peut faire l'affaire), la probabilité que tous tombent en même temps est très faible, en principe sauf des missiles tombent sur tous les DC d'ovh, je ne devrais pas perdre de données.
Chacun fait des choix niveau sécurité de ce qu'il héberge mais si le choix est une sécurité hyper minimale, un jour ou l'autre on s'en mord les doigts et là faut assumer..
Bon courage.

Risson
04/09/2014, 17h35
Merci pour tes conseils fritz2cat.

fritz2cat
04/09/2014, 17h26
Tu es certain que tes backups fonctionnaient encore avant-hier ?
Tu ne t'imagines pas le nombre de scénarii où on se rend compte que le backup n'était plus effectué depuis la nuit des temps, par exemple parce que le script, ou le media de backup ne fonctionnait plus, mais qu'on n'est pas alerté.

Sache que j'ai un jour eu (à la maison) un PC dont l'alimentation est tombée en panne. Ca sentait le brûlé.
Tous les composants du PC étaient morts: carte mère, CPU, 2 disques durs, graveur. J'imagine que du 220V a dû passer dans le circuit 5V.
Le backup était extérieur au PC et j'en étais bien content ... sinon je n'avais plus rien.

Dans ton cas, je pense que j'aurais d'abord investigué en netboot rescue avant d'envoyer un tech changer un disque sans mon accord.

Si tu n'as jamais donné d'accord, demande à remonter tes 2 disques crashés dans la machine et vois la situation en rescue.

Risson
04/09/2014, 17h17
fritz2cat , je pense que vous interprétez mal mes propos.
"C'est pourtant facile de comprendre qu'un disque peut tomber en panne" oui tout à fait, mais 2 disques au même moment, non.
"Le dédié c'est comme la voiture" exact, le problème c'est qu'on vous dit que la voiture est endommager, que les pièce ajouté n'existe plus et que si vous voulez en avoir la preuve, ba il suffit de payer sinon vous ne la reverrez jamais.
Quant une expertise est faite par le propriétaire, cela ne s'appelle plus une expertise, mais juste "croyez nous sur notre bonne foi".
Admettons que je sois un prestataire tel qu'OVH, que j'ai 7 million de client, que à 5000 d'entre eux je dise " vos disques sont morts, vous n'avez plus rien, mais vous pouvez peut être tout récupérer moyennant 110€ par disque"
Admettons que la moitié accepte : 2500*110 = 25000 € ou 2 disques = 50 000
Attention ! je ne dis en aucun cas que c'est le cas d'OVH, mais le manque d'explication est très limite c'est tout. Impossible de voir les logs, les 2 disques ont été changé. Une date et une heure précise ou chaque disque à laché ? non, juste "Nous vous informons d'un problème, puis un peu plus tard " nous avons changé les 2 disques". Je n'appelle pas ça une explication avec détails sur le problème.

fritz2cat
04/09/2014, 16h49
En fait qu'attendez-vous de la part d'OVH ? de gérer le serveur à votre place ?
C'est pourtant facile de comprendre qu'un disque peut tomber en panne et qu'il faut une protection. Ou que l'administrateur fasse une commande erronée (rm -rf /home). Ou que... Ou hacking. Ou corruption de n'importe quoi...

Le mutu c'est comme l'autobus, vous payez et vous avec le service de base.

Le dédié c'est comme la voiture. Si on ne fait pas l'entretien on finira à avoir des problèmes. Si on n'a pas son permis ce n'est pas bien non plus. Et enfin, si on fonce dans un poteau, il vaut mieux avoir une assurance ou avoir pris des mesures de sécurité (ceinture, airbag).

Risson
04/09/2014, 15h17
Ca m'intrigue tout ça, mon opinion sur OVH depuis tant d'année serait-il en fait erroné ?! ...

Dutou
04/09/2014, 15h10
Je viens de vivre la même chose. Un de mes serveurs un kimsuffi ne démarrer pas. je fais un redémarrage via le manager et puis j'ai reçu mail d'alerte. 30 min plu tard je reçois un autre mail pour me dire que le disque dur est mort et remplacer et pour récupérer les données sur le disque il faut passer à la caisse.
Bon courage

Risson
04/09/2014, 15h00
Merci pour vos réponses.

Non les disques n'était pas en raid (je crois), le second était le disque de backup ftp sur lequel était programmé des sauvegarde régulière. Il semble impossible qu'un des disques ai claquer sans que l'on s'en rende compte car soit notre site aurait été coupé, soit la sauvegarde aurait envoyé un échec et non une réussite de la tache.

Je ne comprend pas bien pourquoi sur une offre pro en mutu il y a des snapshot et des sauvegarde dans différent data center, alors que sur un dédié (pas le même coût du tout !) il n'y a rien, si ce n'est le disque de sauvegarde (qui claque en même temps que le principal). Etrange.

- - - Mise à jour - - -

Ps. oui j'ai des sauvegarde régulière, sur le disque prévu à cet effet qui a parait-il claqué en même temps. 600 Giga à sauvegarder à la main chez soit, oui une fois tout les 2 ans.

bbr18
04/09/2014, 13h51
Tes disques étaient en raid ? Le raid n'est pas un système de sauvegarde, il faut aussi des sauvegardes externalisées, donc avoir au minimum un serveur de backup ou (autre petit serveur dédié à cette tâche.

derinhger
04/09/2014, 13h20
Tes disques n'ont surement pas claquer en même temp.

Un premier a due claquer, tu ne la pas vue/fait attention, et pas de bol le second plus tard.
Quoi qu'il en soit je suis sur que tu as des sauvegardes reguliaire et a jour ?

Au pire rachetter les disques auprès du support OVH pour essayer de récuperer ce que tu peut

Risson
04/09/2014, 12h15
Bonjour à tous,

Nous avons un gros problème avec mon dédié, ovh nous indique que le disque dur est mort et qu'ils l'on remplacé par un neuf ( donc perte de toutes les données).
Nous nous disons: pas de panique, nous allons restaurer le tout a partir du disque de backup ( fais pour ça) où nous avons des sauvegardes régulières.

Et la, grande nouvelle de la part d'Ovh, on nous affirme que les deux disque on "cramés" en même temps, donc plus rien ! plus aucune données, plus de bases sql, plus fichiers, plus rien.

Auriez vous un avis sur cette histoire ou un conseil, ou quelqu'un aurait-il un moyen d'en savoir plus sur notre problème ?

Merci d'avance pour votre aide

Bonne journée à tous