OVH Community, votre nouvel espace communautaire.

Serveur bloqué en mode rescue après mise à jour OVH ("Sécurité totale du serveur ")


buddy
21/07/2016, 09h54
Un gentoo release 2 ??
Cette distribution est abandonnée.

Que te renvoie un smartctl sur ton disque ?
Il faut sérieusement songer à partir sur une distribution plus clean et carrément sur un nouveau serveur qui sera également plus puissant que l'actuel ...
https://www.how-to.ovh/viewtopic.php?f=19&t=45

achrafouassil
21/07/2016, 00h07
bonjour

dsl c pas fdtabl mais fstabl qui es vide , j'ai le Système (OS)
Release 2 OVH (Gentoo)

merci de votre aide

- - - Mise à jour - - -

bonjour

dsl c pas fdtabl mais fstabl qui es vide , j'ai le Système (OS)
Release 2 OVH (Gentoo)

merci de votre aide

- - - Mise à jour - - -

bonjour

dsl c pas fdtabl mais fstabl qui es vide , j'ai le Système (OS)
Release 2 OVH (Gentoo)

les test du hardware bien effectué sans prob

merci de votre aide

fritz2cat
20/07/2016, 09h50
Je trouve magnifique qu'on doive deviner plein de choses, quelle distribution -> debian, CentOS, OVH release 2, OVH release 3, Windows, ou quoi ?
Merci de faire un effort pour donner des informations utiles et nécessaires en posant votre question.

Nowwhat
20/07/2016, 08h58
Bonjour,
Citation Envoyé par achrafouassil
... a propos du fichier fdtab
Quel OS ?
"fdtab", meme Google ne sais pas ce que c'est.

Citation Envoyé par achrafouassil
mon fichier contient # unconfigured fstab for base system
Un "/etc/fstab" vide ? Pas bon signe ça.

En mode rescue :
T'as effectué des test "hardware" dont lui de ton disque dur ?

T'as des sauvegardes de tes données ?
C'est bien plus simple et rapide de ré-installer le serveur et remettre tes données.

achrafouassil
20/07/2016, 00h10
Bonjour tout le monde j'ai besoin de votre aide car j'arrive pas a démarré sur disc dur je ss blocké en mode rescue je recoi un message d'erreur de problème de redémarrage sur disc dur , j'ai trouvé des discutions a propos du fichier fdtab mon fichier contient # unconfigured fstab for base system

Je c pas si c ca le problème je suis blocké depuis 2 jours merci pour votre aide les amis

bbr18
23/03/2016, 12h46
migre et évite toute distribution qui commence par : Release...

buddy
23/03/2016, 12h44
Il y a quand même avoir du une panne hardware pour qu'il ne réponde plus au ping.. (ce qui n'est pas étonnant pour un serveur de 5.5 ans)
Fait quand mêmes des backups et migre dès que possible

LyGest
23/03/2016, 11h16
Comme par enchantement, après avoir demandé maintes fois à OVH de me permettre de rebooter sur disque dur, ils l'ont fait, j'ai redémarré le serveur, il n'est plus en mode rescue et tout fonctionne à nouveau.
Donc pour résumer, je n'ai fait AUCUNE action, à part demander à OVH de me permettre de démarrer en mode disque dur.

La bonne nouvelle est que cet incident m'a forcé à faire ce que je devais faire depuis longtemps : commander un serveur plus puissant, moins cher et plus à jour

Nowwhat
22/03/2016, 09h33
Il s'agit donc un /sda et /sdb monté en raid :

Disk /dev/md2: 1.8 TiB, 1989119246336 bytes, 3884998528 sectors
....
Disk /dev/md1: 10 GiB, 10737352704 bytes, 20971392 sectors
un raid 1 probablement.

janus57
22/03/2016, 07h45
Bonjour,

enfin les valeurs sont pas si parfaute que ça et on vois bien que c'est un WD "green" qui va essayer de ranger la tête du HDD 'trop) souvent.

Code:
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 30
193 Load_Cycle_Count 0x0032 180 180 000 Old_age Always - 60927
Le disque à visiblement démarré 30 fois (c'est peu d'ailleurs), et la tête c'est rangé 60927 fois.
Donc cela fait un facteur de 2031 (+/-), donc si la tête et/ou les plateaux n'a pas souffert cela tiens du miracle je pense.

Voici en comparaison sur mon KS (avec HDD toshiba) :
Code:
   4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       47
   9 Power_On_Hours          0x0012   097   097   000    Old_age   Always       -       26054
  12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       47
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       171
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       171
Comme l'a dit @buddy un test étendu du HDD cela ne peu pas faire de mal.

Cordialement, janus57

buddy
22/03/2016, 07h11
Je ne vois pas d'autres solutions que de les appeler...
Et aussi lancer les commandes ci dessus pour un test des disques car les valeurs renvoyées par smartctl sont trop parfaites je trouve..

LyGest
22/03/2016, 00h13
Pour le boot sur disque dure, OVH ne l'a toujours pas rétabli, l'option se remet automatiquement sur le mode "rescue"

buddy
21/03/2016, 23h29
tes 2 disques sont très très vieux, mais je ne vois pas de problème ... (çà me parait presque trop parfait pour des disques qui ont 2028 jours de vie soit 5.5 ans)

Il faudrait réussir à rebooter sur les disques durs en le forçant via le manager.

NB : pour être bien sur que des 2 DD vont bien (çà peut prendre quelques dizaines de minutes)

smartctl -t long /dev/sda && smartctl -t long /dev/sdb

LyGest
21/03/2016, 23h24
Les tests de débit sont bons.

Et voici le résultat des lignes de commande demandées :

root@rescue:/home# df -h
Filesystem Size Used Avail Use% Mounted on
aufs 5.9G 80M 5.9G 2% /
devtmpfs 5.9G 0 5.9G 0% /dev
xx.xx.xx.xx :/home/pub/rescue.v8 2.0T 257G 1.6T 14% /nfs
tmpfs 5.9G 80M 5.9G 2% /rw
xx.xx.xx.xx:/home/pub/pro-power 2.0T 257G 1.6T 14% /power
xx.xx.xx.xx:/home/pub/commonnfs 2.0T 257G 1.6T 14% /common
tmpfs 5.9G 0 5.9G 0% /dev/shm
tmpfs 5.9G 18M 5.9G 1% /run
tmpfs 5.0M 0 5.0M 0% /run/lock
tmpfs 5.9G 0 5.9G 0% /sys/fs/cgroup
tmpfs 5.9G 208K 5.9G 1% /tmp
/dev/md1 9.8G 3.7G 5.7G 40% /mnt
/dev/md2 1.8T 768G 978G 44% /home
root@rescue:/home# smartctl -a -d ata /dev/sdb
smartctl 6.4 2014-10-07 r4002 [x86_64-linux-3.14.32-xxxx-std-ipv6-64-rescue] (local build)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family: Western Digital Caviar Green (AF)
Device Model: WDC WD20EARS-00J2GB0
Serial Number: WD-WCAYY0047616
LU WWN Device Id: 5 0014ee 2af1a8e7e
Firmware Version: 80.00A80
User Capacity: 2,000,398,934,016 bytes [2.00 TB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: ATA8-ACS (minor revision not indicated)
SATA Version is: SATA 2.6, 3.0 Gb/s
Local Time is: Mon Mar 21 23:22:45 2016 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (39600) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 451) minutes.
Conveyance self-test routine
recommended polling time: ( 5) minutes.
SCT capabilities: (0x3031) SCT Status supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 168 161 021 Pre-fail Always - 8575
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 30
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 034 034 000 Old_age Always - 48673
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 28
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 27
193 Load_Cycle_Count 0x0032 180 180 000 Old_age Always - 60927
194 Temperature_Celsius 0x0022 122 094 000 Old_age Always - 30
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 5 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.


buddy
21/03/2016, 22h43
et smartctl -a -d ata /dev/sdb
et
df -h


le disque n°1 à l'air d'aller mais 48641 heures de fonctionnement c'est énrome ... les tests de débits sont bons ?
Power_On_Hours 0x0032 034 034 000 Old_age Always - 48641

LyGest
21/03/2016, 21h12
Toutes mes données sont bien accessibles et j'ai pu monter mes disques durs sans aucun problème.

root@rescue:~# fdisk -l

Disk /dev/sda: 1.8 TiB, 2000398934016 bytes, 3907029168 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: dos
Disk identifier: 0x000ab522

Device Boot Start End Sectors Size Id Type
/dev/sda1 * 2048 20973568 20971521 10G fd Linux raid autodetect
/dev/sda2 20973569 3905972224 3884998656 1.8T fd Linux raid autodetect
/dev/sda3 3905972225 3907024064 1051840 513.6M 82 Linux swap / Solaris

Disk /dev/sdb: 1.8 TiB, 2000398934016 bytes, 3907029168 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disklabel type: dos
Disk identifier: 0x0005149a

Device Boot Start End Sectors Size Id Type
/dev/sdb1 * 2048 20973568 20971521 10G fd Linux raid autodetect
/dev/sdb2 20973569 3905972224 3884998656 1.8T fd Linux raid autodetect
/dev/sdb3 3905972225 3907024064 1051840 513.6M 82 Linux swap / Solaris

Disk /dev/md2: 1.8 TiB, 1989119246336 bytes, 3884998528 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk /dev/md1: 10 GiB, 10737352704 bytes, 20971392 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes


root@rescue:~# smartctl -a -d ata /dev/sda
smartctl 6.4 2014-10-07 r4002 [x86_64-linux-3.14.32-xxxx-std-ipv6-64-rescue] (local build)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family: Western Digital Caviar Green (AF)
Device Model: WDC WD20EARS-00J2GB0
Serial Number: WD-WCAYY0049074
LU WWN Device Id: 5 0014ee 259c4e527
Firmware Version: 80.00A80
User Capacity: 2,000,398,934,016 bytes [2.00 TB]
Sector Size: 512 bytes logical/physical
Device is: In smartctl database [for details use: -P show]
ATA Version is: ATA8-ACS (minor revision not indicated)
SATA Version is: SATA 2.6, 3.0 Gb/s
Local Time is: Mon Mar 21 20:58:42 2016 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection: Enabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: (39600) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 2) minutes.
Extended self-test routine
recommended polling time: ( 451) minutes.
Conveyance self-test routine
recommended polling time: ( 5) minutes.
SCT capabilities: (0x3031) SCT Status supported.
SCT Feature Control supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 170 166 021 Pre-fail Always - 8458
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 30
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 100 253 000 Old_age Always - 0
9 Power_On_Hours 0x0032 034 034 000 Old_age Always - 48641
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 28
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 27
193 Load_Cycle_Count 0x0032 182 182 000 Old_age Always - 55628
194 Temperature_Celsius 0x0022 121 097 000 Old_age Always - 31
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 5 -

SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Nowwhat
21/03/2016, 20h26
La réponse sur:
fdisk -l

smartctl -a -d ata /dev/sda
est effectivement intéressant .....
Histoire de vior si le disque est ok, ou pas.

- - - Mise à jour - - -

La réponse sur:
fdisk -l

smartctl -a -d ata /dev/sda
est effectivement intéressant .....
Histoire de vior si le disque est ok, ou pas.

LyGest
21/03/2016, 19h28
Voici la réponse à mon ticket
Tant pis pour eux, je ne renouvelle pas mon hébergement et j'en profite pour tout migrer ailleurs.

Bonjour M. **** ,


Veuillez nous excuser pour le délai de réponse.


Votre serveur a dû être redémarrer en data-centre mais le redémarrage n'a pas pu s'efefctuer correctement en mode de fonctionnement sur disque dur.

N'ayant aucun accès aux serveurs de nos clients, nous ne pouvons pas en connaître la cause excate, bien que cela semble être d'origine logicielle.

Cependant je vous invite à effectuer des tests sur le disque dur afin d'en vérifier le fonctionnement :

Pour cela en SSH veuillez effectuer ces commandes :

fdisk -l

smartctl -a -d ata /dev/sda

Je reste à votre disposition pour toute demande complémentaire.

Cordialement,

****
Technicien support IT – Kimsufi

Notre Support est accessible 24h/24, 7j/7
Aide en ligne : https://forum.kimsufi.com/
Nos maintenances : http://travaux.ovh.net/

Nowwhat
21/03/2016, 07h37
Citation Envoyé par LyGest
....
Pour info, si je reboote le serveur, il se remet en mode rescue.
UN chose est important maintenant : "mount" tes partitions (prions que le mode rescue de démarre pas car ton disque dur est mort ce qui explique le non-démarrage de ton serveur ...) et récupère tes données.
Garder un R2 jusqu'à mars 2016 - c'est plus fort que de l’inconscience ...... je devine, t'as aussi toujours Windows '95 sur ton PC ?

LyGest
20/03/2016, 21h43
Merci, c'est ce que je voulais faire depuis quelque temps mais maintenant je vais en profiter pour éviter ce service inutile et prendre un meilleur serveur pour le même prix.
Pour info, si je reboote le serveur, il se remet en mode rescue.

buddy
20/03/2016, 19h48
Je rajouterai que si ton serveur a plusieurs années, il est surement plus rentable et fiable de partir sur un nouveau serveur.

Il y a de bon serveurs à pas cher ici : https://www.soyoustart.com/fr/serveurs-essential/ (çà reste OVH )

Soyoustart est une marque OVH : https://www.soyoustart.com/fr/mentions-legales.xml

arowan
20/03/2016, 19h10
Le mieux à faire serait des prendre tes sauvegardes, réinstaller sur un os propre (oublie la R2 et R3) et repars sur une base saine et oublie aussi cette sécurité totale c'est complètement inutile

bbr18
20/03/2016, 19h06
le service "sécurité totale" est un truc cher qui ne sert à rien, c'est juste un copié/collé en ssh de la ligne qui met (mettait) le système à jour, c'est un peu dommage de payer pour ça d'autant que la R2 n'est plus suivie, arrête ça au plus vite et change de distribution (pas de R3 qui est déjà obsolète) avant que ton serveur soit piraté... même s'il est déjà certainement trop tard.

buddy
20/03/2016, 17h48
Et si tu rebootes le serveur, il reste en rescue ?

- - - Mise à jour - - -

Et si tu rebootes le serveur, il reste en rescue ?

LyGest
20/03/2016, 16h06
Le mode exact dans le panel est :
Boot : rescue-pro (Customer rescue system (Linux))

janus57
20/03/2016, 15h21
Bonjour,

C'est à ne plus rien y comprendre, j'ai essayé avec navigateurs différents, c'est toujours la même chose, l'option se remet sur le rescue.
D'après le type de la hotline Canadienne, ce serait "normal".
c'est très mauvais ça, car pour eux si c'est "normale" c'est que @buddy à sans doute vu juste et que le serveur a du être mis en mode anti-hack.

Quel est l'énoncé exacte de l'état de votre serveur dans le panel ?
C'est juste ecrit "rescue" ou "rescue pro" ou autre chose ?

Cordialement, janus57

LyGest
20/03/2016, 15h12
C'est à ne plus rien y comprendre, j'ai essayé avec navigateurs différents, c'est toujours la même chose, l'option se remet sur le rescue.
D'après le type de la hotline Canadienne, ce serait "normal".

Je vais attendre demain pour avoir quelqu'un de compétent mais ce qui est sûr c'est que je vais résilier cette option inutile et transférer mes sites sur un autre serveur plus à jour.

Merci à tous pour votre aide.

buddy
20/03/2016, 15h09
ce n'est pas normal ... Tu dois pouvoir mettre disque dur et ensuite rebooter ton serveur sur le disque dur.

Tu essayes avec quel navigateur ?

Essaye avec google chrome et/ou firefox sinon .

LyGest
20/03/2016, 14h45
J'ai bein les options qui s'affichent ( disque dur, network, rescue ) mais quand je sélectionne "disque dur" et que je sauve, ça se remet automatiquement sur "rescue".

buddy
20/03/2016, 14h34
Si dans l'interface client il est impossible de le remettre sur "redémarrage normal" c'est que OVH l'a bloqué pour spam ou attaque vers d'autres serveurs (donc dans les 2 cas il a été piraté).

Ton serveur a de vieux sites ou CMS (joomla, wordpress et etc ... non à jour ? )

LyGest
20/03/2016, 14h31
Il n'y a rien de plus dans les emails à part les nouveaux logins/mot de passe en mode rescue.
J'ai monté les partitions, ils ne sont pas saturés et ren trouvé de particulier dans les logs.

Pour le moment le reboot est bloqué en "rescue", impossible de le changer en redémarrage depuis disque dur.

Est ce qu'il y a des logs spécifiques à explorer ?

janus57
20/03/2016, 14h15
Bonjour,

y a rien de plus dans les messages comme une informations écrit par un tech ?

un premier email pour dire que la machine n'est pas joignable ( ça m'est déjà arrivé 1 ou 2 fois cette année )
je pense qu'il aurais fallu inspecter le serveur dès la première fois ou vous avez reçus ce type de mail, parfois cela peut être des faux positif du système OVH mais parfois c'est parce que il y a réellement une cause sous-jacente.

Première chose à faire en rescue c'est monter les partitions et regarder les logs au moment de la coupure puis voir si y a pas un problème de HDD (mort et/ou plein).

Cordialement, janus57

buddy
20/03/2016, 14h12
le disque dur n'est pas saturé ?

sinon, relance là sur son disque dur et check les logs ...

Mais selon moi, il faut envisager de toute urgence de remplacer le serveur et de migrer le tout vers une distribution à jour ..


NB : il manque une partie des mails, généralement le technicien dit ce qu'il a constaté avant de la remettre en rescue.

LyGest
20/03/2016, 13h57
Rien de spécial, un premier email pour dire que la machine n'est pas joignable ( ça m'est déjà arrivé 1 ou 2 fois cette année ), ensuite un autre email pour annoncer que la machine n'arrive pas à booter et qu'elle passe en mode rescue.
Je me suis connecté à l'interface graphique et tout vérifié ( cpu, mémoire, disque dur ) mais aucune erreur n'a été détectée.

Je n'ai jamais rien installé/modifié sur cette machine et ne m'y suis même pas connecté depuis des semaines.

Notre système de monitoring vient de détecter un défaut sur votre
serveur *****. Le défaut a été constaté à la date 2016-03-19 00:24:04

Notre équipe de techniciens sur site (opérationnelle 24h/24, 7j/7),
a été informée de ce défaut et va intervenir sur votre machine.

Sachez que d'autres interventions peuvent être en cours actuellement
et qu'il faut compter en moyenne 30 minutes par intervention et par
machine.
Par conséquent, nous ne pouvons pas vous donner plus de précisions
quant à l'heure de début de l'intervention.
Bonjour,

Votre serveur a redémarré en mode 'Rescue' ; cela signifie qu'un
Linux/BSD est lancé sur votre serveur via le réseau. Il ne s'agit pas
du système qui est normalement installé sur votre serveur, aucune
de vos partitions n'est d'ailleurs montée.

Une interface web est disponible pour vous permettre d'effectuer un
diagnostique de votre serveur (disque dur, raid, ram, CPU) et de
parcourir l'arborescence de votre système de fichiers:

buddy
20/03/2016, 13h47
Quel est le mail exact que tu as reçu d'ovh ?

Car çà peut aussi être un disque dur mourrant ...

LyGest
20/03/2016, 13h41
Bonne question, comment s'assurer que c'est un piratage qui en est la cause ? ( le serveur est en rescue mode mais j'ai encore accès à mes fichiers ).

buddy
20/03/2016, 13h37
Tu es sur que c'est suite à une mise à jour OVH ??
Car il n'y a eu aucune mise à jour depuis 8 mois ...
Je pense plutôt que ton serveur a été piraté ..

LyGest
20/03/2016, 13h35
Merci pour ces détails, c'était un service souscrit depuis longtemps et qui ne sert donc plus à rien.
Par contre vu que c'est OVH qui fait cette maintenance, si elle cause un dysfonctionnement, c'est à eux de le régler et pas à moi ? ( je ne sais même pas ce qui a été mis à jour ).

janus57
20/03/2016, 13h05
Bonjour,

pour rappel voici ce qu'est le service :
Pourquoi souscrire à ce service ?

En souscrivant à l'offre PATCH AUTOMATIQUE, vous ne vous occupez plus de la sécurité de votre machine et laissez OVH effectuer toutes les mises à jour nécessaires quant à la sécurité de votre serveur.
OVH se chargera des opérations suivantes :

Activation du NetBoot
Application des releases dès leur parution *
Mise à jour des noyaux GR Sécurity *

* : 24h maximum après la parution officielle
Donc si plus de MAJ de la R2/R3 forcément il leur reste juste à mettre le noyau à jour, mais si c'est un script automatique qui s'en charge c'est mauvais dans le sens ou mettre a jour un noyau sur un très vieille version (genre la R2) je sais pas si c'est la meilleur idée du siècle.

En tout cas de service sert à rien vu que maintenant si on prend un debian + virtualmin (par exemple) ce genre de service peut être assuré par un cron pour la modique somme de 0€ et la lecture de la documentation du panel.

Cordialement, janus57

buddy
20/03/2016, 12h54
Les dates de sortie des patch sont ici : ftp://ftp.ovh.net/made-in-ovh/release ( 0 patch en 2012, 1 en 2013, 2 en 2014 et 3 en 2015 - car il y a eu des failles de sécurité très importantes)

Je pense que c'est bien une R2 sauf si tu l'as entièrement réinstallé en 2013 (de mémoire la date de sortie de la R3)

et la release 3 n'a que php 5.3 qui est déjà end of life ...
autant dire qu'il vaut mieux ne plus partir sur des releases OVH

LyGest
20/03/2016, 12h47
En fait je disais "Release 2 OVH (Gentoo) " parce que c'est ce qui était écrit dans l'espace personnel d'OVH mais comment connaitre la version exacte installée ?
A mois qu'OVH ne me fasse payer les mises à jour pour une version abandonnée ?

buddy
20/03/2016, 12h45
Bonjour,

sauf erreur de ma part, la release R2 est abandonnée depuis plus d'un an.
Donc plus aucune mise à jour.

Ton serveur a du se faire pirater ... il ne te reste plus qu'à récupérer ce qui est récupèrable et louer un nouveau serveur et migrer desus
https://www.how-to.ovh/viewforum.php?f=19

LyGest
20/03/2016, 11h50
Bonjour,

j'ai un dédié OVH qui tourne sous Release 2 OVH (Gentoo) pour lequel j'ai souscrit "Sécurité totale du serveur " pour qu'OVH installe les derniers mises à jour.
Une dernière mise à jour a apparemment causé un problème lors du redémarrage du serveur du coup celui-ci se trouve en mode "Rescue" et vu que je ne sais pas ce qu'OVH a exactement fait, je ne sais pas ce qu'il y a à annuler/modifier.

J'ai bien sûr créé un ticket d'incident (2016031919042752) mais n'ai reçu aucune réponse et leur support téléphonique ( qui est basé au Canada le week-end ) ne peut rien faire puisqu'ils ne vendent pas cette option et se bornent à me demander d'annuler les dernières mises à jour ... qu'OVH a faites

Pour le moment j'ai un accès SSH à la machine, tout est OK au niveau hardware, j'arrive même à monter mes partitions et voir mes fichiers par contre la machine reste en mode RESCUE, impossible de changer le netboot sur le disque dur ni de faire quelque action que ce soit.

Je ne sais plus quoi faire pour le moment, avec une vingtaine de sites qui sont HS en ce moment