Forum OVH  

Précédent   Forum OVH > Serveurs dédiés
S'inscrire FAQ Guides Recherche Messages du jour Marquer les forums comme lus

Réponse
 
Outils de la discussion
Vieux 24/01/2010, 10h59   #1
madameirma12955
Membre
 
Date d'inscription: janvier 2009
Messages: 91
Exclamation LVM2 + raid soft + checkarray du premier dimanche matin 00h59

Bonjour,
j'ai un proxmox avec un LVM2 pour les backup à chaud sur un dédié avec un raid soft SSD.

J'ai lu avec inquiétude dans le forum ovh anglais que pas mal de gens avaient des problèmes lorsque le checkdisk du dimanche matin 3h00 était lancé, que le serveur utilisait un raid soft, qu'il avait les vm sur une partition LVM, et qu'il effectuait son backup.

Du coup j'ai désactivé les backups le dimanche.
Mais aujourd'hui ... reboot des vm à 3h ce matin !

Dans le log je n'ai que ca:
Jan 24 00:57:01 ns208671 /USR/SBIN/CRON[10483]: (root) CMD ([ -x /usr/share/mdadm/checkarray ] && [ $(date +%d) -le 7 ]
&& /usr/share/mdadm/checkarray --cron --all --quiet)


Alors c'est tout simplement le checkarray qui pue avec LVM ??
Est-ce sain de le désactiver ?
J'ai un peu cherché je ne trouve pas ou il est lancé. Par cron c'est sur, mais je ne suis pas un kador

Merci !

[EDIT]
Apparemment c'est un problème de carte mère, et ca apparait que la partition soit LVM ou pas lorsque les disques font beaucoup d'i/o.
C'est un vieux problème de linux:
http://ubuntuforums.org/showthread.php?t=748418
http://ubuntuforums.org/showthread.php?t=878610

Pour désactiver le script cron déplacer ailleurs ou supprimer le fichier :
/etc/cron.d/mdadm

Dernière modification par madameirma12955 24/01/2010 à 16h54
madameirma12955 est déconnecté   Réponse avec citation
Vieux 25/01/2010, 09h58   #2
philten
Membre
 
Date d'inscription: novembre 2008
Messages: 80
Re : LVM2 + raid soft + checkarray du dimanche matin 3h00

Bonjour,

Bravo, j'enquete depuis longtemps sur ce probleme
http://www.philten.com/ovh-proxmox-raidsoft/

et je n'ai jamais trouvé les tres interessant threads
que tu indiques !

Ce serait donc le checkarray+backup
qui augmenterait le nombre d'i/o jusqu'a declenché le probleme ???

Pourtant, je n'ai jamais constaté le probleme avec des
checkarray + backup NON snapshot, qui pourtant doivent
generer autant d'i/o ???

[Edit]
En suivant la piste je suis arrivé ici
https://bugs.launchpad.net/ubuntu/+s...ux/+bug/212684

Il semble donc que le bug se produirait sur les serveurs avec
controlleur disque Intel SATA AHCI.

Je viens de regarder sur un des serveur qui a le probleme et en effet:

# lspci -vvnn

00:1f.2 SATA controller [0106]: Intel Corporation 82801IR/IO/IH (ICH9R/DO/DH) 6 port SATA AHCI Controller [8086:2922] (rev 02) (prog-if 01 [AHCI 1.0])
Subsystem: Intel Corporation Device [8086:5044]
Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Stepping- SERR- FastB2B- DisINTx+
Status: Cap+ 66MHz+ UDF- FastB2B+ ParErr- DEVSEL=medium >TAbort- <TAbort- <MAbort- >SERR- <PERR- INTx-
Latency: 0
Interrupt: pin A routed to IRQ 2298
Region 0: I/O ports at 2428 [size=8]
Region 1: I/O ports at 243c [size=4]
Region 2: I/O ports at 2420 [size=8]
Region 3: I/O ports at 2438 [size=4]
Region 4: I/O ports at 2020 [size=32]
Region 5: Memory at e83a1000 (32-bit, non-prefetchable) [size=2K]
Capabilities: [80] Message Signalled Interrupts: Mask- 64bit- Queue=0/4 Enable+
Address: fee0300c Data: 4199
Capabilities: [70] Power Management version 3
Flags: PMEClk- DSI- D1- D2- AuxCurrent=0mA PME(D0-,D1-,D2-,D3hot+,D3cold-)
Status: D0 PME-Enable- DSel=0 DScale=0 PME-
Capabilities: [a8] SATA HBA <?>
Capabilities: [b0] Vendor Specific Information <?>
Kernel driver in use: ahci
Kernel modules: ahci


As-tu aussi ce type de controlleur ?
__________________
Phil Ten
www.philten.com

Dernière modification par philten 25/01/2010 à 10h27
philten est déconnecté   Réponse avec citation
Vieux 26/01/2010, 14h11   #3
madameirma12955
Membre
 
Date d'inscription: janvier 2009
Messages: 91
Question Re : LVM2 + raid soft + checkarray du dimanche matin 3h00

Non j'ai un contrôleur Intel ICH10. Cela dit il est forcément AHCI.
La à vue de nez je dirais que l'AHCI n'est pas activé dans le bios.


Capabilities: [e0] Vendor Specific Information <?>

00:1f.2 IDE interface [0101]: Intel Corporation 82801JI (ICH10 Family) 4 port SATA IDE Controller [8086:3a20] (prog-if 8f [Master SecP SecO PriP PriO])
Subsystem: Super Micro Computer Inc Device [15d9:0009]
Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr- Step
ping- SERR- FastB2B- DisINTx-
Status: Cap+ 66MHz+ UDF- FastB2B+ ParErr- DEVSEL=medium >TAbort- <TAbort
- <MAbort- >SERR- <PERR- INTx-
Latency: 0
Interrupt: pin B routed to IRQ 19
Region 0: I/O ports at c000 [size=8]
Region 1: I/O ports at bc00 [size=4]
Region 2: I/O ports at b880 [size=8]
Region 3: I/O ports at b800 [size=4]
Region 4: I/O ports at b480 [size=16]
Region 5: I/O ports at b400 [size=16]
Capabilities: [70] Power Management version 3
Flags: PMEClk- DSI- D1- D2- AuxCurrent=0mA PME(D0-,D1-,D2-,D3hot
-,D3cold-)
Status: D0 PME-Enable- DSel=0 DScale=0 PME-
Capabilities: [b0] PCIe advanced features <?>
Kernel driver in use: ata_piix
Kernel modules: pata_acpi, ata_generic, ata_piix
madameirma12955 est déconnecté   Réponse avec citation
Vieux 26/01/2010, 14h18   #4
madameirma12955
Membre
 
Date d'inscription: janvier 2009
Messages: 91
Re : LVM2 + raid soft + checkarray du dimanche matin 3h00

Intéressant ton lien.
Ce serait donc corrigé à partir de la 2.6.27-11.26

Ya plus qu'à attendre ce kernel ?
Ou est-ce qu'il est déjà sorti ?


Citation:
Wladimir Mutel wrote on 2009-02-07: #21

Good news for everyone. As of linux-image-2.6.27-11-generic 2.6.27-11.26 , it seems that these lockups had gone.
I installed this kernel package on Jan29th, then rebooted the system with new kernel in the night.
On Feb 1st, the RAID1 checks had passed without lockups on the system where they were usually reported earlier (intel+ahci).
madameirma12955 est déconnecté   Réponse avec citation
Réponse

Outils de la discussion

Règles de messages
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is oui
Les smileys sont activés : oui
La balise [IMG] est activée : non
Le code HTML peut être employé : non



Fuseau horaire GMT +2. Il est actuellement 16h43.


© OVH 1999-2010