OVH Community, votre nouvel espace communautaire.

Accés disque lents sur HOST-32L et Proxmox


buddy
21/09/2016, 17h05
pour tester les HDD, 2 solutions.

1) éteindre toutes les VMs et faire un test direct sur l'host proxmox. (tu auras donc le débit utilisable en prod)
2) reboot en rescue et faire le test en rescue. (on exclut donc proxmox du test debit)

tigrou31
21/09/2016, 16h49
Citation Envoyé par buddy
Le changement de machine est normalement rapide avec la virtualisation non ?
c'est le but de la virtualisation...
Tu n'as que l'hote à réinstaller puis tu bascules rapidement les VM et l'un à l'autre en changeant l'ip FO de serveur et voilà non ?
Oui c'est bien çà
Mais migration en week-end uniquement!
Et cela ne résout le problème que si le soucis est bien le HD et qu'un SSD convient, même en raid soft!
Le budget n'est pas illimité donc il ne faut pas que je chevauche plus d'un mois et je ne peux pas tester plusieurs machines !

buddy
21/09/2016, 09h36
Le changement de machine est normalement rapide avec la virtualisation non ?
c'est le but de la virtualisation...
Tu n'as que l'hote à réinstaller puis tu bascules rapidement les VM et l'un à l'autre en changeant l'ip FO de serveur et voilà non ?

tigrou31
20/09/2016, 22h37
Je ne peux pas arrêter le serveur ensemaine.

Je pourrai probablement faire le test ce week end.

Je pense de plus en plus que le soucis vient du hd partagé entre toutes les VM qui devrait être du SSD.
Mais il me faut changer de machine est c'est du temps ...
Je ne sais pas ce que donnerai l'arrêt (temporaire) du Raid sur les performances.
Je peux aussi migrer la BD sur un Cloud SSD OVH pour faire un essai.

buddy
20/09/2016, 19h57
Bonjour,

Et en rescue ? Un test des disques donne quoi ?
Il n'y a pas des process sous proxmox qui continuerai de tourner en arrière plan et ralentirait les disques ?

madri2
20/09/2016, 17h45
moi sur proxmox 3.4 j'ai aussi des valeurs basses

CPU BOGOMIPS: 54272.48
REGEX/SECOND: 1632269
HD SIZE: 19.84 GB (/dev/disk/by-uuid/2f65..............9ffe)
BUFFERED READS: 4.80 MB/sec
AVERAGE SEEK TIME: 57.22 ms
FSYNCS/SECOND: 65.90
DNS EXT: 57.11 ms
DNS INT: 3.13 ms

raid soft

et le smart des deux disques est ok
Code:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   054    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   100   100   024    Pre-fail  Always       -       392
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       6
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   020    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   099   099   000    Old_age   Always       -       10393
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       6
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       354
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       354
194 Temperature_Celsius     0x0002   157   157   000    Old_age   Always       -       38 (Min/Max 21/45)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   137   137   054    Pre-fail  Offline      -       77
  3 Spin_Up_Time            0x0007   137   137   024    Pre-fail  Always       -       455 (Average 457)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       24
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   142   142   020    Pre-fail  Offline      -       25
  9 Power_On_Hours          0x0012   099   099   000    Old_age   Always       -       13698
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       24
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       306
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       306
194 Temperature_Celsius     0x0002   157   157   000    Old_age   Always       -       38 (Min/Max 22/46)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0
edit: légèrement mieux si je coupe apache
Code:
CPU BOGOMIPS:      54272.48
REGEX/SECOND:      1661014
HD SIZE:           19.84 GB (/dev/disk/by-uuid/2f65533a-.....e)
BUFFERED READS:    65.83 MB/sec
AVERAGE SEEK TIME: 9.30 ms
FSYNCS/SECOND:     383.63
DNS EXT:           107.00 ms
DNS INT:           1.01 ms

bbr18
20/09/2016, 16h43
Citation Envoyé par tigrou31
@bbr18 ;
Les disque sont en raid soft car je vois que c'est /dev/md1?
oui raid soft sur les 2 ssd et aussi raid soft sur les 2 de 2 To, Proxmox version 4

tigrou31
20/09/2016, 16h05
Pour les 2 disques

smartctl -a /dev/sda
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 100 100 016 Pre-fail Always - 0
2 Throughput_Performance 0x0005 136 136 054 Pre-fail Offline - 80
3 Spin_Up_Time 0x0007 200 200 024 Pre-fail Always - 313 (Average 311)
4 Start_Stop_Count 0x0012 100 100 000 Old_age Always - 13
5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 0
7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always - 0
8 Seek_Time_Performance 0x0005 142 142 020 Pre-fail Offline - 25
9 Power_On_Hours 0x0012 100 100 000 Old_age Always - 5666
10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 13
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 42
193 Load_Cycle_Count 0x0012 100 100 000 Old_age Always - 42
194 Temperature_Celsius 0x0002 187 187 000 Old_age Always - 32 (Min/Max 15/43)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always - 0

SMART Error Log Version: 1
No Errors Logged
smartctl -a /dev/sda
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 100 100 016 Pre-fail Always - 0
2 Throughput_Performance 0x0005 137 137 054 Pre-fail Offline - 79
3 Spin_Up_Time 0x0007 201 201 024 Pre-fail Always - 315 (Average 305)
4 Start_Stop_Count 0x0012 100 100 000 Old_age Always - 13
5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 0
7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always - 0
8 Seek_Time_Performance 0x0005 145 145 020 Pre-fail Offline - 24
9 Power_On_Hours 0x0012 100 100 000 Old_age Always - 5666
10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 13
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 23
193 Load_Cycle_Count 0x0012 100 100 000 Old_age Always - 23
194 Temperature_Celsius 0x0002 200 200 000 Old_age Always - 30 (Min/Max 16/41)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always - 0

SMART Error Log Version: 1
No Errors Logged

buddy
20/09/2016, 15h32
C'est à dire ok sous smartctl ?

Tu peux poster les 2 en complet ?
Notamment les lignes suivantes pour chaque disque

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 099 099 051 Pre-fail Always - 2376
3 Spin_Up_Time 0x0007 091 091 011 Pre-fail Always - 3620
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 405
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 253 253 051 Pre-fail Always - 0
8 Seek_Time_Performance 0x0025 100 100 015 Pre-fail Offline - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 717
10 Spin_Retry_Count 0x0033 100 100 051 Pre-fail Always - 0
11 Calibration_Retry_Count 0x0012 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 405
13 Read_Soft_Error_Rate 0x000e 099 099 000 Old_age Always - 2375
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0033 100 100 000 Pre-fail Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 2375
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 084 074 000 Old_age Always - 16 (Lifetime Min/Max 16/16)
194 Temperature_Celsius 0x0022 084 071 000 Old_age Always - 16 (Lifetime Min/Max 16/16)
195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age Always - 3558
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0
197 Current_Pending_Sector 0x0012 098 098 000 Old_age Always - 81
198 Offline_Uncorrectable 0x0030 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 100 100 000 Old_age Always - 1
200 Multi_Zone_Error_Rate 0x000a 100 100 000 Old_age Always - 0
201 Soft_Read_Error_Rate 0x000a 253 253 000 Old_age Always - 0

SMART Error Log Version: 1
No Errors Logged

tigrou31
20/09/2016, 15h15
@bbr18 ;
Les disque sont en raid soft car je vois que c'est /dev/md1?

@buddy:
je viens de regarder avec mdadm -D et l'état est "clean" avec les disques biens synchronisés.
Avec smartctl, les 2 disques sont ok!

buddy
20/09/2016, 12h20
As tu vérifié avec smartctl tes disques ?
L'un des 2 est peut être défaillant.
Ça m'était arrivé une fois.
J'avais des symptômes similaires

ovniz
20/09/2016, 11h18
Chez moi :
Code:
CPU BOGOMIPS:      54274.16
REGEX/SECOND:      1660032
HD SIZE:           19.38 GB (/dev/md2)
BUFFERED READS:    15.06 MB/sec
AVERAGE SEEK TIME: 24.00 ms
FSYNCS/SECOND:     132.83
DNS EXT:           27.96 ms
DNS INT:           6.09 ms

bbr18
20/09/2016, 09h25
sur le mien j'ai cela :
Code:
CPU BOGOMIPS:      38398.80
REGEX/SECOND:      2103387
HD SIZE:           19.10 GB (/dev/md1)
BUFFERED READS:    305.88 MB/sec
AVERAGE SEEK TIME: 0.13 ms
FSYNCS/SECOND:     3238.79
DNS EXT:           97.14 ms
DNS INT:           14.32 ms

tigrou31
20/09/2016, 08h41
Bonjour,

J'ai un serveur HOST-32L avec 2 disques 2 To en raid soft et Proxmox V4 installé dessus.
J'ai constaté des lenteurs importantes dés qu'une VM sollicitait un peu le disque dur.

A ces moments le CPU ne fait pas grand chose (5 à 10%) par contre les I/O grimpent et la charge augmente trés significativement (load average).

En développement (django + Postgresql) sur ma machine (I5 - SSD) une requête prends 0,05s, alors que sur le dédié OVH cela prends 10s.

Du coup je suspecte naturellement les accès disques.
Un pveperf donne
Code:
CPU BOGOMIPS:      35196.00
REGEX/SECOND:      2006638
HD SIZE:           19.10 GB (/dev/md2)
BUFFERED READS:    70.51 MB/sec
AVERAGE SEEK TIME: 8.73 ms
FSYNCS/SECOND:     12.23
DNS EXT:           16.76 ms
DNS INT:           5.03 ms
Le FSYNCS/SECOND semble faible.
J'ai un autre serveur Proxmox (3) sur un SYS (2 To RAID SOFT) et qui a les mêmes résultats coté disque

Est ce du au HD ou au RAID SOFT ?
Avez vous une autre piste ?

Merci