OVH Community, votre nouvel espace communautaire.

serveur d'email en crise


Oles
17/06/2004, 10h47
Salut,
L'ensemble des problèmes liés aux emails sont resolus
et les installations fonctionnent à nouveau correctement.

En esperant que ça va continuer dans la journée.

Amicalement
Octave

Oles
17/06/2004, 03h01
Salut,
Nous avons pas mal des problèmes aujourd'hui sur les emails
suite au changement dans les parametres de la configuration
de qmail d'hier soir. Les emails ont été distribués trop lentement
sur les disques (nous avons ralentit l'écriture de qmail expré pour
desaturer le filer, mais ça a provoqué plus des problèmes encore).
Nous avons changé ces reglages et à partir de 20h aujourd'hui
la vitesse a été bonne. On ne change plus de parametre.

En parallele des travaux de maintenance sur le filer, nous
avons lancé hier la copie de 20000 domaines du 1er filer
vers le 2ème. 15% de la copie est déjà faite.

Nous avons remis webmail en fin de la soirée. Dans l'état,
demain ceci ne tiendra pas (il n'y a pas de raison que ça
tienne ... à moins d'un miracle). Nous sommes donc en train
d'ajouter une 4ème machine pour repartir la saturation sur plus
des machines et donc saturer "moins" chaque machine. 3 nouvelles
machines ont été ajoutés pour MX3/MX4. une 4ème arrive demain.
Puis on va ajouter encore une 10ène des machines pour MX1/MX2
ainsi que 6 machines pour webmail, mais pas avant le debut de la
semaine prochainne.

Independament, les fournisseurs d'emails gratuits ou pas seulement
ont des problèmes de reception des emails (aol, yahoo, hotmail, ...).
Ceci a provoqué des ralentissements dans la distribution des
emails à partir des vos sites. Nous avons redirigé les flux
vers ces fournisseurs sur une machine qui mettra le temps
necessaire pour envoyer ces emails (dés que les serveurs SMTP
de ces fournisseurs refonctionneront normalement).

Vous avez recuperé 14Go d'emails en 24 heures. Merci. Il reste 296Go.

Nous avons remis le corps des emails en probably spam à partir de 10h
de ce matin. Nous affinons les reglages à ce niveau.

Amicalement
Octave

Oles
16/06/2004, 03h18
Salut,
Nous avons mis en production une version qmail avec un
patch qui devrait bloquer efficacement le virus-spammeur
(merci pour l'idée à celui qui se reconnaitra).

Sur MX3/MX4:
Les emails taggés SPAM, VIRUS et PROBABLY SPAM vous arrivent
sans le contenu (sans corps). Ceci vous permettra recuperer
les emails plus rapidement (moins de volume à recuperer).
Oui ça ne sert à pas grand chose de vous les envoyer et on
pourrait les mettre directement à la poubelle, mais on
prefere vous les envoyer (en cas où).

Une maintenance est en cours sur le 1er filer qui prendra
10ène des jours (normalement les echanges devraient être
de plus en plus rapides).

Vous continuez à recuperer plus d'emails qu'il arrive des
nouveaux à raison d'1Go/3h. C'est pas mal.

Le serveur IMAP a été remis en fonctionnement il y a 5h.

Demain midi on va essayer remettre webmail (si tout va
bien).

PS. Independament de tout, nous avons eu un serveur web
du cluster d'ovh.com qui avait le serveur email
arreté. Nous l'avons redemarré et vous avez pu recevoir
des vieux emails.

Amicalement
Octave

Oles
15/06/2004, 20h30
Salut,
Les problèmes de surcharges que nous connaissons sont dû à un
nouveau type de virus-spammeur. Il est en fonctionnement depuis
vendredi. Les installations ont commencé à ralentir seulement
à partir de Lundi midi c'est pourquoi nous n'avons pas fait de
rapprochement.

Bon. Nous nous sommes battus et arrachés les cheveux toute la
journée pour savoir comment l'arreter. Nous avons amélioré les
filtrages pour detecter ce virus-spammeur via les filtres. Depuis
1h ça fonctionnement enfin correctement. Par contre vous ne recuperez
pas suffisament d'emails. Pour eviter de tout exploser, nous refusons
désormais tous les emails taggés en spam, virus ou spam-probable
(depuis 15 minutes). Et depuis 15 minutes vous arrivez à recuperer
plus d'emails qu'il arrive des nouveaux. On est donc sur le bon
chemin.

Dans 2h, si tout va bien, nous allons augmenter le nombre des
connexions simultanées sur les serveurs POP3. Si ça suite, on
va remettre le serveur IMAP et webmail en fonctionnement, mais
ce n'est pas gagné d'avance ...

Nous vous tenons au courant de l'évolution de la sitation.

Amicalement
Octave

Oles
15/06/2004, 10h44
Salut,
Nous avons fait en partie la maintenance cette nuit qui avait pour le
but d'améliorer les echanges. Malheuressement l'opération prend trop
de temps et nous avons dû l'arreter. Nous allons recommencer cette
nuit.

En attandant, les installations sont extrement surchargées. Nous avons
donc suspendus tous les services qui ne font que la consultation des
emails (webmail et imap) et nous vous remercions d'avance d'utiliser
pop3 dans le but de recuperer vos emails.

Nous n'allons remettre en fonctionnement webmail et imap uniquement
lorsque le niveau des emails recuperés permettra à nouveau un bon
fonctionnement des installations.

Pour permettre une bonne vitesse de recuperation des emails nous avons
diminuer le nombre des connexions simultanées sur le serveur pop3 à
300. Vous allez donc attendre plus de temps pour demarrer la connexion
puis la recuperation des emails sera très rapide.

Merci de ne pas utiliser des outils comme MailWash ou autre qui se
connectent plusieurs fois sur le serveur pop3 et ne fait que lire.
Dans tous les cas nous avons remis la limite de 240 secondes entre
2 connexions pop3.

Désolé pour le problème et les actions très violente, mais l'installation
n'a pas été prevu pour supporter une telle surcharge. Dés que la crise
sera passée, nous allons repartir un certain nombre des comptes sur le
2ème filer ce qui dechargera le 1er.

Amicalement
Octave