Mes simus de ce matin ont mis 4h15 à 4h25 pour tourner... Donc plus qu'en local mais moins que précédemment puisque elles n'arrivaient pas à leur terme en 5 heures... c'est à n'y plus rien comprendre. J'ai relancé la même AS avec la même config' caparmor pour voir si les résultats sont identiques. Qu'est-ce qu'il faut rechercher en particulier dans les infos accessibles sur caparmor concernant les simus, car c'est vraiment touffu ? Loïc Le 07/03/2014 09:26, Loic GASCHE a écrit :
PS : j'ai une AS de 4 simus lancée ce matin entrain de tourner, donc on peut effectivement aller voir ce qui se passe.
Elles ont un walltime de 10h donc peut-être que cette fois-ci elles vont arriver à leur terme.
Le 07/03/2014 09:19, Loic GASCHE a écrit :
Salut Eric,
Alors après m'être connecté à caparmor :
qstat -u lgasche pour trouver mes jobs
qstat -f jobID\[numeroSimu\] pour trouver sur quel node caparmor la simu est entrain de tourner (ligne exec_node).
Une fois qu'on connait le node, soit aller sur :
http://caparmor-admin2.ifremer.fr/ganglia/?r=hour&s=descending&c=
et sélectionner son rack puis son node dans la liste jusqu'à trouver celui qu'on veut.
Ou alors faire ssh numNode (ex ssh r2i2n2)
Puis on peut faire top pour savoir le numero des simus ISIS sur ce node.
Enfin on peut faire strace -p numSimNode -f, par exemple strace -p 29006 -f pour avoir les infos sur la simu.
Par contre il y a énormément d'infos donc il faudrait les écrire dans un fichier à part pour pouvoir les lire correctement. Comment faire ça facilement ?
A première vue comme le disait Tina il y apleins de "futex..."
Voilà, c'est ce que j'ai ressorti des mails de Tina, ça a l'air de marcher.
Loïc
Le 06/03/2014 16:18, Eric Chatellier a écrit :
Tina n'est pas là en ce moment.
J'avais fait un mail à Denis Croizé-Fillon qui s'occupe aussi de caparmor, au début il penchait plus pour un "problème" ISIS à priori vu qu'il m'avait indiqué de voir avec vous.
On en a brièvement rediscuté ce matin, il n'avait toujours pas l'air de penser que ça venait de caparmor.
Je vais essayer d'en remettre une couche, mais je ne pense pas que ça donne grand chose. En fait, ce qu'il faudrait, c'est les statistiques des simulations lentes et pas lentes pour savoir quoi chercher, sinon, on ne va faire que se renvoyer la balle. Tu as les commandes de tina pour avoir les stats utilisations disque /
Le 06/03/2014 16:11, Loic.Gasche@ifremer.fr a écrit : processeurs ?
Isis-fish-users mailing list Isis-fish-users@list.isis-fish.org http://list.isis-fish.org/cgi-bin/mailman/listinfo/isis-fish-users