Le 20/11/2013 18:19, Eric Chatellier a écrit :
Le 20/11/2013 16:49, Loic GASCHE a écrit :
Je pense que ça peut être utile.
Si j'ai bien compris on a le choix du nombre de coeurs utilisés par ISIS (jusqu'à 256) et on n'a donc pas besoin de faire une demande à chaque fois en fait ? Dans mes souvenir, les utilisateurs d'isis n'avait pas accès à ces queue. Mais ca, c'était avant ;)
Ca marche: 5931602.service0 simulation-sim_ lgasche 00:02:52 R parallel8 5931603.service0 simulation-sim_ lgasche 0 Q parallel64
Dans la configuration de caparmor, à la ligne "Argument qsub" tu peux ajouter "-q parallel8" pour utiliser cette queue.
J'ai recu toute la nuit des messages d'erreur de caparmor : Hello lgasche, your job 5931603.service0, jobname simulation-sim_ using 33 cores have performance ratio as 0.00. Your real time (wall time) is 03:39 where as your CPU time is 00:00. This job blocks 33 cores, thus your cpu time should get closer to 33 * your real time (wall time). If you can improve the performance of your job, your calculation runs faster (and you can make economy of computational resource). Please check your code, and see if you do not do unnecessary io access or bad usage of MPI or OpenMP, or running non optimised paralleljob. This is an automatic e-mail from caparmor. Apparemment il n'est pas content car le job 5931603 ne tourne pas. Ce qui est marrant c'est qu'il dit que ce job tourne sur 33 coeurs... Est-ce que je mets fin à ce job ? Le jour ou j'ai besoin de plus de 8 coeurs il me suffit donc de taper -q parallel nbCoeurs pour utiliser une des queues jusqu'à 256 ? Dans son mail Denis indique que les queue ont un temps limité. Par exemple 18 heures pour la 256 coeurs. Qu'est-ce que cela signifie ? Que se passe-t-il si mon AS n'a pas fini de tourner après 18 heures ? Loïc