Bonjour,


je suis entrain de faire tourner des plans de simulations sur 5 ordinateurs :

-11520 simus sur celui de Sigrid

-4950 sur celui de Youen

-8640 sur celui de Steph

-11520 sur celui d'EMH

-3840 sur Acoustica


Les 3 prmeiers plans de simus se sont arrêtés cette nuit, le plan sur EMH tourne sur 7 coeurs sur 10, et celui sur Acoustica continue sans encombre.


Pour Sigrid (environ 1760 simus ont tourné), Youen (neviron 1920) et EMH, j'ai les mêmes symptômes :

-une fenêtre pop-up "unable to create new native thread"

-suivie de ce message : java.lang.OutOfMemoryError: unable to create new native thread
    at java.lang.Thread.start0(Native Method)
    at java.lang.Thread.start(Thread.java:717)
    at java.util.concurrent.ThreadPoolExecutor.addWorker(ThreadPoolExecutor.java:957)
    at java.util.concurrent.ThreadPoolExecutor.processWorkerExit(ThreadPoolExecutor.java:1025)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1167)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
    at java.lang.Thread.run(Thread.java:748)

Pourtant avec la commande df -h, dans tous les cas, je remarque que la mémoire est loin d'être pleine (ici je travaille sur dev/sda7, il me reste 14G) :

Sys. de fichiers   Taille Utilisé Dispo Uti% Monté sur
udev                  16G       0   16G   0% /dev
tmpfs                3,2G    9,3M  3,2G   1% /run
/dev/sda7             68G     51G   14G  80% /
tmpfs                 16G     64M   16G   1% /dev/shm
tmpfs                5,0M    4,0K  5,0M   1% /run/lock
tmpfs                 16G       0   16G   0% /sys/fs/cgroup
/dev/sda2            100M    9,8M   90M  10% /boot/efi
/dev/sda3            725G    450G  276G  63% /media/Windows
cgmfs                100K       0  100K   0% /run/cgmanager/fs
//nantes/echange     1,6T    1,3T  320G  81% /media/echange
//nantes/discard     1,6T    1,3T  320G  81% /media/discard
//lorient/echantil   1,2T    727G  474G  61% /media/echantil
//lorient/credo      1,2T    727G  474G  61% /media/credo
tmpfs                3,2G     52K  3,2G   1% /run/user/1001
/dev/sda8            4,5G    806M  3,5G  19% /media/youyou/34ffe439-1750-4588-bfb5-ff01136b3346


Sur le PC de Steph (environ 1075 simus), je n'ai aucun message d'erreur, mais rien ne tourne, et de même, la mémoire n'est pas pleine.


Je ne peux pas faire suivre les debugs, ils font des dizaines de Go.


Quel autre paramètre à surveiller pour éviter que ça ne se reproduise?


Audric

--
Audric Vigier
Doctorant à Ifremer, unités EMH (Nantes) et STH/LBH (Brest)

E-mail : audric.vigier@ifremer.fr
Tel : +33 (0)2 40 37 41 64  (8164)