Où faire des calculs sous linux au laboratoire?
  1. sur son poste de travail linux : principalement du travail interactif et graphique

  2. sur les micros clusters du laboratoire : Possibilité de travail interactif et batch , plus grande capacité mémoire vive


Où faire des calculs sur quelques dizaines de processeurs?
  1. sur les clusters du mesocentre ESPRI de l’IPSL ( plusieurs centaines de cœurs , Plusieurs centaines de TeraOctets)

  2. sur le centre de calcul de l’UPMC ( http://www.ics.upmc.fr/ ) envoyer un mail à mesu_AT_upmc.fr

    • Machine SMP 1024 coeurs /16T de ram (mesu.dsi.upmc.fr)
    • cluster de 2000 coeurs ( 24 coeurs par noeud / 128Gb ) production depuis fin 2015


Où faire des calculs sur plusieurs centaines de cœurs de calcul?

Pour pouvoir travailler sur l’un de ces centres, il faut que le projet fasse préalablement des demandes d’heure de calcul DARI : https://www.edari.fr/

  • 2 sessions par an : une principale en septembre et une autre en avril
  • il peut y avoir des conditions de nationalités pour les ouvertures de compte
  • il est aussi possible d’avoir un petit nombre d’heures pour tester un code à tout moment


Où faire des calculs sur plusieurs milliers de cœurs de calcul?

Sur les centres de calculs européens regroupés dans PRACE . Voir : http://www.prace-ri.eu/

Contenu site http://ciclad-web.ipsl.jussieu.fr/faq/


I can’t connect to ciclad.ipsl.jussieu.fr
1 if it’s first time perhaps ssh problem or files protection on your home
2 try to log on ciclad2.ipsl.jussieu.fr
3 network problem , firewall
4 problem on ciclad (electricity , climatisation, other )

I’m in ssh on ciclad from  Mac OSX ( or Recent Linux )and after 15/20 minutes remote graphic  don’t work anymore

try :  ssh  -o ForwardX11Timeout=168h -X user@host

Some recent MacOSX and Linux doesn’t support anymore ssh dsa key

best thing to do :create a new rsa key

ssh-keygen -t rsa -b 4096

FAQ Files

 I can’t save my file on /home
1 save it in another filesystem, place ( /tmp …)
2 look on your quota using the quota command

By error I have removed files in /data

FAQ Jobs

 I submit a job and it’s stay in queue ?
showq -b can help you

qdel doesn’t want to stop my job

this could be seen  when there is problem on node where your job was running

do a qstat -rn1 « Numjob » to see on which node it was running

then check-cluster to see if the node status is down

if this is the case mail to support problem on node xxx

 My shell script work in command line , not with qsub

could be memory requirement see documentation

default memory per job  (mem) is 3G . Default virtual memory per job (vmem) is 4G.

in job output look on resources used

sample: (Resources Used: cput=00:07:23,mem=5688kb,vmem=40568kb,walltime=00:08:21)

missing library ,software  , disk space or hardware problem on node where your job run

in job output look on

Running Host: ciclad16.private.ipsl.fr

Same jobs works sometime and sometime not
look on output file to see on which node they run when they works and which node when it’s not
working ( could be a problem on one node , hardware , filesystem full or missing library
In case of submission of the problem to svp-ciclad@ipsl.jussieu.fr thanks to give us job number ,
place of script launched and also place of output of your jobs ( without this, we can’t do something )

Faq Compiler

PGI compiled  give error illegal intruction on some compute node

Warn code compiled  with PGI on ciclad-ng(AMD bulldozer) or ciclad2(intel sandy-bridge) doesn’t run by default on all nodes

best thing is to compile with -tp x64 ( working on intel and amd)  or -tp istambul ( working on AMD all nodes )

use pgfortran -tp istanbul or pgfortran -tp x64 at compile time