FEM-Programmpakete auf dem HPC-Cluster nutzen
Auf dem HPC-Cluster des RZ stehen folgende FEM-Programmpakete zur Verfügung:
Allgemeines zum Batchsystem
Auf dem HPC-Cluster sollen Jobs möglichst über das Batchsystem SLURM abgearbeitet werden. Kommandos des SLURM-Batchsystems sind
- sbatch: Job abschicken,
- scancel: Job löschen,
- squeue: Übersicht aller laufender und wartender Jobs.
Auf dem HPC-Cluster ist ein Module-Konzept implementiert, über das die speziellen Umgebungen für die dort installierten Anwendungen gesetzt werden. Dieses Prinzip muss auch beim Absetzen eines Batchjobs beachtet werden. Dies soll am Beispiel eines MARC-Batchjobs verdeutlicht werden.
Beispiel
Dieses Beispiel ist auf die Bourne-Again-Shell (bash) ausgerichtet. In anderen Shells sind die Befehle ggf. anzupassen.
Die Ressourcenanforderungen und die Kommandos für den Batchjob werden in die Datei run_marc_batch geschrieben. Inhalt von run_marc_batch könnte sein:
#!/bin/bash
#SBATCH -p ether
#SBATCH --ntasks 1
#SBATCH --cpus-per-task 4
#SBATCH --time=12:00:00
# Module initialisieren und Modul fuer Marc laden
. /etc/profile.d/module.sh module add marc
# ins MARC Arbeitsverzeichnis wechseln und MSC-MARC starten
cd $HOME/marcdir
run_marc -jid jidname -user userfile -sdir $TEMPDIR/marc -ver no
Spezielle Hinweise zu MARC
- Die Option -ver no beim MARC-Aufruf ist absolut notwendig!! Die permanente Nachfrage bei "-ver yes", ob die angegeben Parameter stimmen, wird als Mail über's Netz geschickt und müllt damit den Mail-Server zu. Deshalb ist im Compute Server Cluster "-ver no" voreingestellt.
- Die MARC-Option -q für die Angabe der Queue kann nicht benutzt werden!