FEM-Programmpakete auf dem HPC-Cluster nutzen

Auf dem HPC-Cluster des RZ stehen folgende FEM-Programmpakete zur Verfügung:

Allgemeines zum Batchsystem

Auf dem HPC-Cluster sollen Jobs möglichst über das Batchsystem SLURM abgearbeitet werden. Kommandos des SLURM-Batchsystems sind

  • sbatch: Job abschicken,
  • scancel: Job löschen,
  • squeue: Übersicht aller laufender und wartender Jobs.

Auf dem HPC-Cluster ist ein Module-Konzept implementiert, über das die speziellen Umgebungen für die dort installierten Anwendungen gesetzt werden. Dieses Prinzip muss auch beim Absetzen eines Batchjobs beachtet werden. Dies soll am Beispiel eines MARC-Batchjobs verdeutlicht werden.

Beispiel

Dieses Beispiel ist auf die Bourne-Again-Shell (bash) ausgerichtet. In anderen Shells sind die Befehle ggf. anzupassen.
Die Ressourcenanforderungen und die Kommandos für den Batchjob werden in die Datei run_marc_batch geschrieben. Inhalt von run_marc_batch könnte sein:

#!/bin/bash
#SBATCH -p ether
#SBATCH --ntasks 1
#SBATCH --cpus-per-task 4
#SBATCH --time=12:00:00

# Module initialisieren und Modul fuer Marc laden
. /etc/profile.d/module.sh module add marc

# ins MARC Arbeitsverzeichnis wechseln und MSC-MARC starten
cd $HOME/marcdir
run_marc -jid jidname -user userfile -sdir $TEMPDIR/marc -ver no

Spezielle Hinweise zu MARC

  • Die Option -ver no beim MARC-Aufruf ist absolut notwendig!! Die permanente Nachfrage bei "-ver yes", ob die angegeben Parameter stimmen, wird als Mail über's Netz geschickt und müllt damit den Mail-Server zu. Deshalb ist im Compute Server Cluster "-ver no" voreingestellt.
  • Die MARC-Option -q für die Angabe der Queue kann nicht benutzt werden!