Liebe Nutzerinnen und Nutzer,
aufgrund neuer Informationen aus dem Gebäudemanagement mussten wir die Downtime neu terminieren. Die Ausfallzeit des Clusters ist nun zwei Wochen später angesetzt und beginnt am 14. Februar um 6:00 Uhr. Leider wurde die benötigte Zeit für die notwendigen Arbeiten am Kühlsystem auf zehn Tage veranschlagt. Daher gehen wir aktuell davon aus, dass der Cluster ab Donnerstag, den 24. Februar, wieder in Betrieb genommen werden kann.
Während der Ausfallzeit werden die Login-Knoten und die Speichersysteme ($HOME, $WORK, ...) zugänglich sein. Wie bereits erwähnt, werden Sie feststellen, dass Ihre Aufträge in der Warteschlange mit dem Status ReqNodeNotAvail warten können, wenn die angeforderte Laufzeit im Verhältnis zur Ausfallzeit zu lang ist. Wenn möglich, können Sie die Laufzeit Ihres Jobs mit dem folgenden Befehl verkürzen:
$ scontrol update job <job-id> TimeLimit=<Neues-Laufzeit-Limit>
wobei Sie die <Platzhalter> durch sinnvolle Werte ersetzen müssen. Andernfalls können Sie den Job in der Warteschlange stehen lassen, wodurch er automatisch gestartet wird, sobald die Ausfallzeit vorbei ist.
Für die dadurch gegebenenfalls entstandenen Unannehmlichkeiten bitten wir Sie zu entschuldigen.
Viele Grüße
Stefan