You are here

О использовании бронирования на машине BlueGene/P

Информацию о запуске заданий можно посмотреть здесь: http://hpc.cs.msu.su/bgp/jobs

Система планирования очередей на голубом гене (IBM LoadLeveler) настроена
следующим образом.

В системе есть очередь в которую попадают задачи пользователей. Так называемая "общая очередь". В определённое время часть
процессорных мощностей голубого гена выводится из общей очереди. (К сожалению каждый раз разная часть). В это время участники летней школы, и только они, могут использовать эти выведенные из общей очереди ресурсы. Эти ресурсы в терминах LoadLeveler
называются reservation (бронированием). Настоятельно рекомендуется пользоваться этим бронированием.

Для того, чтобы поставить задачу на эти ресурсы необходимо, в некотором роде, использовать другую очередь задач. БЕССМЫСЛЕНО ставить задачу в эту специальную очередь если бронирование уже не активно; все такие задачи получат статус NQ и НИКОГДА не будут поставлены на исполнение.

Последовательность действий должна быть следующая:

1. При помощи команды llqres вы выясняете какие бронирования будут
доступны в какой момент.

2. Можно поставить задачу. Для этого необходимо выставить переменную
окружения LL_RES_ID. После этого все задачи, которые ставятся в
очередь будут поставлены в очередь на соотвествующее бронирование.
Можно её выставить непосредственно с запуском mpisubmit.bg
"LL_RES_ID=<содержимое_левой_колоночки_от_llres> mpisubmit.bg -n 128 -w 3:00 a.out arg1 arg2"

3. Задача может получить статус NQ. Если это случилось, то по команде
"llq -s <идентификатор_задачи>" можно выяснить почему это произошло.

4. Задачи, поставленные в очередь на бронирования, не ставятся о общую
очередь и необходимо прикладывать специальные усилия, чтобы они туда
попали. Из очереди на бронирования в общую очередь задачу можно
отправить по команде:
"llbind -R <имя_бронирования> список_идентификаторов_задач"