Модернизация суперкомпьютеров, построенных по классической схеме

В случае, если высокопроизводительный вычислительный комплекс уже используется, но его ресурсов для решения текущих задач недостаточно, возникает необходимость модернизации системы. Это очень тонкий вопрос, связанный, как правило, с рядом трудностей.

Возможен классический экстенсивный подход к наращиванию вычислительных ресурсов.

Как правило, в качестве узлов суперкомпьютера используются системы с максимально возможной конфигурацией процессоров и памяти. Поэтому модернизация заключается в простом увеличении количества вычислительных узлов (горизонтальное масштабирование). Зачастую, на момент модернизации узлы того же типа, что и существующие, уже не доступны для закупки. Новые же узлы, как правило, строятся на базе современных архитектур, современных компонентов, в них используется более быстрая память, интерфейсы ввода/вывода. Это приводит к неоднородности, крайне нежелательной для единого суперкомпьютера. Также следует учитывать, что прирост производительности комплекса в целом при наращивании количества узлов далеко не линеен, и эффект от добавления узлов всё менее заметен с каждым дополнительным узлом. В то же время, наращивание производительности путём горизонтального масштабирования приводит к значительному росту энергопотребления комплекса, что не всегда допустимо.

С появлением гибридных архитектур наиболее оптимальным вариантом модернизации суперкомпьютера является его реорганизация путём приведения к гибридной архитектуре.

На первый взгляд, это кажется малоосуществимым, ввиду того, что вычислительные узлы изначально не предполагали установки графических процессоров. Но в арсенале компании Открытые Технологии есть решение. Для осуществления данной возможности необходимо лишь, чтобы узлы существующего кластера позволили установить специальную интерфейсную карту стандартного конструктива PCI-E. Такая карта, будучи установленной в узлы кластера, позволяет подключить к ним графические процессоры (GPU) во внешнем исполнении. В отдельном корпусе размером со стандартный сервер 1U размещается до 4-х GPU в стандартном варианте и до 16 GPU в 3U для конструктива высокой плотности. При этом они обеспечиваются независимым от вычислительных узлов электропитанием, выделенной системой охлаждения и контроля параметров окружающей среды.

Гибридный суперкомпьютер, построенный с использованием независимых конструктивов для CPU и GPU частей, не только является элегантным решением вопроса модернизации суперкомпьютера классической архитектуры. Он обладает рядом уникальных характеристик. Независимые жизненные циклы центрального и графического процессора позволяют гибко подходить к вопросам обслуживания и модернизации, оптимально распределять источники тепла в монтажных шкафах, что позволяет добиться более благоприятных режимов работы компонентов и, в конечном счёте, положительно отражается на ресурсе их работы.

Именно поэтому подход выделения GPU в независимый конструктив применяется специалистами Открытых Технологий не только при решении задач модернизации существующих систем, но и при построении систем стандартных конфигураций, описанных в предыдущем разделе.

Применение специализированных конструктивов для размещения графических процессоров позволяет максимально прозрачно осуществить переход от суперкомпьютера, построенного по классической схеме, к гибридному суперкомпьютеру со всеми его преимуществами. Это механизм защиты инвестиций заказчика и существенного уменьшения совокупной стоимости владения высокопроизводительной вычислительной системой.

Наши заказчики в рамках данного решения