Суперкомпьютеры Bull

Bull sequana supercomputers

Открытый суперкомпьютер экзафлопсного класса

Новой серией суперкомпьютеров Bull sequana компания Atos подтверждает свою стратегическую приверженность разработке инновационных высокопроизводительных вычислительных систем – систем, необходимых для решения главных проблем XXI века.

Созданный отделом исследований и разработок Bull в тесном сотрудничестве с основными заказчиками суперкомпьютер Bull sequana X1000 использует новейшие технологические достижения, чтобы обеспечивать максимальную производительность при минимальных эксплуатационных расходах.

sequana – инновационное решение, соответствующее технологическим задачам экзафлопсных вычислений:

Дополнительные сведения о sequana:

Открытость для будущих технологий

Архитектура Bull sequana позволяет интегрировать самые передовые существующие и будущие технологии процессоров, межкомпонентных сетей и систем хранения данных– технологии, которые позволят выйти на уровень экзафлопс. Суперкомпьютеры sequana обладают открытой архитектурой, а их аппаратное и программное обеспечение основано на отраслевых стандартах. Они предлагают заказчикам большой выбор технологий и совместимость с последующими поколениями технологий процессоров (ЦП, ускорители, процессоры с малым потреблением мощности) и различными технологиями межкомпонентных соединений (BXI, InfiniBand), тем самым обеспечивая максимальную защиту инвестиций.

Уменьшение энергопотребления

Энергопотребление – главное препятствие на пути к уровню экзафлопс. Компьютеры sequana обладают очень высокой энергоэффективностью: их коэффициент PUE близок к 1. Они потребляют в 10 раз меньше энергии, чем суперкомпьютеры предыдущего поколения.

Все компоненты sequana – вычислительные узлы и коммутаторы –  охлаждаются улучшенной системой прямого жидкостного охлаждения Bull Direct Liquid Cooling (DLC). DLC –  это проверенная технология охлаждения, которая сокращает общее энергопотребление системы за счет использования теплой воды с температурой до 40 °C.

Sequana также отличается эффективной системой энергосбережения, которая включает в себя датчики энергопотребления и подсистему высокоточного мониторинга энергоэффективности следующего поколения (была реализована в предыдущих системах bullx).

Обработка больших объемов данных

Уровень экзафлопс – это не только экзафлопсная производительность, но и обработка экзабайтов данных. Способы организации, перемещения, хранения данных и доступа к ним значительно влияют на общую производительность системы, тем более что объем данных растет экспоненциально.

Суперкомпьютеры sequana содержат аппаратное и программное обеспечением, которое предназначено для самой сложной обработки данных и основано на исследованиях Bull в области управления распределенными системами и доступа к данным.

Повышение производительности приложений

Для обеспечения экзафлопсной производительности приложений требуется повсеместное применение параллелизма. Система Bull sequana оснащена сетью межсоединений Bull Exascale Interconnect (BXI), разработанной специально для уровня экзафлопс. BXI – это революционная технология аппаратного ускорения, которая снимает с процессоров все коммуникационные задачи.

Более того, программная среда Bull sequana позволяет детализированно управлять ресурсами и обеспечивает максимальную эффективность при эксплуатации системы.

Предоставление отказоустойчивой платформы

С ростом количества компонентов всегда растет и вероятность отказов, поэтому суперкомпьютер класса экзафлопс, содержащий десятки тысяч компонентов, уже находится в зоне риска, если только система не обладает первоклассной отказоустойчивостью.

При разработке архитектуры и компоновки системы Sequana большое внимание уделялось отказоустойчивости:

  • Избыточность критически важных компонентов и компонентов переключения, чтобы сделать Sequana самовосстанавливающейся системой;
  • Высокоэффективный пакет ПО, инструменты управления и встроенный сервер управления с резервированием для реализации иерархического управления;
  • Высокоустойчивые межкомпонентные соединения с функциями адаптивной маршрутизации и повышения надежности;
  • Автоматическое конфигурирование с распознаванием узлов.

Об инновациях Sequana

Ячейка sequana

The sequana cell

В sequana вычислительные ресурсы сгруппированы в ячейки. Каждая ячейка объединяет в себе вычислительные узлы, коммутаторы межсоединений, резервируемые источники питания, резервируемые теплообменники системы жидкостного охлаждения, распределенное управление и поддержку бездисковых компьютеров.

Большие структурные элементы для упрощенного масштабирования

Крупные структурные элементы облегчают крупномасштабное развертывание (до тысяч узлов) за счет повышенной плотности, масштабируемости и рентабельности.

Каждая ячейка sequana состоит из трех шкафов: два шкафа содержат вычислительные узлы, а центральный шкаф –  коммутаторы межсоединений.

Вычислительный шкаф

Каждый вычислительный шкаф вмещает 48 горизонтальных вычислительных блейд-модулей. В верхней части шкафа находятся соответствующие блоки питания, а в нижней – резервируемые гидравлические модули системы охлаждения.

На передней и задней сторонах шкафа установлено по 24 блейд-модуля.

Таким образом, каждая ячейка может содержать до 96 вычислительных модулей, т.е. 288 вычислительных узлов, оснащенных обычными процессорами (такими как Intel® Xeon®) или ускорителями (например, графические процессоры Intel® Xeon Phi™ или NVIDIA®).

В каждом блейд-модуле высотой 1U все горячие компоненты охлаждаются за счет прямого контакта с холодной пластиной с потоком активной жидкости – в вычислительных блейд-модулях sequana нет вентиляторов.

Далее перечислены изначально доступные вычислительные блейд-модули.

Bull sequana X1110 blade

 

Блэйд-модуль Bull sequana X1110

Блейд-модуль Bull sequana X1110 высотой 1U объединяет 3 вычислительных узла с 2 процессорами Intel® Xeon® будущего поколения (кодовое название Broadwell) в каждом;

Блэйд-модуль Bull sequana X1210

Блейд-модуль Bull sequana X1210 высотой 1U состоит из 3 вычислительных модулей с процессором Intel® Xeon Phi™ x200 (кодовое название Knights Landing) в каждом;

Блэйд-модуль Bull sequana X1115

Блейд-модуль Bull sequana X1210 высотой 1U состоит из1 вычислительного модуля, включающего в себя 4 графических процессора NVIDIA Pascal.

Шкаф коммутаторов

Switch cabinet

Соединительные компоненты в центральном шкафу образуют первые два уровня сети межсоединений с топологией fat tree («утолщенное дерево»). Внешние узлы (например, узлы ввода-вывода и сервисные узлы) подключаются напрямую к матрице системы на уровне ячеек..

Шкаф коммутаторов содержит в себе:

  • Коммутаторы 1-го уровня с прямым жидкостным охлаждением – BXI или Infiniband EDR;
  • Коммутаторы 2-го уровня с прямым жидкостным охлаждением – BXI или Infiniband EDR;
  • Группу источников питания коммутаторов;
  • Два дополнительных модуля Ultra Capacity, компенсирующих отключения электроэнергии длительностью до 300 мс;
  • Модули управления, в том числе коммутаторы Ethernet для управления и модуль мониторинга и администрирования стоек Rack
  • Monitoring and Administration (RAMA) – резервируемый сервер управления с совместно используемой системой хранения;
  • «Спрут» объединительной платы – инновационная колонна, обеспечивающая соединения между коммутаторами 1-го и 2-го уровней и вычислительными модулями.

Bull eXascale Interconnect (BXI)

Главное достоинство технологии BXI –  это система управления коммуникациями с полным аппаратным шифрованием, что позволяет использовать всю мощность процессоров для вычислительных задач, тогда как управление коммуникациями осуществляется независимо технологией BXI. Такие межсоединения обеспечивают следующее:

  • Стабильную работу при самых высоких рабочих нагрузках;
  • Революционное аппаратное ускорение;
  • Поддержку массового параллелизма – до 64 тысяч узлов, до 16 миллионов потоков;
  • Поддержку моделей и языков программирования на экзафлопсном уровне.