Система Bull eXascale Interconnect

Bull eXascale Interconnect

Эксафлопсные вычисления предусматривают увеличение производительности, количества узлов/вычислительных ядер и объемов данных и их перемещение. Для обеспечения высокой производительности требуется оптимизация сети, которая является основой вычислительной системы. Межкомпонентные подключения будут играть важную роль для практической реализации эксафлопсных вычислений. Именно поэтому одним из наиболее важных аспектов программы Bull по поддержке эксафлопсных вычислений является разработка нового поколения технологии межкомпонентных подключений.

Система Bull eXascale Interconnect (BXI) коренным образом изменяет производительность, масштабируемость, эффективность, надежность и качество сервиса для экстремальных рабочих нагрузок.

BXI обеспечивает высочайшую масштабируемость (до 64000 узлов в первой версии) и следующие показатели:

  • Линии с высокой скоростью передачи данных (100 Гбит/c)
  •  Высокая скорость передачи блоков данных (>100 млн блоков/с)
  •  Минимальные требования к памяти и компоненты с низкой задержкой

Сохранение высокой пропускной способности

Основной отличительной особенностью BXI является аппаратно-закодированная система управления коммуникациями, которая резервирует ресурсы процессоров для вычислительных задач, а коммуникационные рабочие нагрузки контролируются BXI.

В результате, в отличие от других широко используемых сетей, BXI обеспечивает высокую коммуникационную пропускную способность даже тогда, когда система находится под большой вычислительной нагрузкой.

Аппаратное обеспечение BXI назначается напрямую коммуникационным библиотекам, включая MPI (Message Passing Interface) и PGAS (Partitioned Global Address Space). Благодаря аппаратному ускорению, BXI обеспечивает высочайший уровень производительности коммуникаций для HPC-приложений с высокой пропускной способностью, низкой задержкой и высокой скоростью передачи блоков данных.

Архитектура BXI основана на коммуникационной библиотеке Portals 4. Это позволяет выполнить полную оптимизацию для всех коммуникационных типов MPI, включая последние дополнения MPI-2 и MPI-3 и PGAS. Несообщающийся протокол Portals 4 гарантирует минимальные постоянные требования к объему памяти, независимо от размеров системы.

Качество сервиса

Высокое качество сервиса BXI позволяет определять несколько виртуальных сетей и гарантирует, например, что большие блоки данных подсистемы ввода-вывода не будут препятствовать передаче небольших блоков данных. Кроме того, функции адаптированной маршрутизации BXI позволяют в динамическом режиме избегать узких мест в передаче данных.

Надежность и устойчивость

Для обеспечения высокой надежности в BXI предусмотрена функция проверки ошибок и переотправление данных на уровне каналов. Кроме того, все микросхемы ASIC поддерживают функцию кода коррекции ошибок (ECC). Такой подход гарантирует непрерывность работы даже в случае временного или постоянного отказа (на уровне канала или коммутатора).

Компоненты BXI

BXI components

В BXI используются два типа микросхем ASIC в качестве структурных элементов: сетевые контроллеры (NIC) и коммутаторы (свитчи). Кроме того, это решение имеет полноценный программный комплекс. Коммутаторы BXI управляются с помощью распределенного и внешнего комплекса управления с возможностью масштабирования до 64000 узлов. Внешнее управление позволяет разделить трафик управления и трафик приложений.