Top Banner
Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ" Антонов Александр Сергеевич к.ф.-м.н., с.н.с. лаборатории Параллельных информационных технологий НИВЦ МГУ [email protected] Московский государственный университет имени Московский государственный университет имени М.В.Ломоносова М.В.Ломоносова Научно-исследовательский вычислительный центр Научно-исследовательский вычислительный центр
44

Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Jan 13, 2016

Download

Documents

leal

Московский государственный университет имени М.В.Ломоносова Научно-исследовательский вычислительный центр. Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ". Антонов Александр Сергеевич к.ф.-м.н., с.н.с. лаборатории Параллельных информационных технологий НИВЦ МГУ [email protected]. - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Суперкомпьютерные системы МГУ "ЛОМОНОСОВ",

СКИФ МГУ "ЧЕБЫШЁВ"

Антонов Александр Сергеевичк.ф.-м.н., с.н.с. лаборатории

Параллельных информационных технологий НИВЦ МГУ[email protected]

Московский государственный университет имени М.В.ЛомоносоваМосковский государственный университет имени М.В.ЛомоносоваНаучно-исследовательский вычислительный центрНаучно-исследовательский вычислительный центр

Московский государственный университет имени М.В.ЛомоносоваМосковский государственный университет имени М.В.ЛомоносоваНаучно-исследовательский вычислительный центрНаучно-исследовательский вычислительный центр

Page 2: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Создан МГУ, ИПС РАН и компанией “Т-Платформы” при поддержке компании Интел в рамках суперкомпьютерной программы СКИФ-ГРИД Союзного государства

Суперкомпьютер СКИФ МГУ «Чебышёв»

Page 3: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Характеристики СКИФ МГУ «Чебышёв»

• Пиковая производительность: 60 TFlop/s

• Производительность на Linpack: 47.32 TFlop/s (79% пиковой), матрица 740000х740000

• 625 вычислительных узлов, 1250 процессоров, 5000 процессорных ядер

• 42 стойки: 14 вычислительных, 28 инфраструктурных

• Помещение 98 м2

• Общий вес оборудования: более 30 тонн

Page 4: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Характеристики СКИФ МГУ «Чебышёв»

• Энергопотребление вычислительной части 330 КВт, всего комплекса в пике до 720 КВт

• Система бесперебойного электропитания

• 10 минут автономной работы

• Система охлаждения

• Звукоизоляция

• Система автоматического газового пожаротушения

Page 5: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Вычислительные узлы• Процессоры:

– 1250 Intel E5472 3.0 ГГц Harpertown

• Блэйд-шасси:– T-Blade («Т-Платформы»)– Форм-фактор 5 U– До 10 вычислительных узлов

• Оперативная память:– 529 x 8 ГБ, бездисковые– 64 x 8 ГБ, 160 ГБ HDD– 32 x 16 ГБ, 160 ГБ HDD– 8 x 32 ГБ, 160 ГБ HDD

Page 6: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Коммуникационная сеть• DDR InfiniBand

– Mellanox MT25418 NIC – FatTree– SilverStorm 9120 – базовые

коммутаторы– Flextronix F-X430046 –

листовые коммутаторы

• Характеристики– 1.3 – 1.95 µs латентность– 1.7 ГБ/с пропускная

способность

Page 7: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Коммуникационная сеть

Схема построения Fat Tree в СКИФ МГУ «Чебышёв»

Page 8: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Вспомогательные сети и хранилище данных

• Вспомогательные сети:– Gigabit Ethernet: коммутаторы Force10 C300 и

Force10 S2410 – Управляющая сеть ServNet + IPMI

• Хранилище данных:– 60 ТБ распределённое отказоустойчивое

сетевое хранилище T-Platforms ReadyStorage ActiveScale Cluster

– 15 ТБ локальных дисков на узлах– Ленточное хранилище Quantum Scalar i500

Page 9: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Компоновка системы

Системы охлаждения

Вычислительные узлы, система хранения, коммуникационная сеть

Батареи

UPS

PDU

Газовые баллоны

Горячий коридор

Ряд 3

Ряд 2

Ряд 1

Ряд 4

Page 10: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Система охлаждения

• 8 кондиционеров APC InfraStruXure ACR502, уровень резервирования N+2

• Холодильные машины Liebert-Hiross SLH 023, одновременно работают 2 из 3

• Горячий коридор:– Меньший объём охлаждаемой

части помещения– Более тесная компоновка– До 24 КВт на стойку– Встречные воздушные потоки

Page 11: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Горячий коридор

Page 12: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Горячий коридор

Page 13: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Холодильные машины

Page 14: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Система пожаротушения

• Возможность ручного отключения всего комплекса

• Инертный газ

• 3 месяца тестирования на ложные срабатывания

• При входе в помещение автоматическая система отключается

Page 15: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Электрическое оборудование

• 1-ый и 4-ый ряды стоек

• PDU: APC AP9565

• UPS: APC Symmetra PX

• Мониторинг: ISX Manager

• Уровень резервирования N+1

Page 16: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Программное обеспечение• Операционная система

– ALT Linux HPC

• Параллельная среда

– mvapich

• Система управления

– Cleo

• Разработка программ

– Компиляторы GCC, Intel, PGI, PathScale

– Intel Cluster and Development Toolkit

Page 17: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"
Page 18: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"
Page 19: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"
Page 20: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Суперкомпьютер МГУ Суперкомпьютер МГУ ““ЛомоносовЛомоносов””

Page 21: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Суперкомпьютер МГУ Суперкомпьютер МГУ ““ЛомоносовЛомоносов””

Всего в системе 10т гликоля и 40т воды

Page 22: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Суперкомпьютер МГУ Суперкомпьютер МГУ ““ЛомоносовЛомоносов””

Page 23: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Суперкомпьютер МГУ Суперкомпьютер МГУ ““ЛомоносовЛомоносов””

Page 24: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Суперкомпьютер МГУ Суперкомпьютер МГУ ““ЛомоносовЛомоносов””

Page 25: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Суперкомпьютер МГУ Суперкомпьютер МГУ ““ЛомоносовЛомоносов””

Page 26: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Суперкомпьютер МГУ Суперкомпьютер МГУ ““ЛомоносовЛомоносов””

Вес оборудования машзала – 57 т, СБЭ – 92 т

Page 27: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Суперкомпьютер МГУ Суперкомпьютер МГУ ““ЛомоносовЛомоносов””

Общая длина кабелей более 80 км

Page 28: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Суперкомпьютер МГУ Суперкомпьютер МГУ ““ЛомоносовЛомоносов””

Page 29: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Презентация суперкомпьютера "Ломоносов" (25.11.2009)

Page 30: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Суперкомпьютер МГУ Суперкомпьютер МГУ ““ЛомоносовЛомоносов””

420 Тфлопс350 Тфлопс83%4 4468 892 35 776T-Blade2, T-Blade 1.1, PowerXCell 8iIntel Xeon 5570, 2.93 GHz56,5 ТБайтQDR Infiniband1,35 ПБайтClusrtx T-Platforms Edition252 м2

1.5 МВт

Пиковая производительностьРеальная производительность

ЭффективностьЧисло вычислительных узлов

Число процессоровЧисло процессорных ядер

Типы вычислительных узловОсновной процессорОперативная память

Коммуникационная сетьСистема хранения данных

Операционная системаЗанимаемая площадь

Энергопотребление вычислителя

Page 31: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

12-я редакция списка Top50 самых мощных суперкомпьютеров СНГ12-я редакция списка Top50 самых мощных суперкомпьютеров СНГ

http://www.supercomputers.ruhttp://www.supercomputers.ru

Page 32: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"
Page 33: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"
Page 34: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"
Page 35: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"
Page 36: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"
Page 37: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Работа на СКИФ МГУ «ЧЕБЫШЁВ»• Вход на головную машину

Вход по ssh версии 2 на адресskif-mgu.parallel.ru, IP-адрес: 212.192.244.31

ssh, SSH Secure Shell Client, PuTTY, Teraterm

На вычислительные узлы вход запрещён.

Передача файлов: протокол SFTP

• Хранение файлов

/home/<имя пользователя> - на системе хранения данных, доступны по сети на всех узлах, ограничено квотой.

Page 38: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

• Компиляторы– Intel Compilers 11.0. (C,C++,Fortran77/90,95)

Команды: icc, ifort – Portland Group Inc. Compilers 7.2-3 (C,C+

+,Fortran77/90,95) Команды: pgcc, pgCC, pgf77, pgf90, pgf95

– PathScale Compiler Suite: Version 3.2 (C,C++,Fortran90/95) Команды: pathcc, pathCC, pathf90, pathf95

– GNU 4.1.2 (C,C++,Fortran) Команды: gcc, gfortran

Работа на СКИФ МГУ «ЧЕБЫШЁВ»

Page 39: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

• Компиляция программкоманды mpicc/mpicxx (С и С++) и mpif77/mpif90

(Фортран 77/90). Автоматически подключают заголовочные файлы и библиотеки MPI. Для программ на С++ нужно использовать расширение .C или .cpp, для программ на Фортран 90 - .f90

• Выбор компилятора и реализации MPI

утилита mpi-selector:--list

--set <name>

По умолчанию - компилятор Intel и mvapich

Работа на СКИФ МГУ «ЧЕБЫШЁВ»

Page 40: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

• Опции компиляции-c

-o <имя>

-O3

при компиляции mpicc/mpicxx и mpif77/mpif90 не должны использоваться опции -static и -fast

• Компиляция с OpenMPgcc/gfortran: -fopenmp

icc/ifort: -openmp

pgcc/pgCC/pgf77/pgf90: -mp

export OMP_NUM_THREADS=8

Работа на СКИФ МГУ «ЧЕБЫШЁВ»

Page 41: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

• Запуск приложений (Cleo)mpirun -np N program <параметры программы>

mpirun -np 1 -as single program.e

-q <очередь> –название очереди

-maxtime <время> - максимальное время работы задачи в минутах

• Просмотр состояния задачиtasks

-q <очередь>

-l просмотр расширенной информации о задачах

Работа на СКИФ МГУ «ЧЕБЫШЁВ»

Page 42: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

• Очереди на СКИФ МГУ «ЧЕБЫШЁВ»regular (4152 ядрa) - без локальных дисков, 8 ГБ ОП,

hdd (520 ядер) - с локальными дисками, 8 ГБ ОП,

hddmem (256 ядер) - с локальными дисками, 16 ГБ ОП,

bigmem (64 ядра) - с локальными дисками, 64 ГБ ОП,

test (80 ядер) - без локальных дисков, 8 ГБ ОП.

Для очереди test лимит времени на одну задачу - 15 минут. Разрешено не более 10 задач одного

пользователя в очереди, включая запущенные.

Работа на СКИФ МГУ «ЧЕБЫШЁВ»

Page 43: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

• Просмотр результатовПо окончании работы - сообщение на терминал.

В рабочей директории создаются файлы:

<задача>.out-<номер> и <задача>.rep-<номер>

• Удаление задачиtasks [-q <очередь>] -d ID

tasks [-q <очередь>] -d all

Работа на СКИФ МГУ «ЧЕБЫШЁВ»

Page 44: Суперкомпьютерные системы МГУ "ЛОМОНОСОВ", СКИФ МГУ "ЧЕБЫШЁВ"

Спасибо за внимание!