Вложение параллельных программ в пространственно-распределённые вычислительные системы на основе методов разбиения графов Вторая всероссийская научно-техническая конференция “Суперкомпьютерные технологии”(СКТ-2012) с. Дивноморское, Геленджикскийрайон, 24-29 сентября 2012 г. [email protected]Лаборатория вычислительных систем Института физики полупроводников им. А.В. РжановаСО РАН Кафедра вычислительных систем ФГОБУ ВПО “СибГУТИ” Курносов Михаил Георгиевич, Пазников Алексей Александрович
44
Embed
Вложение параллельных программ в пространственно-распределённые вычислительные системы на основе
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Вложение параллельных программ
в пространственно-распределённые
вычислительные системы на основе
методов разбиения графов
Вторая всероссийская научно-техническая конференция
“Суперкомпьютерные технологии” (СКТ-2012)
с. Дивноморское, Геленджикский район, 24-29 сентября 2012 г.
Лаборатория вычислительных систем Института физики полупроводников им. А.В. Ржанова СО РАН
Кафедра вычислительных систем ФГОБУ ВПО “СибГУТИ”
Курносов Михаил Георгиевич, Пазников Алексей Александрович
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников
Мультикластерные вычислительные системы
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 2Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
? MPI-программа
Специализированные
библиотеки MPI
• MPICH-G2
• PACX
• GridMPI
• mpiG
• MCMPI
• Stampi
• X-Com
• NumGRID
Стандартные средства
GNU/Linux
• VPN
• NAT
• Routing
• IPv6*
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников
Средства диспетчеризации параллельных задачв пространственно-распределённых ВС
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 3
Christian Kauhaus, Adrian Knoth, Thomas Peiselt, Dietmar Fey. Efficient Message Passing on Multi-Clusters: An IPv6 Extension to Open MPI // Proceedings of KiCC'07 – 2007. – 6p.
*
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 4
Выполнение параллельных программ в пространственно-распределённых ВС на основе IPv6
• При вложении использовались два типа графов задач.
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 20
Время выполнения параллельной MPI-программыThe Parallel Ocean Program
NP = 64 NP = 120
– линейное вложение – METIS – Scotch – gpart
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 21
Время выполнения параллельной MPI-программыSWEEP 3D
NP = 64 NP = 120
– линейное вложение – METIS – Scotch – gpart
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 22
Время выполнения параллельной MPI-программыNPB LU
NP = 64 NP = 120
– линейное вложение – METIS – Scotch – gpart
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 23
Время выполнения параллельной MPI-программыNPB MG
NP = 32 NP = 64
– линейное вложение – METIS – Scotch – gpart
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 24
Время выполнения параллельной MPI-программыNPB BT
NP = 36 NP = 64
– линейное вложение – METIS – Scotch – gpart
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 25
Время выполнения параллельной MPI-программыNPB SP
NP = 36 NP = 64
– линейное вложение – METIS – Scotch – gpart
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 26
Время выполнения параллельной MPI-программыThe Parallel Ocean Program
NP = 64 NP = 120
– линейное вложение – разбиение по узлам
– разбиение по подсистемам – иерархический подход
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 27
Время выполнения параллельной MPI-программыSWEEP 3D
NP = 64 NP = 120
– линейное вложение – разбиение по узлам
– разбиение по подсистемам – иерархический подход
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 28
Время выполнения параллельной MPI-программыNPB LU
NP = 64 NP = 120
– линейное вложение – разбиение по узлам
– разбиение по подсистемам – иерархический подход
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 29
Время выполнения параллельной MPI-программыNPB MG
NP = 32 NP = 64
– линейное вложение – разбиение по узлам
– разбиение по подсистемам – иерархический подход
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 30
Время выполнения параллельной MPI-программыNPB BT
NP = 36 NP = 64
– линейное вложение – разбиение по узлам
– разбиение по подсистемам – иерархический подход
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 31
Время выполнения параллельной MPI-программыNPB SP
NP = 36 NP = 64
– линейное вложение – разбиение по узлам
– разбиение по подсистемам – иерархический подход
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
• POP ⇒ Scotch (до 5 раз при NP = 120)
• SWEEP3D ⇒ gpart (на 30% при NP = 120)
• GRAPH500 ⇒ METIS, Scotch, gpart (до 10 раз при NP = 32)
• NPB LU ⇒ линейное вложение
• NPB MG ⇒ METIS, Scotch, gpart (до 5 раз при NP = 64)
• NPB BT ⇒ линейное вложение
• NPB SP ⇒ gpart (на 30% при NP = 64)
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников
Рекомендации по использованию алгоритмов вложения
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 32
Предложенные алгоритмы наиболее эффективны для
разреженными графов MPI-программ с преобладанием
дифференцированных обменов.
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
• Предложен подход к выполнению параллельных MPI-программ
в мультикластерных системах на основе протокола IPv6.
• Созданные алгоритмы вложения в пространственно-
распределённые ВС позволяют в несколько раз сократить время
решения некоторых задач. Наиболее эффективен иерархический
алгоритм вложения.
• Выбор типа графов задач оказывает незначительное влияние на
результат вложения.
• Необходимо создать алгоритм автоматического выбора
алгоритма вложения параллельных программ.
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников
Заключение
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 33Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Спасибо за внимание!
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 34Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 35
Время работы алгоритмов вложения
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 36
Время выполнения параллельной MPI-программыGRAPH500
NP = 32
– линейное вложение – METIS
– Scotch – gpart
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 37
Время выполнения параллельной MPI-программыThe Parallel Ocean Program
NP = 64 NP = 120
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 38
Время выполнения параллельной MPI-программыSWEEP 3D
NP = 64 NP = 120
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 39
Время выполнения параллельной MPI-программыGRAPH500
NP = 32
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 40
Время выполнения параллельной MPI-программыNPB LU
NP = 64 NP = 120
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 41
Время выполнения параллельной MPI-программыNPB MG
NP = 32 NP = 64
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 42
Время выполнения параллельной MPI-программыNPB BT
NP = 36 NP = 64
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 43
Время выполнения параллельной MPI-программыNPB SP
NP = 36 NP = 64
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012
Семинар «Вычислительные системы», Новосибирск, 29 апреля 2011 г.Михаил Курносов, Алексей Пазников 44
Выбор подсистем различных рангов при моделировании
$ cat machinefile.120
xeon16-node1-ipv6 slots=4
xeon16-node2-ipv6 slots=4
xeon16-node3-ipv6 slots=4
xeon16-node4-ipv6 slots=4
xeon32-node3-ipv6 slots=8
jet-cn1-ipv6 slots=8
jet-cn2-ipv6 slots=8
jet-cn3-ipv6 slots=8
jet-cn4-ipv6 slots=8
jet-cn5-ipv6 slots=8
jet-cn6-ipv6 slots=8
jet-cn7-ipv6 slots=8
jet-cn8-ipv6 slots=8
jet-cn9-ipv6 slots=8
jet-cn10-ipv6 slots=8
jet-cn11-ipv6 slots=8
jet-cn12-ipv6 slots=8
$ cat machinefile.32
xeon16-node1-ipv6 slots=4
xeon16-node2-ipv6 slots=4
xeon32-node3-ipv6 slots=8
jet-cn1-ipv6 slots=8
jet-cn2-ipv6 slots=8
$ cat machinefile.64
xeon16-node1-ipv6 slots=4
xeon16-node2-ipv6 slots=4
xeon16-node3-ipv6 slots=4
xeon16-node4-ipv6 slots=4
xeon32-node3-ipv6 slots=8
jet-cn1-ipv6 slots=8
jet-cn2-ipv6 slots=8
jet-cn3-ipv6 slots=8
jet-cn4-ipv6 slots=8
jet-cn5-ipv6 slots=8
$ cat machinefile.36
xeon16-node1-ipv6 slots=4
xeon16-node2-ipv6 slots=4
xeon16-node2-ipv6 slots=4
xeon32-node3-ipv6 slots=8
jet-cn1-ipv6 slots=8
jet-cn2-ipv6 slots=8
Курносов М.Г., Пазников А.А. Вложение параллельных программ … с. Дивноморское, Геленджикский район, 24-29 сентября 2012