CUDA ® АЛЬМАНАХ ЯНВАРЬ 2016
CUDA® АЛЬМАНАХЯНВАРЬ 2016
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 2
СОДЕРЖАНИЕ
НОВОСТИ NVIDIA CUDA
Конкурс “Поделись своей историей вычислений на GPU” 3
Третья Научно-практическая конференция GraphHPC-2016 3
Разработка новых материалов на суперкомпьютерах с GPU-ускорением 3
Исследование сценариев взрывов звезд с помощью 3D моделирования 6
Решение N-TECH.LAB стало лидером мирового чемпионата по распознаванию лиц The Megaface Benchmark 7
Стань частью GTC 2016 9
ИССЛЕДОВАТЕЛЬСКИЕ И УЧЕБНЫЕ ЦЕНТРЫ CUDA Новосибирский государственный университет 9 ВЕБИНАРЫ НА АНГЛИЙСКОМ ЯЗЫКЕ 11
НАУЧНЫЕ РАБОТЫ С ИСПОЛЬЗОВАНИЕМ ВЫЧИСЛЕНИЙ НА CUDA 12
Теоретическое моделирование комплексообразования в системе металл-хелатор-пептид для трехвалентных f-элементов // Якушева Анжелика 12 Изучение связывания ингибитора дорамапимода в аллостерическом сайте p38α MAP-киназы с использованием методов молекулярного моделирования на GPU-ускорителях // Копылов Кирилл 13
Моделирование мутантных форм липополисахаридов грам-отрицательных бактерий и мембран на их основе с использованием GPU // Холина Екатерина 14
Рассеяния релятивистских электронов в неоднородном магнитном поле. Численное моделирование с помощью графических ускорителей // Шустов Павел 15
ПОЛЕЗНЫЕ РЕСУРСЫ ПО CUDA 16
ВАКАНСИИ CUDA 17
КОНТАКТЫ 18
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 3
NVIDIA объявляет конкурс: для участия необходимо написать короткую историю о вашем опыте использования вычислений на GPU и прикрепить документ в теме конкурса.
Призы: Победитель получит платформу Jetson; участник, занявший второе место - билет на посещение конференции GPU Technology Conference 2016; третье место – сувениры от компании NVIDIA
Максимальный объем: одна страница А4 в формате .doc
Сроки: Работы принимаются до 15 февраля 2016 года
Оценка: Победители будут выбраны общим закрытым голосованием, которое продлится с 15 по 29 февраля 2016 года
Узнать подробнее и ознакомиться с правилами
НОВОСТИ NVIDIA CUDA КОНКУРС “ПОДЕЛИСЬ СВОЕЙ ИСТОРИЕЙ ВЫЧИСЛЕНИЙ НА GPU”
Лаборатория DISLab (ОАО «НИЦЭВТ») совместно с НИВЦ МГУ 3 марта 2016 года проводят в МГУ третью научно-практическую конференцию GraphHPC-2016 по проблемам параллельной обработки больших графов с использованием суперкомпьютерных комплексов и кластерных систем. Цель конференции — привлечение внимания к тематике задач по суперкомпьютерной обработке графов и предоставление площадки для общения разработчиков технологий суперкомпьютерной обработки графов и разработчиков графовых приложений, обсуждения перспектив данного направления.
В рамках конференции GraphHPC-2016 проводится конкурс на самую быструю реализацию задачи Community Detection поиска сообществ в графе с весами. Организаторы предоставляют системы (в том числе с GPU) для участия в конкурсе.
Подача заявок на участие в конференции с докладом — до 10 февраля 2016 года, конкурс проводится с 1 по 29 февраля 2016 года.”
ТРЕТЬЯ НАУЧНО-ПРАКТИЧЕСКАЯ КОНФЕРЕНЦИЯ GRAPHHPC-2016
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 4
Доктор Джошуа А. Андерсон (Dr. Joshua A. Anderson) - научный сотрудник в Мичиганском университете, который одним из первых в своей работе стал использовать технологию вычислений на GPU. Он начал свою карьеру с разработки программного обеспечения на первом GPU с поддержкой CUDA, а теперь занимается моделированием на одном из самых мощных суперкомпьютеров в мире.
В 2015 году Андерсон получил премию CoMSEF для молодых исследователей в области моделирования и симуляции за «вклад в разработку и распространение программного обеспечения для молекулярной динамики с поддержкой ускорения на GPU и открытым кодом HOOMD-blue».
РАЗРАБОТКА НОВЫХ МАТЕРИАЛОВ НА СУПЕРКОМПЬЮТЕРАХ С GPU-УСКОРЕНИЕМ
Брэд Немайер (Brad Nemire): Расскажите о проекте, над которым вы работаете сейчас?
Джошуа Андерсон: Я работаю с Glotzer Group в Мичиганском университете. Мы используем компьютерное моделирование для разработки фундаментальных принципов самосборки модульных наносистем и определения методов управления этим процессом для создания новых материалов. Основное внимание мы уделяем тому, какую роль играет форма частицы и как ее изменение может повлиять на различные свойства материала.
Последние несколько лет я работаю над двумерными системами, используя крупномасштабное имитационное моделирование для изучения перехода твердых дисков в гексатическую фазу, а также того, как поверхностное структурирование полигонов может создавать аллофилы, улучшающие процесс самосборки. Гексатическая фаза - это переходное состояние между жидкой и твердой фазой вещества с гексагональной структурой. В гексатической фазе между частицами имеет место как дальний, так и ближний трансляционный порядок, но вещество не имеет кристаллической решетки. Аллофилы - полигональные структуры, подходящие друг к другу, как фрагменты пазла. Этот проект требует огромного объема вычислений. К тому же, он не мог быть выполнен ни на одном из существующих кодов. Поэтому, прежде чем начать работу, мне пришлось разработать и оптимизировать параллельные алгоритмы, Метод Монте-Карло для твердых частиц - симуляция частиц, сходная с методами молекулярной динамики. Мы используем его для моделирования коллоидных частиц и частиц наноразмера, которые имеют форму. Представьте себе коробку, наполненную многогранными кристаллами, которую встряхнули так, что все кристаллы могут занять самое удачное расположение. Нет силы притяжения, и частицы не накладываются друг на друга. Энтропия приводит к самосборке твердых частиц в разнообразные сложноупорядоченные фазы.
Рисунок 1: примерная структура системы из проекта по аллофилам: Эрик С. Харпер (Eric S. Harper), Райан Марсон (Ryan Marson), Джошуа А. Андерсон (Joshua A. Anderson), Грег ван Андерс (Greg van Anders) и Шарон С. Глотцер (Sharon C Glotzer). Аллофилы повышают энтропию самосборки. Soft Matter, 2015. (doi:10.1039/C5SM01351H).
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 5
Я применил метод Монте-Карло для твердых частиц в качестве дополнения к HOOMD-blue, программному пакету для моделирования частиц с открытым кодом, разработкой которого я руководил. HOOMD-blue - высококонфигурируемый инструмент: пользователи пишут на Python сценарии, активирующие и настраивающие функции, которые необходимо запустить. HOOMD-blue был изначально представлен в качестве движка для моделирования молекулярной динамики. Ниже приведен пример сценария для описания жидкой фазы вещества с помощью модели Леннард-Джонса.
Используя Python, пользователи легко могут запускать сложные рабочие процессы: настраивать программы инициализации, изменять параметры обработки, анализировать стадии моделирования, решать о прекращении или продолжении работы и многое другое. Текущая версия HOOMD 1.3 выполняет симуляции методом молекулярной динамики с учетом различных силовых полей. Моделирование методом Монте-Карло, о котором я рассказал, будет доступно в версии 2.0.
Рисунок 2: симуляция микросферы, полученной из звездообразного полимера. На сегодняшний день то самая крупномасштабная симуляция с использованием HOOMD, в которой было задействовано 11 миллионов частиц. Жанг (Zhang) и др. (2015) Контроль за самосборкой микросфер из звездообразных полимеров на уровне нано- и микрочастиц 27, 3947–3952 (doi: 10.1002/adma.201570177).
Подробнее.
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 6
Исследователи из университета штата Нью-Йорк в Стоуни-Брук изучают физические свойства сверхновой типа Ia на суперкомпьютере Titan в Национальной лаборатории Оук-Ридж.
По оценкам ученых, суперновые типа Ia можно использовать для вычисления космических дистанций с точностью до 10 процентов. Это достаточно хороший результат, позволивший ученым определить, что увеличение нашей вселенной ускоряется. Это открытие было удостоено Нобелевской премии в 2011 году. Несмотря на то, что взрывающиеся белые карлики выделяют одинаковое количество света, все же между ними есть небольшие различия. Именно их исследователи и изучают на суперкомпьютерах.
Команда ученых смоделировала 18 разных белых карликов, взрывающихся по схеме двойной детонации, с помощью кода MAESTRO для гидродинамических дозвуковых задач. Код был использован для расчета структуры из трех элементов: гелия, углерода и кислорода. Ученые надеются, что ускорение на GPU позволит им увеличить размер структуры до 10 элементов. Первые опыты использования директив OpenACC в последней версии компилятора PGI показали ускорение этой части кода почти на 400 процентов.
Вычисления на GPU помогают ученым в исследовании не только суперновых типа Ia, но и других астрофизических феноменов.
«Прямо сейчас наша реакционная схема рентгеновских вспышек содержит 11 ядер. Мы хотим увеличить количество ядер до 40. Для этого нам потребуется в 16 раз больше вычислительной мощности. Подобную производительность могут обеспечить только GPU», - сказал руководитель команды исследователей Майкл Зингале (Michael Zingale).
ИССЛЕДОВАНИЕ СЦЕНАРИЕВ ВЗРЫВОВ ЗВЕЗД С ПОМОЩЬЮ 3D МОДЕЛИРОВАНИЯ
Рис. “Потоки” (обозначены красным), участки, где горячий газ вырывается при термоядерном горении на поверхность звезды, формируются в начале конвекции в гелиевой оболочке белого карлика. На изображении показана ранняя стадия конвекции на поверхности белых карликов разной массы. (Изображение предоставил Адам Якобс (Adam Jacobs) из Университета штата Нью-Йорк в Стоуни-Брук)
Подробнее.
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 7
РЕШЕНИЕ N-TECH.LAB СТАЛО ЛИДЕРОМ МИРОВОГО ЧЕМПИОНАТА ПО РАСПОЗНАВАНИЮ ЛИЦ THE MEGAFACE BENCHMARKАлгоритм российской компании N-Tech.Lab для распознавания лиц по фотографиям на базе глубокой нейронной сети и технологий NVIDIA стал лидером мирового чемпионата по распознаванию лиц The MegaFace Benchmark. В планах N-Tech.Lab – запуск ряда сервисов на базе алгоритма.
The MegaFace Benchmark, мировой чемпионат, организованный Университетом Вашингтона, - это первое соревнование по распознаванию лиц на больших базах фотографий до миллиона изображений. Ранее решения проверялись на базах порядка 10 тыс. фотографий. Решение N-Tech.Lab, российского стартапа, который разрабатывает алгоритмы искусственного интеллекта на базе нейронных сетей, оказалось наиболее эффективным из более 100 решений, участвовавших в чемпионате — точность распознавания составила более 73,3%!
На рис. - Пример проекции представлений лиц на плоскость. При этом расстояния являются мерой сходства фотографий. На рисунке хорошо заметно, что фотографии одного человека склонны группироваться в кластер, фотографии так же группируются в зависимости от пола, возраста и других атрибутов лица.
Важным преимуществом алгоритма N-Tech.Lab являются невысокие требования к мощностям компьютеров. Для обучения алгоритма компания использовала два ПК на базе 4 графических процессоров NVIDIA GeForce GTX 980 и один ПК на базе 4х карт NVIDIA GeForce GTX Titan Black.
Созданная NVIDIA технология CUDA (Сompute Unified Device Architecture — программно-аппаратная архитектура массивно параллельных вычислений) позволяет решать большую часть вычислительных задач эффективнее, чем при использовании ресурсов CPU. N-Tech.Lab использовала для обучения нейронных сетей NVIDIA cuDNN 3 – актуальную версию GPU-ускоренной библиотеки математических операций для глубоких нейронных сетей, которую разработчики встраивают во фреймворки машинного обучения высокого уровня. . Библиотека обеспечивает высокую производительность и низкую нагрузку на память. Простота использования позволяет разработчикам сконцентрироваться на проектировании и реализации моделей нейронных сетей, а не на подстройке производительности, при этом они получают максимально высокую производительность параллельных вычислений.
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 8
N-Tech.Lab намерена совершенствовать созданный компанией алгоритм, в том числе и за счет расширения сотрудничества с NVIDIA– одним из мировых лидеров в области высокопроизводительных вычислений. Решения NVIDIA используются по всему миру, в том числе крупными ИТ и Интернет-компаниями, например Google, Yandex и Facebook. Также среди компаний, использующих GPU-решения NVIDIA— крупнейшие игроки рынка биотехнологий, нефтяные и промышленные компании, оборонные предприятия, производители пищевых продуктов и т. д.
«С помощью больших вычислительных систем на базе GPU мы сможем сделать наш алгоритм еще более эффективным и достичь еще большей точности распознавания. Уже сейчас точность нашего алгоритма намного выше точности распознавания человеком. Например, при работе с базами объемом до 10 тысяч фотографий средняя точность распознавания человеком составляет 25%, наш алгоритм дает точность 90%. После того как нейронная сеть обучена, на одном GPU, она способна обрабатывать до 100 фотографий в секунду, этого достаточно для решения большинства практических задач», - отмечает основатель N-tech.Lab Артём Кухаренко.
N-tech.Lab также активно работает над созданием на базе своего алгоритма новых сервисов. Компания готовится запустить несколько коммерческих продуктов с использованием созданного решения. Один из них — сервис знакомств, позволяющий искать людей с внешностью определенного типа. Пользователь сервиса сможет загрузить фотографию понравившегося человека и найти его или похожих на него людей в соцсетях. В настоящий момент ведется разработка подобного приложения.
Другая сфера применения разработанной технологии — адресная реклама в ритейле. Алгоритм может анализировать записи с камер наблюдения в интернет-магазинах и искать посетителей в социальных сетях. После этого потенциальному покупателю можно направлять адресную рекламу. В настоящий момент N-tech.Lab ведет переговоры с несколькими крупными ритейлерами о создании подобных решений.
Также решение, созданное N-tech.Lab, может использоваться в новых моделях смартфонов для создания приложений, обеспечивающих авторизацию пользователя по фотографии. Также подобный алгоритм может анализировать записи с камер, вмонтированных в банкоматы и установленных в отделениях банков для отслеживания потенциальных мошенников и оперативного оповещения об опасности.
Еще одна возможная сфера применения — решения в области безопасности. Сейчас камеры наблюдения устанавливаются практически во всех общественных местах — в метро, торговых центрах, на улицах, вокзалах и аэропортах. Основная сложность в подобных решениях — быстро выделять лица, отмеченные в базе данных из постоянного потока людей. Созданное N-Tech.Lab решение обеспечивает достаточную скорость для решения задач по обеспечению безопасности практически любой сложности.
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 9
ИССЛЕДОВАТЕЛЬСКИЕ И УЧЕБНЫЕ ЦЕНТРЫ CUDAУЧЕБНЫЙ ЦЕНТР ПО ТЕХНОЛОГИИ CUDA НОВОСИБИРСКОГО ГОСУДАРСТВЕННОГО Новосибирский государственный университет (НГУ) был основан в 1958 году для подготовки научных кадров для институтов Сибирского отделения РАН. НГУ стал центром Академгородка. В шаговой доступности от университета находятся 34 научно-исследовательских института СО РАН. Обучение в НГУ проходят около 6500 студентов на 13 факультетах.
Информационные технологии все глубже проникают в нашу жизнь и так или иначе используются и изучаются студентами всех факультетов, однако специализация присутствует только на трех. Исторически это были два факультета – Механико-математический и Физический факультеты. В 2000 году был организован Факультет информационных технолгий. Именно тут готовят специалистов по применению современных вычислительных архитектур для решения трудоемких вычислительных задач.
Первые попытки использовать технологию CUDA в НГУ начались в 2008 году, и уже в 2009 в НГУ, в рамках программы Tesla University Tour, глобальной инициативы компании NVIDIA, была организована совместная с компанией NVIDIA конференция. Конференция собрала более 70 исследователей, разработчиков программного обеспечения и представителей академической общественности Сибири. От НГУ и институтов СО РАН было представлено 4 проекта по применению графических процессоров для расчетов в различных областях науки. Следующая конференция была организованна в 2011 году и собрала более 80 участников. Было представлено более десятка докладов по теме конференции.
С 2009 года для сотрудников научно-исследовательских институтов и студентов НГУ читается курс по технологии CUDA. С 2013 года курс дополнен информацией по технологии OpenACC. Для магистрантов Факультета информационных технолгий курс вставлен в программу обучения.
В 2011 году НГУ получил официальный статус учебного центра по технологии CUDA.
В рамках учебного центра по направлению применения графических процессоров для математических расчетов НГУ сотрудничает с институтами Сибирского отделения, зарубежными коллегами, с технологическими компаниями. Так стоит отметить следующие проекты, проводимые совместно с институтами СО РАН:
ПРИМИТЕ УЧАСТИЕ В ЕЖЕГОДНОЙ КОНФЕРЕНЦИИ ПО ГРАФИЧЕСКИМ ПРОЦЕССОРАМ GTC 2016У вас есть возможность принять участие в GPU Technology Conference 2016, 4-7 апреля 2016 года в Силиконовой Долине США.
GTC – самая масштабная конференция для разработчиков – эпицентр визуальных вычислений.
Подробнее
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 10
• Институт цитологии и генетики СО РАН
o Поиск мотивов в цепочках РНК
o Применение графических процессоров в задаче ассемблирования генома
Из взаимодействия с зарубежными институтами и технологическими компаниями стоит отметить следующие:
• Schlumberger
o Параллельная реализация задачи гидроразрыва.
• Backer Hughes
o Решение задачи оценки нефтенасыщенности среды.
• Институт физики Земли, Париж, Франция.
o Анализ больших объемов данных низкочастотных землетрясений.
• Университет Айзу (Япония), ИВМиМГ, PMEL NOAA (США)
o Моделирование распространения волны цунами.
Таким образом учебный центр по технологии CUDA в НГУ функционирует. Деятельность Центра направлена на обучение и помощь в адаптации программ для выполнения расчетов на гибридных вычислительных системах на базе графических процессоров.
• Институт нефтегазовой геологии и геофизики СО РАН
o Параллельный алгоритм разложения функций по волновым пакетам для анализа больших объемов сейсмических данных.
o Моделирование сейсмических волн в слоистой среде с изогнутыми границами.
o Параллельная реализация алгоритма расчета влияния рельефа на оценку теплового потока Земли
o Расчет неустойчивости Релея-Тейлора в задачах соляного диапиризма.
• Институт вычислительной математики и математической геофизики, ИВМиМГ СО РАН
o Реализация задачи по моделированию плазмы.
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 11
ВЕБИНАРЫ НА АНГЛИЙСКОМ ЯЗЫКЕ Последние записи на английском языке:
Free OpenACC Course
Real time, Low Latency Feature Tracking with ArrayFire
More Science, Less Programming with OpenACC
Deep Learning Courses
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 12
НАУЧНЫЕ РАБОТЫ С ИСПОЛЬЗОВАНИЕМ ВЫЧИСЛЕНИЙ НА CUDAВ данном номере представлены работы победителей конкурса стипендий CUDA Center of Excellence МГУ 2015
ТЕОРЕТИЧЕСКОЕ МОДЕЛИРОВАНИЕ КОМПЛЕКСООБРАЗОВАНИЯ В СИСТЕМЕ МЕТАЛЛ-ХЕЛАТОР-ПЕПТИД ДЛЯ ТРЕХВАЛЕНТНЫХ F-ЭЛЕМЕНТОВ Якушева Анжелика
Химический факультет МГУ
Целью данного исследования является поиск новых комплексообразователей, отличающихся высокими константами устойчивости комплексов металл-лиганд и способных конъюгировать с биологическими векторами для создания радиофармпрепаратов. В ходе работы с помощью полуэмпирических методов и методов молекулярной динамики была оптимизирована геометрия комплексов радионуклид-хелатор, хелатор-пептид, проанализировано взаимодействие комплекса хелатор-пептид в растворителе. Использование GPU позволяет рассчитывать траектории, длительные по времени, и на основе полученных данных фиксировать образование конъюгата пептид-хелатор и определять потенциальные центры связывания. В дальнейшем они могут быть модифицированы различными функциональными группами для образования комплекса пептид-хелатор. Существенность использования GPU при проведении подобных расчетов определяется количеством атомов в исследуемой системе (порядка нескольких тысяч с учетом молекул растворителя и ионов), так как время расчета зависит от общего размера системы, а также необходимой длительностью траектории.
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 13
ИЗУЧЕНИЕ СВЯЗЫВАНИЯ ИНГИБИТОРА ДОРАМАПИМОДА В АЛЛОСТЕРИЧЕСКОМ САЙТЕ P38Α MAP-КИНАЗЫ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МОЛЕКУЛЯРНОГО МОДЕЛИРОВАНИЯ НА GPU-УСКОРИТЕЛЯХ
Копылов Кирилл
Химический факультет МГУ
p38α MAP-киназа катализирует АТФ-зависимое фосфорилирование различных белков и долгое время исследуется как мишень для новых лекарств от воспалительных заболеваний человека. Взаимодействие дорамапимода с аллостерическим центром p38α MAP-киназы человека было изучено с помощью метода молекулярного докинга. Для изучения структурных изменений в ферменте, происходящих вследствие связывания лиганда, был использован метод молекулярной динамики на графических процессорах, которые значительно ускоряют расчеты, а значит, позволяют получить информацию о динамических изменениях в структуре белка в течение более длинных траекторий. Были протестированы GPU-версии программ молекулярной динамики AMBER и NAMD на различных аппаратных конфигурациях узлов суперкомпьютера «Ломоносов». Были рассчитаны траектории движения для свободного белка и комплекса фермент-ингибитор в течение длительного времени. Полученные данные позволят изучить конформационные изменения в аллостерическом центре МАРК при связывании ингибитора.
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 14
МОДЕЛИРОВАНИЕ МУТАНТНЫХ ФОРМ ЛИПОПОЛИСАХАРИДОВ ГРАМ-ОТРИЦАТЕЛЬНЫХ БАКТЕРИЙ И МЕМБРАН НА ИХ ОСНОВЕ С ИСПОЛЬЗОВАНИЕМ GPUХолина Екатерина
Биологический факультет МГУ
Ключевую роль в развитии сепсиса и септического шока, вызванных грамотрицательной инфекцией, играют эндотоксины, выделяющиеся в кровяное русло из разрушенных клеток бактерий. По химическому строению эндотоксины относятся к липополисахаридам (ЛПС) и являются основным компонентом наружной мембраны, входящей в состав клеточной стенки грамотрицательных бактерий. Поиск эффективных антимикробных агентов невозможен без понимания устройства внешних клеточных мембран грам-отрицательных бактерий, состоящих из молекул ЛПС. Целью настоящей работы являлось создание молекулярно-динамической модели наружной мембраны клеточной стенки грам-отрицательных бактерий на основе минимальной ЛПС структуры и исследование ее свойств методами компьютерного моделирования. На основании экспериментальных данных масс-спектрометрии была расшифрована точная молекулярная структура мутантной формы ЛПС, обладающей минимальной длиной коровой части. В результате проведения молекулярно-динамических (МД) и квантово-химических расчетов была создана компьютерная модель одиночной молекулы ЛПС. На основе построенной модели одиночной молекулы ЛПС была создана ЛПС мембрана клеточной стенки грамм-отрицательных бактерий. На основании проведенных МД расчетов в течение 1200 нс были рассчитаны основные характеристики ЛПС мембраны: площадь на липид, электронная плотность, подвижность липидов. С течением времени площадь на липид не изменяется, что свидетельствует об устойчивости созданной системы.
Рис. Визуализация наружной мембраны клеточнйо стенки грам-отрицательных бактерий, построенной на основе минимальной структуры ЛПС.
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 15
РАССЕЯНИЯ РЕЛЯТИВИСТСКИХ ЭЛЕКТРОНОВ В НЕОДНОРОДНОМ МАГНИТНОМ ПОЛЕ. ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ С ПОМОЩЬЮ ГРАФИЧЕСКИХ УСКОРИТЕЛЕЙ Шустов Павел
Физический факультет МГУ
Целью работы была численная проверка и возможное уточнение результатов по рассеянию электронов в токовом слое, описанное в работе Delcurt’а1). Работа заключалась в написании программы моделирования и в последующем анализе и обработке данных. Численный расчет выполнялся с помощью CUDA на GPU. Благодаря возможности массивного распараллеливания было получено ускорение более чем в 1000 раз в сравнении с CPU при использовании видеокарты суперкомпьютера Ломоносов.
1)Delcurt et al. “On the nonadiobatic precipitation of ions from the near-Earth plasma sheet” 1996 Journal of Geographysical Research.
2) P. I. Shustov, A. V. Artemyev, E. V. Yushkov Intermediate regime of charged particle scattering in the field-reversal configuration (Chaos 25, 123118 (2015)) http://dx.doi.org/10.1063/1.4938535
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 16
ПОЛЕЗНЫЕ РЕСУРСЫ ПО CUDA
Группа вконтакте: www.vk.com/nvidiacuda
Новый каталог с 370 приложениями, ускоряемыми на GPU можно скачать по ссылке.
Материалы GPU Technology Conference 2015 доступны по ссылке
Форум Разработчиков NVIDIAприсоединяйтесь к Форуму CUDA-разработчиков, делитесь своим опытом и узнавайтемного нового. http://devtalk.nvidia.com/
Документация по CUDAСо списком документации по CUDA можно ознакомиться здесь.
Обучение онлайнUdacity | Coursera | Курс на русском языке
Библиотеки с поддержкой GPU ускоренияСписок библиотек с поддержкой GPU ускорения от NVIDIA и партнеров.
GPU Тест-Драйв Хотите бесплатно протестировать Tesla? Зарегистрируйтесь здесь.
Ускоряйте научные приложения с OpenACCПротестируйте компилятор PGI OpenACC бесплатно в течение месяца. Подробнее.
Книги, посвященные CUDA и вычислениям на GPUСо списком книг, посвященных CUDA и вычислениям на GPU, можно ознакомиться здесь.
СкачайтеCUDA http://developer.nvidia.com/cuda-downloads Nsight http://www.nvidia.com/object/nsight.html
Страница NVIDIA в vk.comhttps://vk.com/nvidia
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 17
ВАКАНСИИ CUDA СТАРШИЙ ИНЖЕНЕР ПО РАЗРАБОТКЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ
Самсунг
Москва
Обязанности:• Обязанности старшего инженера по разработке алгоритмов машинного обучения включают, но не ограничиваются следующим списком: o Решение прикладных задач машинного обучения для распознавания/классификации/ категоризации визуальных, аудио и текстовых данных; o Выделение признаков; o Обучение без учителя; o Преобработка и постобработка данных; o Эффективная реализация решающих и обучающих алгоритмов.• Проведение прикладных исследований и разработки технологий в области машинного обучения;• Работа в тесном сотрудничестве с другими членами исследовательской группы;• Написание патентов, охватывающих разработанные технологии;• Реализация разработанных алгоритмов;• Презентация и демонстрация результатов исследований на внутренних (внешних) мероприятиях.
Требования:• Отличные аналитические способности• Кандидатская степень (крайне желательно) в области технических или физико- математических наук.• Опыт в области исследований и разработок в рамках широкой области машинного обучения, применительно к таким сферам как: обучение представлений признаков, обучение без учителя на неразмеченных данных, визуальная детекция/распознавание, семантический разбор текста, и т.п.• Опыт разработки на С++• Опыт в области разработки с использованием научных языков программирования (Matlab/ Octave, Python w Numpy, Scipy)• Опыт разработки с использованием GPGPU (CUDA, OpenCL) является сильным плюсом• Опыт разработки библиотек для Linux является сильным плюсом• Опыт практического применения алгоритмов машинного обучения в коммерческих продуктах является сильным плюсом• Хорошие навыки командной работы и коммуникации, энтузиазм, творческие способности, продуктивность и обучаемость.
Подробнее
CUDA АЛЬМАНАХ / ЯНВАРЬ 2016 18
КОНТАКТЫ
Если вы хотите, чтобы ваша статья
появилась в следующем выпуске
CUDA Альманах пишите нам на:
Лидия Андреева
По вопросам приобретения NVIDIA GPU и
по прочим техническим
вопросам пишите нам на:
Антон Джораев