Решение прикладных задач в системе параллельного программирования Аспект | Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2018. № 45. DOI: 10.17223/19988605/45/7

Решение прикладных задач в системе параллельного программирования Аспект

Экспериментальная система параллельного программирования Аспект предназначена для исследования новых форм представления алгоритмов и методов задания управления в параллельных программах. В статье кратко рассмотрены архитектура системы Аспект, особенности языка программирования Аспект, результаты применения системы Аспект для решения задач разложения матрицы, статистического моделирования методом Монте-Карло и моделирования методом «частицы-в-ячейках».

Solution of applied problems in the parallel programming system aspect.pdf Современные суперкомпьютеры имеют сложную архитектуру. Они состоят из огромного количества вычислительных узлов, на каждом из которых есть несколько процессоров, каждый процессор содержит несколько ядер. Активно внедряются гибридные системы, где в дополнение к основным процессорам используются графические ускорители, специализированные вычислители типа Cell B.E., Matrix2000 или Intel Xeon Phi, вычислители на базе ASIC и PLD. Стремительный прогресс в использовании параллелизма аппаратной частью привел к большому разрыву между пред оставляемыми ресурсами и возможностями по их эффективному использованию с помощью имеющихся средств разработки. Для преодоления этого разрыва в России и за рубежом ведутся активные исследования по созданию средств параллельного программирования высокого уровня. К наиболее известным российским проектам можно отнести систему OpenTS [1] (Институт программных систем им. А.К. Айламазяна РАН), системы DVM [2] и НОРМА [3] (Институт прикладной математики им. М.В. Келдыша), язык mpC [4] (Институт системного программирования им. В.П. Иванникова), систему SFP [5] (Институт систем информатики им. А.П. Ершова), язык Пифагор [6] (Сибирский федеральный университет), систему ДВОР [7] (Южный федеральный университет), комплекс для параллельного программирования Graphplus templet [8] (Самарский государственный аэрокосмический университет). Результаты этих исследований показывают, что создание универсальной системы параллельного программирования высокого уровня трудно достижимо - слишком высока специфика отдельных предметных областей. Поэтому требуется дальнейшее изучение специализированных способов представления алгоритмов. В статье представлены результаты исследований решения ряда прикладных задач в системе параллельного программирования Аспект. Аспект - это экспериментальная система, разрабатываемая в Институте вычислительной математики и математической геофизики СО РАН и предназначенная для исследования новых форм представления алгоритмов и методов задания управления в параллельной программе. В статье кратко рассмотрены архитектура системы Аспект, особенности языка программирования Аспект, результаты применения системы Аспект для решения задачи LU-разложения матриц, задачи оценки математических ожиданий аддитивных функционалов от траекторий диффузионных процессов и задачи о взаимодействии короткого лазерного импульса с плазмой методом «частицы-в-ячейках». 1. Система параллельного программирования Аспект В основе системы параллельного программирования Аспект [9] лежат асинхронная модель вычислений с управлением на основе строгого частичного порядка [10] и фрагментированное программирование [11] как способ разработки параллельных программ. Архитектурно система Аспект состоит из транслятора с языка Аспект и исполнительной подсистемы. Суть фрагментированного программирования заключается в представлении алгоритма решения задачи в виде множества фрагментов данных и множества фрагментов кода. Фрагмент кода получает на вход набор входных фрагментов данных, на основе которых вычисляет набор выходных фрагментов данных. Подстановка фрагментов данных в качестве параметров фрагмента кода называется применением фрагмента кода к фрагментам данных (один и тот же фрагмент кода может применяться к различным фрагментам данных). Совокупность фрагмента кода и его входных и выходных фрагментов данных называется фрагментом вычислений. На множестве фрагментов вычислений задается частичный порядок, т.е. множество ограничений на порядок выполнения фрагментов (управление). Для реализации фрагментированного программирования на практике разработан язык управления вычислениями Аспект [12]. В нем фрагменты кода и фрагменты данных записываются на существующем процедурном языке программирования (в настоящее время поддерживается только С++), а фрагменты вычислений и частичный порядок их исполнения задаются средствами языка Аспект. Фрагменты вычислений, для которых зависимости явно не заданы, рассматриваются как независимые. Подробная информация о способах задания управления в языке Аспект приведена в [13]. Фрагментированная программа преобразуется транслятором языка Аспект в код на языке С++ и включается в одноименный класс, который предоставляет интерфейс для добавления фрагментов вычислений в очередь исполнения, а также осуществляет учет необходимых параметров (количество исполняемых фрагментов, количество готовых к исполнению фрагментов и др.). Для каждого фрагмента данных создается отдельный тип, с использованием которого объявляются данные задачи (переменные класса). Для каждого фрагмента кода генерируется метод класса, а также две переменных: признак завершения и переменная синхронизации. Исполнительная подсистема Аспект состоит из набора функциональных модулей: менеджер потоков (управляет распределением работы между процессорами (ядрами); обращается за очередной порцией работы к планировщику), менеджер памяти (управляет распределением памяти в системе, осуществляет ее выделение / освобождение для очередей и фрагментированных программ), планировщик (управляет набором приоритизированных очередей, реализованных в виде мониторов; имеет сложность планирования 0(1)). 2. Разложение матриц На примере задачи разложение квадратной матрицы A в произведение матриц L и U (LU-разло-жения) рассмотрим применение фрагментированного программирования для решения численных задач. Постановка задачи. Пусть имеется матрица A = (ay), i = 1...N, j = 1...N. Ее разложение в виде A = LU, где L = (lj) - нижняя треугольная матрица, а U = (%) - верхняя треугольная матрица с единицами на главной диагонали, может быть вычислено по формулам [14]: lj = a -Z См*(i ^ j) (1) Uj = f (a-Z ), (i < j). (2) Фрагментация алгоритма. Матрица A собирается из фрагментов данных (подматриц) A[i][j]. Выделяются четыре фрагмента кода F1, F2, F3 и F4. Первый фрагмент кода обрабатывает фрагменты данных, расположенные на главной диагонали матрицы A, по формулам (1) и (2); второй - фрагменты данных справа от диагональных элементов по формуле (1); третий - фрагменты данных под диагональными элементами по формуле (2); четвертый пересчитывает внутреннюю матрицу по формуле (3): е.. = a. - > l., ij j / i ik k Вычисления организуются по шагам. Первый шаг показан на рис. 1. Квадраты отображают фрагменты данных. Внутри каждого квадрата указано, какой экземпляр фрагмента вычислений его обрабатывает. Стрелками отображены зависимости между экземплярами фрагментов вычислений, а цифра в центре показывает порядок исполнения экземпляров. Первым запускается на исполнение экземпляр фрагмента вычислений G1[0] (применение фрагмента кода F1 к фрагменту данных A[0][0]), после чего параллельно могут исполняться экземпляры G2[0][1], G2[0][2], G3[1][0] и G3[2][0]. Любой из экземпляров с порядком исполнения 3 может начать исполнение, как только завершатся оба экземпляра, от которых он зависит. Например, G4[0][1][2] может начать исполнение после завершения G3[1][0] и G2[0][2]. Рис. 1. Первый шаг вычисления LU-разложения матрицы A Более подробно решение задачи LU-разложения матрицы разбирается в [11]. Текст программы LU-разложения матрицы на языке программирования Аспект можно найти в [13]. Результаты эксперимента. В качестве примера рассмотрим решение задачи о LU-разложении вещественной матрицы размера 5 040 х 5 040 при размере фрагмента данных 90 х 90 на системе HP ProLiant DL580 G5 (4 процессора Intel Xeon X7350, 16 ядер, 256 Гбайт RAM). Результаты представлены в табл. 1. Таблица 1 Результаты измерений производительности программы решения задачи о LU-разложении Характеристика Количество ядер 1 2 4 8 16 Время счета, с 31,01 15,6 7,93 4,13 2,35 Ускорение 1 1,99 3,91 7,51 13,2 Аспект-программа демонстрирует практически линейное ускорение, что объясняется фрагмен-тированным представлением алгоритма, за счет которого достигается более эффективное использование кэш-памяти. По этой же причине фрагментированный код лучше масштабируется. 3. Метод Монте-Карло Статистическое моделирование является одним из численных методов решения математических задач, при котором искомые величины представляются вероятностными характеристиками какого-либо явления и приближенно определяются путем наблюдения за поведением модели этого явления [15]. Задачи статистического моделирования, как правило, требуют больших вычислительных ресурсов, поскольку в среднем выборочное значение может долго вычисляться и / или из соображений точности необходимо моделировать большое число выборочных реализаций. (3) Рассмотрим задачу оценки математических ожиданий аддитивных функционалов от траекторий диффузионных процессов, представляющих собой интегралы по некоторым малым областям расширенного фазового пространства от концентрации траекторий7 [16]. На ее примере можно проследить, как в системе Аспект реализуются алгоритмы, которые можно фрагментировать на большое число независимых фрагментов вычислений. Постановка задачи. Пусть трехмерный диффузионный процесс y() задан системой стохастических дифференциальных уравнений в смысле Ито: dy(t) = a(y(t))dt + b(y(t))dw(t), 0 < t < T , у(0) = Уо, (4) где a(y) - трехмерная векторная функция, b(y) - матричная функция размерности 3 х 3, w(t) - трехмерный винеровский процесс, yo - случайный вектор. Моделирование траекторий системы (4) выполняется с помощью метода Эйлера: У+i = У +■Aa(y) + VAtb(y%, i = 0, 1, ..., n, где yi - численное решение системы (4) в узле ti равномерной сетки с постоянным шагом At = Т/ n, а {$■} - последовательность независимых между собой нормальных случайных векторов с независимыми в совокупности компонентами, имеющими стандартное нормальное распределение. Пусть необходимо вычислить полную концентрацию диффузионных траекторий Ф(Т, yc) во временном интервале [0, Т] в некоторой удаленной от источника точке yc. При переходе к приближенной оценке точные диффузионные траектории заменим приближенными траекториями Эйлера, а точку yc -шаром Qc малого радиуса Гс с центром в точке yc. Тогда будем иметь следующую статистическую оценку: n Ф(Т,у) - E£d = у)A , i=0 где ю(у) = iQc(y)IVc, Vc - объем шара Qc. Фрагментация алгоритма. Разобьем всё пространство моделируемых траекторий на m областей. Тогда входные фрагменты данных - это начальные значения генератора случайных чисел в каждой области, выходные фрагменты данных - значение концентрации в каждой области. Фрагментов кода необходимо два: первый вычисляет концентрацию в интервале jm, (j + 1)m - 1] (здесь j - номер части пространства моделирования), а второй осуществляет сложение всех концентраций, полученных на каждой области пространства моделирования, и вычисление окончательного результата. Фрагменты вычислений получаются применением фрагмента кода первого типа к каждому входному фрагменту данных. Так как моделируемые реализации не зависят друг от друга, потоковое управление между этими фрагментами вычислений отсутствует. Все фрагменты вычислений первого типа должны выполниться до начала исполнения фрагмента вычисления второго типа. Результаты эксперимента. В качестве примера рассмотрим систему (4) на временном интервале [0, 10] с постоянным вектором сноса a = (0, 0,5, 0,5)T, единичной матрицей диффузии b = I, шаром Qc радиуса rc = 0,1 с центром в точке yc = (8, 0, 0) и нулевым начальным условием yo = 0 [17]. Для метода Эйлера положим At = 10-2. Таблица 2 Результаты измерений производительности программы оценки математических ожиданий аддитивных функционалов от траекторий диффузных процессов методом Монте-Карло Характеристика Количество ядер 1 2 4 8 16 Время счета, c 23 805,50 12 051,00 5 939,00 2 990,00 1 510,68 Ускорение 1 1,97 4 7,96 15,75 Результаты измерений на системе HP ProLiant DL580 G5 для 64 000 000 смоделированных траекторий приведены в табл. 2. Видно, что ускорение практически линейное, что достигается за счет независимого расчета концентрации в каждом интервале, а также хорошей локальности данных, используемых в ходе расчета. Эта задача, тривиальная с точки зрения распараллеливания, тем не менее показывает, что сама система программирования Аспект не вносит существенных задержек и не требует существенных накладных расходов на исполнение фрагментов. 4. Метод частицы-в-ячейках Методы частиц, как и конечно-разностные методы, образуют особую группу вычислительных алгоритмов, объединенных способом дискретизации исходной математической задачи [18]. Их применение широко распространено для решения сложных физических задач (например, задач физики бес-столкновительной плазмы). Вычислительная сложность метода объясняется огромным количеством частиц, необходимых для получения результатов с хорошей точностью. Рассмотрим решение задачи о взаимодействии короткого лазерного импульса с плазмой методом «частицы-в-ячейках»8 [19]. Она позволяет оценить применение системы Аспект для решения достаточно сложной задачи численного моделирования, включающей в себя несколько различных алгоритмов. Постановка задачи. В области, имеющей форму параллелепипеда, находится фольга, представляемая тонким слоем плазмы. Плазма состоит из электронов и ионов одного типа. Лазерный импульс (в виде пакета электромагнитных волн различной амплитуды и поляризации) входит через поверхность параллелепипеда, взаимодействует с фольгой, частично отражаясь и проходя через нее. Описываемый физический процесс представляется уравнениями Власова для ионов и электронов: которые дополняются уравнениями Максвелла для электрического и магнитного полей: - 471-Г 1

Скачать электронную версию публикации

Загружен, раз: 205

Ключевые слова

система параллельного программирования Аспект, фрагментированное программирование, представление алгоритмов с высокой степенью непроцедурности, parallel programming system Aspect, technology of fragmented programming, representation of algorithms with high degree of nonprocedurality

Авторы

ФИО	Организация	Дополнительно	E-mail
Арыков Сергей Борисович	Институт вычислительной математики и математической геофизики СО РАН; Новосибирский государственный технический университет	кандидат физико-математических наук, младший научный сотрудник лаборатории синтеза параллельных программ; доцент кафедры параллельных вычислительных технологий	arykov@sscc.ru

Всего: 1

Ссылки

Абрамов С.М., Кузнецов А.А., Роганов В.А. Кроссплатформенная версия T-системы с открытой архитектурой // Вычисли тельные методы и программирование. 2007. Т. 8, № 1. С. 175-180.

Бахтин В.А., Клинов М.С., Крюков В.А., Поддерюгина Н.В., Притула М.Н., Сазанов Ю.Л. Расширение DVM-модели па раллельного программирования для кластеров с гетерогенными узлами // Вестник Южно-Уральского государственного университета. Сер. Математическое моделирование и программирование. 2012. № 18, вып. 12. С. 82-92.

Андрианов А.Н., Бугеря А.Б., Ефимкин К.Н., Колударов П.И. Модульная архитектура компилятора языка Норма+ // Пре принты ИПМ им. М. В. Келдыша. 2011. № 064. 16 с.

Lastovetsky A. Adaptive parallel computing on heterogeneous networks with mpC // Parallel Computing. 2002. V. 28, No. 10. P. 1369-1407.

Kasyanov V.N., Stasenko A.P. A functional programming system SFP: Sisal 3.1 language structures decomposition // LNCS. 2007. V. 4671. P. 62-73.

Легалов А.И. Функциональный язык для создания архитектурно--независимых параллельных программ // Вычислительные технологии. 2005. Т. 10, № 1. С. 71-89.

Штейнберг Б.Я., Абрамов А.А., Алымова Е.В., Баглий А.П., Гуда С.А., Дубров Д.В., Кравченко Е.Н., Морылев Р.И., Нис З.Я., Петренко В.В., Полуян С.В., Скиба И.С., Шаповалов В.Н., Штейнберг О.Б., Штейнберг Р.Б., Юрушкин М. Диалоговый высокоуровневый автоматический распараллеливатель (ДВОР) // Труды Всероссийской суперкомпьютерной конференции «Научный сервис в сети Интернет» (Новороссийск, 20-26 сентября 2010 г.). М. : Изд-во МГУ, 2010. С. 7175.

Востокин С.В., Литвинов В.Г., Хайрутдинов А.Р. Применение комплекса параллельного программирования Graphplus tem plet в моделировании // Программные продукты и системы. 2012. № 3. С. 14-18.

Arykov S.B., Malyshkin V.E. Asynchronous Language and System of Numerical Algorithms Fragmented Programming // LNCS. 2009. Vol. 5698. P. 1-7.

Арыков С.Б. Асинхронная модель вычислений над общей памятью // Вестник УГАТУ. 2016. Т. 20. № 3. С. 114-121.

Арыков С.Б. Фрагментированное программирование численных задач // Сборник научных статей VII Международной научно-практической конференции «Многоядерные процессоры, параллельное программирование, ПЛИС, системы обработки сигналов» (Барнаул, 10-11 марта 2017 г.). Барнаул : Изд-во Алт. ун-та, 2017. С. 20-24.

Арыков С.Б. Асинхронное программирование численных задач // Параллельные вычислительные технологии (ПаВТ'2010) : труды международной научной конференции (Уфа, 29 марта - 2 апреля 2010 г.). Челябинск : Изд. центр ЮУрГУ, 2010. С. 28-39.

Arykov S. Defining Order of Execution in Aspect Programming Language // LNCS. 2017. V. 10421. P. 265-271.

Фаддеев Д.К., Фаддеева В.Н. Вычислительные методы линейной алгебры. 2-е изд. М. : Наука, 1963. 656 с.

Михайлов Г.А., Войтишек А.В. Численное статистическое моделирование. Методы Монте-Карло. М. : Академия, 2006. 368 с.

Марченко М.А., Михайлов Г.А. Весовые алгоритмы статистического моделирования диффузионных процессов // Журнал вычислительной математики и математической физики. 2003. Т. 43, № 4. С. 571-584.

Марченко М.А. Комплекс программ MONC для распределенных вычислений методом Монте-Карло // Сибирский журнал вычислительной математики. 2004. Т. 7, № 1. С. 43-55.

Григорьев Ю.Н., Вшивков В.А., Федорук М.П. Численное моделирование методами частиц-в-ячейках. Новосибирск : Изд-во СО РАН, 2004. 360 с.

Вшивков В.А., Вшивков К.В., Дудникова Г.И. Алгоритмы решения задачи взаимодействия лазерного импульса с плазмой // Вычислительные технологии. 2001. Т. 6, № 2. С. 47-63.