315
параллельной программе, моделирующей двумерное нестационарное
движение газа через пористый тепловыделяющий элемент.
Введение
Эффективность работы параллельной программы обычно
оценивается как отношение времени работы однопроцессорной версии
программы ко времени работы программы на многопроцессорной
системе, то есть как ускорение программы в зависимости от
количества используемых процессоров. Идеальным вариантом
является совпадение ускорения программы с количеством
процессоров. На практике же величина ускорения программы имеет
верхний предел, который объясняется
законом Амдала, то есть долей
последовательных операций в программе. На графике времени работы
программы этот эффект проявляется как предел, к которому стремится
время работы программы при увеличении количества процессоров.
Довольно часто этот предел наблюдается уже при количестве
используемых процессоров порядка 10, что заставляет задумываться
об альтернативных объяснениях этого явления, в частности
о степени
влияния синхронных взаимодействий на конечную
производительность программы.
В 2007 году в ИАПУ ДВО РАН была произведена адаптация
последовательной программы, реализующей численный метод
решения системы дифференциальных уравнений, к исполнению на
многопроцессорной вычислительной системе. При оценке
эффективности работы программы на многопроцессорном
вычислительном комплексе МВС15000 (42 узла по 2 процессора IBM
PowerPC 970+, объединённых сетью Myrinet), был получен
график
времени работы программы, после анализа которого были сделаны
выводы о необходимости перехода от синхронного взаимодействия
процессов к асинхронному. Далее в статье приводятся сравнительные
характеристики эффективности работы программы в зависимости от
типа взаимодействия.
Описание программы
Рассматриваемая в настоящей статье программа реализует
численное решение системы уравнений, моделирующих двумерное
нестационарное движение газа через пористый тепловыделяющий
элемент. Пропуская математическую модель, используемую в этой
программе [1,2], следует отметить некоторые особенности её
реализации. Входные и выходные данные хранятся в шести