Препринты ИПМ им. М.В. Келдыша. 2013. № 16. 20 с.
Алгоритм решения сеточных уравнений явной разностной схемы для
уравнений Максвелла сформулирован в векторизованном виде.
Вычислительный модуль составлен на основе технологий Cuda и OpenMP
с оптимизацией доступа к памяти графической платы. Векторизуемые
операции выполняются на графических процессорах. Операции, которые
требуют случайного доступа к памяти, выполняются центральным
процессором в многопоточном режиме. Использование графических плат
в узлах кластера обеспечило ускорение вычислений по сравнению с
традиционной параллельной архитектурой. Вычисление ускорено в 11
раз для задач с малым объемом оперативной памяти и в 2-3 раза для
остальных задач.
Введение
Постановка задачи
Организация вычислений при гибридном распараллеливании
Хранение данных в памяти центрального процессора
Вычисления на графическом процессоре
Хранение данных в памяти видеокарты
Особенности реализации вычислений на видеокарте
Заключение
Список использованных источников
Постановка задачи
Организация вычислений при гибридном распараллеливании
Хранение данных в памяти центрального процессора
Вычисления на графическом процессоре
Хранение данных в памяти видеокарты
Особенности реализации вычислений на видеокарте
Заключение
Список использованных источников