41
Таблица 3.1. Ускорение работы программы в зависимости от доли
непараллельного кода.
Число
процессоров
Доля последовательных вычислений %
50 25 10 5 2
Ускорение работы программы
2 1.33 1.60 1.82 1.90 1.96
4 1.60 2.28 3.07 3.48 3.77
8 1.78 2.91 4.71 5.93 7.02
16 1.88 3.36 6.40 9.14 12.31
32 1.94 3.66 7.80 12.55 19.75
512 1.99 3.97 9.83 19.28 45.63
2048 2.00 3.99 9.96 19.82 48.83
Из таблицы хорошо видно, что если, например, доля
последовательного кода составляет 2%, то более чем 50-кратное ускорение
в принципе получить невозможно. С другой стороны, по-видимому,
нецелесообразно запускать такую программу на 2048 процессорах с тем,
чтобы получить 49-кратное ускорение. Тем не менее, такая задача
достаточно эффективно будет выполняться на 16 процессорах, а в
некоторых случаях потеря 37% производительности при выполнении
задачи на 32 процессорах может быть вполне приемлемой. В некотором
смысле, закон Амдала устанавливает предельное число процессоров, на
котором программа будет выполняться с приемлемой эффективностью в
зависимости от доли непараллельного кода. Заметим, что эта формула не
учитывает накладные расходы на обмены между процессорами, поэтому в
реальной жизни ситуация может быть еще хуже.
Не следует забывать, что распараллеливание программы – это лишь
одно из средств ускорения ее работы. Не меньший эффект, а иногда и
больший, может дать оптимизация однопроцессорной программы.
Чрезвычайную актуальность эта проблема приобрела в последнее время
из-за большого разрыва в скорости работы кэш-памяти и основной памяти.
К сожалению, зачастую этой проблеме не уделяется должного внимания.
Это приводит к тому, что тратятся значительные усилия на