- 101 -
стою транспьютеров решетки во время сбора результатов. Разумнее
всего разрешать сбор информации очередного временного слоя толь-
ко после того, как полностью получены все данные, относящиеся к
предыдущему слою. Рассылать такое разрешение следует в синхрон-
ном режиме аналогично передаче признака конца итераций, чтобы
обеспечить одновременность его получения всеми процессорами сети.
При этом могут возникнуть сложности сбора результатов в наперед
заданные моменты времени, однако они легко преодолимы.
Дадим приближенную оценку относительной эффективности
предлагаемого алгоритма, по сравнению с традиционным:
T
1
= K (2R T
link
+T
calc
),
T
2
= (K + D) T
calc
,
где T
link
- время, необходимое для передачи признака окончания итера-
ций между соседними процессорами; T
calc
- время, необходимое для
расчета одной итерации в пределах одного транспьютера; K - число
итераций, необходимых для получения решения с заданной точно-
стью; R - радиус графа, объединяющего транспьютеры; D - диаметр
этого графа; T
1
, T
2
- время, необходимое для получения решения на
очередном временном слое по первому способу и при использовании
децентрализованного алгоритма, соответственно. Предлагаемый под-
ход эффективен при T
2
< T
1
, что справедливо при
K
D
R
T
T
calc
link
>
2
.
При T
link
~ T
calc
, можно утверждать, что при K > D/2RL, где L -
число точек, приходящихся на один процессор, использование децен-
трализованного алгоритма предпочтительнее. В общем случае спра-
ведливо соотношение D/2R<1, поэтому можно считать, что предла-
гаемый алгоритм эффективен при K>L.
Для 32 транспьютеров, объединенных в решетку 4х8 (рис. 28,
только связи, показанные сплошными линиями), R=6, D=10. При за-
мыкании решетки, например в тор, эти числа можно уменьшить. На
рис. 28 (все связи) показан пример топологии, для которой D=R=4.
Аналогичные графы можно построить для решеток 4х4 (D=R=3), 8х8
(D=R=6, рис. 29) и т.д.
Для дальнейшего анализа предложенного алгоритма распреде-
ленного управления остановимся на вопросах определения ускорения
при решении уравнения Лапласа с помощью итерационного алгоритма
на параллельной вычислительной системе с распределенной памятью.
Будем говорить, что задача имеет размер L, если L - число расчетных
точек, покрывающих область, в которой ищется решение.
С учетом изложенного можно приближенно оценить время ре-
шения задачи при использовании различных алгоритмов управления:
TKL
c
0
=
τ
;