6.2. Постановка задачи

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Омский государственный университет им. Ф.М. Достоевского

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

ЛекцияАПМ.doc

Скачиваний:

Добавлен:

12.02.2015

Размер:

422.4 Кб

Скачать

☆

<<< < Предыдущая 12 / 102 3 4 5 6 7 8 9 10 > Следующая >>>

6.2. Постановка задачи

В результате умножения матрицы Аразмерностиm × nи вектораb, состоящего изnэлементов, получается векторcразмераm, каждыйi-й элемент которого есть результат скалярного умноженияi-й строки матрицыА(обозначим эту строчкуa_i) и вектораb:

(6.4)

Тем самым получение результирующего вектора cпредполагает повторениеmоднотипных операций по умножению строк матрицыAи вектораb. Каждая такая операция включает умножение элементов строки матрицы и вектораb(nопераций) и последующее суммирование полученных произведений (n-1операций). Общее количество необходимых скалярных операций есть величина

T₁=m·(2n-1)

6.3. Последовательный алгоритм

Последовательный алгоритм умножения матрицы на вектор может быть представлен следующим образом.

Алгоритм 6.1. Последовательный алгоритм умножения матрицы на вектор

// Алгоритм 6.1

// Поcледовательный алгоритм умножения матрицы на вектор

for (i = 0; i < m; i++){

c[i] = 0;

for (j = 0; j < n; j++){

c[i] += A[i][j]*b[j]

}

Матрично-векторное умножение – это последовательность вычисления скалярных произведений. Поскольку каждое вычисление скалярного произведения векторов длины nтребует выполненияnопераций умножения иn-1операций сложения, его трудоемкость порядкаO(n). Для выполнения матрично-векторного умножения необходимо осуществитьmопераций вычисления скалярного произведения, таким образом, алгоритм имеет трудоемкость порядкаO(mn).

6.4. Разделение данных

При выполнении параллельных алгоритмов умножения матрицы на вектор, кроме матрицы А, необходимо разделить еще векторbи вектор результатаc. Элементы векторов можнопродублировать, то есть скопировать все элементы вектора на все процессоры, составляющие многопроцессорную вычислительную систему, или разделить между процессорами. Приблочномразбиении вектора изnэлементов каждый процессор обрабатывает непрерывную последовательность изkэлементов вектора (мы предполагаем, что размерность вектораnнацело делится на число процессоров, т.е.n= k·p).

Поясним, почему дублирование векторов bиcмежду процессорами является допустимым решением (далее для простоты изложения будем полагать, чтоm=n). Векторыbиссостоят изnэлементов, т.е. содержат столько же данных, сколько и одна строка или один столбец матрицы. Если процессор хранит строку или столбец матрицы и одиночные элементы векторовbис, то общее число сохраняемых элементов имеет порядокO(n). Если процессор хранит строку (столбец) матрицы и все элементы векторовbис, то общее число сохраняемых элементов также порядкаO(n). Таким образом, при дублировании и при разделении векторов требования к объему памяти из одного класса сложности.

6.5. Умножение матрицы на вектор при разделении данных по строкам

Рассмотрим в качестве первого примера организации параллельных матричных вычислений алгоритм умножения матрицы на вектор, основанный на представлении матрицы непрерывными наборами (горизонтальными полосами) строк. При таком способе разделения данных в качестве базовой подзадачи может быть выбрана операция скалярного умножения одной строки матрицы на вектор.

6.5.1. Выделение информационных зависимостей

Для выполнения базовой подзадачи скалярного произведения процессор должен содержать соответствующую строку матрицы Аи копию вектораb. После завершения вычислений каждая базовая подзадача определяет один из элементов вектора результатаc.

Для объединения результатов расчета и получения полного вектора c на каждом из процессоров вычислительной системы необходимо выполнить операцию обобщенного сбора данных (см. лекцию 4), в которой каждый процессор передает свой вычисленный элемент вектораcвсем остальным процессорам. Этот шаг можно выполнить, например, с использованием функцииMPI_Allgatherиз библиотекиMPI.

В общем виде схема информационного взаимодействия подзадач в ходе выполняемых вычислений показана на рис. 6.2.

Рис. 6.2. Организация вычислений при выполнении параллельного алгоритма умножения матрицы на вектор, основанного на разделении матрицы по строкам

<<< < Предыдущая 12 / 102 3 4 5 6 7 8 9 10 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
12.02.20156.59 Mб13Лекция_7.pdf
#
12.02.20155.82 Mб10Лекция_8.pdf
#
31.07.2019131.07 Кб2Лекция_8_I.doc
#
31.07.2019228.86 Кб3Лекция_9_10_I.doc
#
31.07.20191.47 Mб3Лекция_9_II_12_I.doc
#
12.02.2015422.4 Кб15ЛекцияАПМ.doc
#
28.09.201923.59 Кб4Лена.поступление.вопросы.docx
#
24.09.2019258.05 Кб7Ленинская концепция революции.doc
#
12.02.2015358.91 Кб72Линейное программирование111.rtf (2).doc
#
12.02.201570.14 Кб15Литература.doc
#
14.09.2019191.49 Кб10литра.doc

6.2. Постановка задачи

6.3. Последовательный алгоритм

6.4. Разделение данных

6.5. Умножение матрицы на вектор при разделении данных по строкам

6.5.1. Выделение информационных зависимостей