Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
АВС Лекция 9.doc
Скачиваний:
78
Добавлен:
25.03.2015
Размер:
320 Кб
Скачать

Лекция 9.

Тема. Вычислительные системы с систолической структурой.

План лекции.

  1. Понятие систолической структуры и ее особенности.

  2. Классификация систолических структур.

  3. Топология систолических структур.

  4. Структура процессорных элементов.

  5. Вычислительные системы с обработкой по принципу волнового фронта.

1. Понятие систолической структуры и ее особенности

В фон-неймановских машинах данные, считанные из памяти, однократно обрабатываются в процессорном элементе, после чего снова возвращаются в па-мять (рис. 9.1, а). Авторы идеи систолической матрицы Кунг и Лейзерсон пред-ложили организовать вычисления так, чтобы данные на своем пути от считывания из памяти до возвращения обратно пропускались через как можно большее число ПЭ (рис. 9.1, б).

Рис. 9.1. Обработка данных в ВС: а – фон-неймановского типа;

б – систолической структуры

Если сравнить положение памяти в ВС со структурой живого организма, то по аналогии ей можно отвести роль сердца, множеству ПЭ – роль тканей, а поток данных рассматривать как циркулирующую кровь. Отсюда и происходит назва- ние систолическая матрица (систола сокращение предсердий и желудочков сердца, при котором кровь нагнетается в артерии). Систолические структуры эф-фективны при выполнении матричных вычислений, обработке сигналов, сорти- ровке данных и т.д. В качестве примера авторами идеи был предложен линей- ный массив для алгоритма матричного умножения, показанный на рис. 9.2.

В основе схемы лежит ритмическое прохождение двух потоков данных xi и yi навстречу друг другу. Последовательные элементы каждого потока разделе- ны одним тактовым периодом, чтобы любой из них мог встретиться с любым элементом встречного потока. Если бы они следовали в каждом периоде, то эле-мент xi никогда бы не встретился с элементами yi+1, yi+3, … Вычисления выпол- няются параллельно в процессорных элементах, каждый из которых реализует один шаг в операции вычисления скалярного произведения (IPS, Inner Product Step) и носит название IPS-элемента (рис. 9.3).

Рис. 9.2. Процесс векторного умножения матриц (n = 4)

Рис. 9.3. Функциональная схема IPS-элемента

Значение yвх, поступающее на вход ПЭ, суммируется с произведением вход-ных значений xвх и aвх. Результат выходит из ПЭ как yвых. Значение xвх для воз-можного последующего использования остальной частью массива транслируется через ПЭ без изменений и покидает его в виде xвых.

Систолическая структура – это однородная вычислительная среда из про-цессорных элементов, совмещающая в себе свойства конвейерной и матричной обработки и обладающая следующими особенностями:

  • вычислительный процесс в систолических структурах представляет собой непрерывную и регулярную передачу данных от одного ПЭ к другому без запоминания промежуточных результатов вычисления;

  • каждый элемент входных данных выбирается из памяти однократно и ис-пользуется столько раз, сколько необходимо по алгоритму, ввод данных осуществляется в крайние ПЭ матрицы;

  • образующие систолическую структуру ПЭ однотипны и каждый из них мо-жет быть менее универсальным, чем процессоры обычных многопроцессор-ных систем;

  • потоки данных и управляющих сигналов обладают регулярностью, что поз-воляет объединять ПЭ локальными связями минимальной длины;

  • алгоритмы функционирования позволяют совместить параллелизм с конвей-ерной обработкой данных;

  • производительность матрицы можно улучшить за счет добавления в нее определенного числа ПЭ, причем коэффициент повышения производитель-ности при этом линеен.

В настоящее время достигнута производительность систолических процес-соров порядка 1000 млрд. операций в секунду.