- •Тема 10 Современное развитие микропроцессорной техники
- •1. Архитектуры risc, cisc, vliw, misc, epic
- •1.1. АрхитектураRisc
- •1.2. Архитектура cisc
- •1.3. Архитектура misc
- •1.4. Архитектура vliw
- •1.5. Архитектура epic
- •2. Архитектура risc-микропроцессоров 3-го поколения
- •2.1. Структура процессоров Alpha: 21064, 21264
- •2.2. Сравнительные характеристики Alpha 21164 и 21264
- •2.3. Процессоры pa-risc компании Hewlett-Packard
- •2.4. Области применения risc-процессоров
- •3. Архитектура ia-64. Мп Intel® Itanium® 2
- •4. Архитектура amd-64. Мп amd® Athlon® 64
- •4.1. Регистры
- •4.2. Адресация
- •4.3. Вычисления
- •4.4. Совместимость
- •5. Архитектура e2k. Мп Эльбрус-2000
2.3. Процессоры pa-risc компании Hewlett-Packard
Процессор PA-8000 вобрал в себя все известные методы ускорения выполнения команд. В его основе лежит концепция "интеллектуального выполнения", которая базируется на принципе внеочередного выполнения команд. Это свойство позволяет PA-8000 достигать пиковой производительности благодаря широкому использованию механизмов автоматического разрешения конфликтов по данным и управлению аппаратными средствами. Эти средства хорошо дополняют другие архитектурные компоненты, заложенные в структуру кристалла: большое число исполнительных функциональных устройств, средства прогнозирования направления переходов и выполнения команд по предположению, оптимизированная организация кэш-памяти и высокопроизводительный шинный интерфейс.
Высокая производительность PA-8000 во многом определяется наличием большого набора функциональных устройств. В состав PA-8000 входят 10 исполнительных устройств: два арифметико-логических устройства (АЛУ) для выполнения целочисленных операций, два устройства для выполнения операций сдвига/слияния данных, два устройства для выполнения умножения/сложения чисел с плавающей точкой, два устройства деления/вычисления квадратного корня и два устройства выполнения операций загрузки/записи.
Средства внеочередного выполнения команд процессора PA-8000 обеспечивают аппаратное планирование загрузки конвейеров и лучшее использование функциональных устройств. В каждом такте на выполнение могут выдаваться до четырех команд, которые поступают в 56-строчный буфер переупорядочивания. Этот буфер позволяет поддерживать постоянную занятость функциональных устройств и обеспечивает эффективную минимизацию конфликтов по ресурсам.
Кристалл может анализировать все 56 командных строк одновременно и выдавать в каждом такте по 4 готовых для выполнения команды в функциональные устройства. Это позволяет процессору автоматически выявлять параллелизм уровня выполнения команд.
Суперскалярный процессор PA-8000 обеспечивает полный набор средств выполнения 64-битовых операций, включая адресную арифметику, а также арифметику с фиксированной и плавающей точкой. При этом кристалл полностью сохраняет совместимость с 32-битовыми приложениями и с предыдущими и будущими реализациями PA-RISC. Это первый процессор, в котором реализована 64-битовая архитектура PA-RISC.
2.4. Области применения risc-процессоров
Современные RISC-процессоры находят применение как:
рабочие станции высшего ценового класса (12-15 тысяч долларов). Работают под ОС VMS, Unix;
персональные рабочие станции (3-7 тыс. $). ОС: Windows NT, Solaris;
серверы;
RISC ПК.
3. Архитектура ia-64. Мп Intel® Itanium® 2
Процессор Intel® Itanium® 2 является 64-битным. Это позволяет поднять производительность за счет обработки данных 64-разрядного формата. Кроме того, архитектура IA-64 позволяет преодолеть одну из главных трудностей современных 32-разрядных процессоров — непосредственную адресацию только 4 Гб. Процессор Intel® Itanium® 2 может напрямую работать с 16 Тб оперативной памяти (64-битная виртуальная адресация, 50 бит физической адресации).
Инструкции, обрабатываемые шестью параллельными конвейерами глубиной 8 команд, непосредственно выполняются в 23 функциональных блоках.
Исполняющие модули Intel® Itanium® 2:
6 целочисленных модулей;
2 модуля для вычислений с плавающей точкой;
2 модуля для вычислений с плавающей точкой двойной точности;
6 модулей для обработки мультимедийных команд;
4 модуля, управляющих загрузкой и выгрузкой данных;
3 модуля ветвлений.
Количество соответствующих модулей оптимально подобрано с учетом потребности в вычислительных ресурсах приложений, характерных для корпоративных СУБД, сложных инженерных расчетов и др. При этом команды практически не "задерживаются" в ожидании, пока освободится нужный исполняющий модуль. Ширина системной шины, по которой осуществляется взаимодействие нескольких процессоров друг с другом и доступ к памяти, увеличена до 128 бит, что также кардинально сказывается на скорости работы.
Число регистров, в которых размещаются данные для непосредственной обработки их процессором, свыше трехсот. Большое их количество позволяет избежать дефицита регистров при параллельной обработке многих команд. Кроме того, в процессоре Intel® Itanium® 2 реализованы такие механизмы повышения эффективности работы, как стек и переименование регистров.
Регистры Intel® Itanium® 2:
128 регистров общего назначения;
128 регистров с плавающей запятой;
64 регистра предикатов;
8 регистров перехода.
Кэш — быстродействующая внутренняя память процессора — используется для динамического хранения кода и данных, задействованных в вычислениях в текущий момент. Загрузка часто используемых данных и фрагментов кода в кэш позволяет существенно поднять производительность. Доступ к кэшу в несколько раз быстрее, чем к "медленной" оперативной памяти, и составляет 48 Гб/с.
Объем кэш-памяти третьего уровня процессора Intel® Itanium® 2 достигает 6 Мб. Архитектура Itanium включает такие уникальные средства повышения надежности, как система расширенного самоконтроля EMCA (Enhanced Machine Check Architecture), обеспечивающая обнаружение, коррекцию и протоколирование ошибок, а также поддержку обработки кода ECC (Error Correcting Code) и контроля четности.
Таблица 3.1. Характеристики процессора Intel® Itanium® 2
Микроархитектура |
IA-64 |
Частота |
до 1,6 ГГц |
Кэш |
до 6 Мб |
Скорость доступа к кэшу |
до 48 Гб/с |
Адресуемое пространство |
16 Тб |
Ширина системной шины |
128 бит |
Частота системной шины |
2х200 МГц |
Число конвейеров |
6 |
Глубина конвейера |
8 |
Число исполняющих блоков |
23 |
Число регистров |
более 300 |
Технология изготовления |
0,13 мкм |
Пиковая производительность |
10 Гфлопс |