Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Доп_материалы_Вычислительные_системы.doc
Скачиваний:
21
Добавлен:
23.08.2019
Размер:
3.82 Mб
Скачать

Второе поколение процессоров Core (Penryn)

Изготавливаются по новому техпроцессу- 45 нм. Сохраняется процессорный разъём Socket 775. Компания Intel производит две разновидности процессоров Penryn- c процессорным ядром Yorkfield (4-ядерное) и Wolfdale (2-ядерное). Они не значительно отличаются от архитектуры Core 2 Duo/Extreme. Двухъядерные Wolfdale состоят из 410 млн.тр-ров, а 4-ядерные Yorkfield- из 820 млн (для сравнения, у Core 2 Duo первого поколения имеется 298 млн. транзисторов). Микропроцессоры Penryn имеют кэш L1=32 Кбайт у каждого ядра, кэш L2 имеет объём 6 Мбайт у Wolfdale, 12 Мбайт- у Yorkfield.

В сравнении с прочими представителями семейства Core 2 Quad Q9ххх младшая модель Core 2 Quad Q9300 имеет особенность – урезанный кэш второго уровня. Вместо 6 Мбайт на каждые два ядра Core 2 Quad Q9300 имеет L2 кэш объёмом 6 Мбайт суммарно (в каждом из двух входящих в этот CPU двухъядерных кристаллов кэш второго уровня сокращён вдвое – до 3 Мбайт). Модельный ряд процессоров Penryn представлен ниже в таблице.

Наименование

Ядро

Кол-во ядер

Частота ядра, ГГц

Частота FSB, МГц

Кэш L2, Мбайт

Core 2 Extreme QX9770

Yorkfield

4

3.2

1600

12

Core 2 Extreme QX9650

Yorkfield

4

3.0

1333

12

Core 2 Quad Q9550

Yorkfield

4

2.83

1333

12

Core 2 Quad Q9450

Yorkfield

4

2.66

1333

12

Core 2 Quad Q9300

Yorkfield

4

2.5

1333

6

Core 2 Duo E8500

Wolfdale

2

3.16

1333

6

Core 2 Duo E8400

Wolfdale

2

3.0

1333

6

Core 2 Duo E8300

Wolfdale

2

2.83

1333

6

Core 2 Duo E8200

Wolfdale

2

2.66

1333

6

Core 2 Duo E8190

Wolfdale

2

2.66

1333

6

Примечание: у модели Core 2 Duo E8190 отключена поддержка виртуализации.

 

Технологические новшества, применяемые в микропроцессорах Penryn

Cущественно ускорены операции деления. Модифицированный блок деления получил название Fast Raxid-16 (у семейства Core аналогичный блок назывался Radix-4). В результате за один проход новый блок обрабатывает 4 бита вместо 2-х. Программисты традиционно избегают операции деления, как относительно медленные, заменяя их операциями умножения. То же самое делают различные компиляторы. В любом случае, ускорение операции деления повышает общую производительность процессора.

Семейство процессоров Penryn поддерживают новый набор дополнительных инструкций SSE4.1 (47 новых инструкций), нацеленных на повышение производительности при работе с мультимедийными приложениями. Это могут быть задачи видео и аудио, научные задачи и 3-мерная графика.

Наибольшие изменения произошли в блоке перестановок, который осуществляет битовые перестановки в 128-битных регистрах. Теперь такие операции, как упаковка, распаковка, сдвиг упакованных значений, вставка выполняются в соответствующем регистре всего за один такт. Блок перестановок получил название Shuffle Engine, его использование даёт почти 2-кратный прирост производительности при исполнении потоковых инструкций. Кэш у Penryn стал медленнее, чем у Conroe, но этот недостаток частично компенсирован функцией Split Load Cache Enhancement.

В Penryn, в отличии от Conroe, в качестве подзатворного диэлектрика использует не двуокись кремния, а диэлектрики с большой диэлектрической постоянной (high-k). Это позволяет избавиться от затворов их поликристаллического кремния и использовать металлический. Это шаг позволяет увеличить скорость переключения транзистора на 20%. Соответственно увеличивается производительность транзисторов, более чем в 5 раз уменьшается утечка тока от истока к стоку, т.е. снижается энергопотребление транзистора. Материал, используемый в качестве high-k диэлектрика, содержит гафний. Больше о нём ничего не известно. Толщина слоя подзатворного диэлектрика сохраняется прежней- 1.2 нм.

Penryn лучше предшественников не только за счёт архитектурных усовершенствований,  но и за счёт 45-нм техпроцесса. Стало меньше напряжение ядра, уменьшилось тепловыделение, вырос потенциал повышения тактовой частоты.

Обычный "домашний" пользователь никакой разницы в скорости между Core и Penryn не ощущает. В обычном, неоптимизированном программном обеспечении прирост производительности составляет всего несколько процентов. В оптимизированном программном обеспечении прирост производительности у Penryn значительный:

  • оптимизация под многоядерность для 4-ядерного Penryn по сравнению с условным 1-ядерным (работающим на той же частоте и имеющим ту же архитектуру) может дать прирост производительности на 200-400% ;

  • оптимизация под использование набора инструкций SSE4.1 обеспечивает преимущество Penryn над Core на 30% при одной и той же частоте.

Уже имеется программное обеспечение, оптимизированное для выполнения на компьютерах с микропроцессорами Penryn: разнообразные графические редакторы (3DMax, POV-ray, Photoshop CS), программы обработки видео (DivX, Microsoft Media Encoder). DivX6.7 уже поддерживает SSE4.1 . Существенный выигрыш в быстродействии от использования Penryn будет в программах архивирования (WinRAR).