Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
А_К_5-2.doc
Скачиваний:
5
Добавлен:
18.11.2019
Размер:
1.98 Mб
Скачать

5.9 Процессор intel sandy bridge:

В

Рис. 5.15 – Процессор Sandy Bridge

процессорах Sandy Bridge впервые на одном кристалле объединены вычислительные блоки, графическое решение и системный агент, включающий контроллеры памяти и PCI Express. При этом монолитный чип производится по наиболее совершенному на текущий момент 32-нанометровому техпроцессу. Плотная интеграция всех блоков позволила на одном кристалле площадью порядка 216 мм2 разместить почти миллиард транзисторов (995 млн).

Одно из важнейших нововведений в архитектуре Sandy Bridge – Кэш инструкций L0, или кэш декодированных микроопераций (МОП), позволяющий увеличить производительность и энергоэффективность. Достигается это за счет буферизации всех МОП, полученных после преобразования инструкций х86. И если входной поток команд содержит совпадения с ранее декодированным, то результаты работы декодера загружаются сразу из Кэша L0. При этом цепи декодеров, которые являются сложной и «прожорливой» частью х86 процессоров, выключаются. Емкость L0 – 1536 МОП, что эквивалентно 6 КБ Кэша инструкций (L1). По оценкам Intel, степень попадания в L0 составляет примерно 80 %. (Что-то похожее было в процессорах PENTIUM-4 – Кэш декодированных инструкций L1 вместо Кэша команд).

Объем Кэша L1 для команд и данных не изменился и равен 32 + 32 Кб соответственно. Но его пропускная способность, а также размеры буферов записи и чтения, разделенных между исполнительными блоками ядра, были увеличены.

Рост интеграции, а в будущем и количества ядер привел к отказу Intel от обычной перекрестной топологии, когда каждое ядро имело свое собственное подключение к общей кеш-памяти (L3), в пользу кольцевой межкомпонентной шины. Также она заменит и QPI, которая применялась в Arrandale/Clarkdale для связи с контроллером памяти и графикой и являлась ограничителем производительности. Теперь для сообщения всех ключевых компонентов Sandy Bridge (графического и процессорных ядер, Кэша L3 и системного агента) используется высокоскоростная кольцевая шина. Это упрощает разводку и значительно улучшает возможности масштабирования. При частоте 3 ГГц производительность кольцевой шины оценивается на уровне 96 ГБ/с на соединение. Благодаря тому, что при пересылке данных всегда выбирается кратчайший маршрут, в некоторых случаях у кольцевой шины будет и меньшая латентность.

Важные изменения претерпел Кэш L3, получивший в интерпретации Intel название Last Level Cache (LLC). Теперь он не является частью блока Uncore (именуемого в Sandy Bridge как системный агент) и работает на частоте процессорных ядер. При этом Кэш разбит на равноправные сегменты объемом 2 МБ, закрепленные за своим ядром, которое может обращаться к нему не только через кольцевую шину, но и напрямую. В случае необходимости банки могут отключаться. Так, в моделях Core i5, где общий объем L3 составляет 6 МБ, одно ядро лишено своего сегмента, но благодаря кольцевой шине целостность Кэша не нарушается. Подобное деление на банки позволяет увеличить скорость Кеша L3, масштабируемую с ростом их количества, и на примере четырехъядерного процессора с частотой 3 ГГц обеспечивает совокупную пропускную способность в 384 ГБ/с.

Блок под названием «системный агент» (System Agent) является, по сути, северным мостом и содержит двухканальный контроллер памяти DDR3, PCl-Express 2.0, DMI, дисплейные интерфейсы, модуль аппаратного декодирования видео и модуль управления питанием (Power Control Unit, PCU). Как и все элементы архитектуры, он подключен к кольцевой шине. Благодаря этому, а также доработке контроллера памяти латентность после регресса в процессорах Clarkdale вернулась на уровень Lynnfield, а пропускная способность стала еще выше.

Формально поддерживается DDR3-1067 или DDR3-1333, но на практике есть множители даже для DDR3-2133 (только с чипсетом Intel P67). Системный агент, а также остальные два домена (первый – процессорные ядра и Кэш L3, второй – графическое ядро) имеют собственную схему тактирования и питающее напряжение. Модуль управления питанием собирает данные о загрузке, потребляемом токе и нагреве различных узлов процессора и в соответствии с ними может переводить их как в режим экономии энергии, так и в режим повышенного быстродействия. За последнее отвечает обновленная технология Intel Turbo Boost, главная особенность которой – возможность разгона на непродолжительное время (до 25 с) ядер процессора и GPU до уровня, превышающего TDP, если до этого CPU какое-то время простаивал. Это логично, ведь система охлаждения не нагревается моментально, и потому может отводить больше тепла после периода невысокой нагрузки. Подобная работа Turbo Boost позволит повысить отзывчивость и производительность в задачах, требующих высокого быстродействия на короткое время.

Важным нововведением процессоров Sandy Bridge можно считать набор инструкций AVX (Advanced Vector Extensions), которые являются дальнейшим усовершенствованием SSE. AVX позволяет работать с 256-битовыми векторными инструкциями и потенциально способен заметно ускорить работу с мультимедийными данными, однако в этом случае необходима поддержка со стороны разработчиков программного обеспечения.

Intel сделала серьезные архитектурные оптимизации с тем, чтобы AVX функционировал очень быстро, а программисты были заинтересованы активнее использовать новые возможности.

Интегрированная графика

Встроенное видеоядро стало неотъемлемой частью второй генерации процессоров Intrel Core. Новые графические решения были названы Intel HD Graphics 3000/2000. Первое содержит 12 вычислительных блоков, а упрощенная модификация – 6. Благодаря более тесной интеграции встроенное графическое ядро получило массу преимуществ. Быстрая кольцевая шина позволяет GPU задействовать для своих нужд процессорную Кэш-память последнего уровня, что в какой-то степени компенсирует сравнительно невысокую скорость системной ОЗУ, которую видеоядро использует в качестве кадрового буфера.

Из нововведений также отметим поддержку DirectX 10.1, OpenGL 3.0, аппаратное транскодирование видео различных форматов, улучшенные функции постобработки, появление возможности передачи посредством HDMI 1.4 на устройство отображения стереокартинки для просмотра Blu-Ray 3D.

Функция авторазгона графического ядра, которая ранее присутствовала только в мобильных чипах Arrandale, теперь используется и для десктопных CPU. В ряде моделей частота ядра под нагрузкой увеличивается до 1350 МГц. И это приносит свои плоды. Согласно результатам проведенного экспресс-теста, Core i5-2500K, оснащенный интегрированным Intel HD Graphics 3000, набирает порядка 4120 баллов в ЗDМагк 06, а это уровень наиболее доступных дискретных видеокарт.

Разгон процессоров

Разгон процессоров с архитектурой Sandy Bridge предполагает ряд нюансов. Особенность новой платформы состоит в том, что генератор базовой частоты теперь находится непосредственно в чипсете, а не в отдельной микросхеме на материнской плате. При этом используется единая тактовка для всех частот различных узлов системы. Потому для разгона CPU привычный метод увеличения BCLK уже не работает. После повышение базовой частоты всего лишь до 104-105 МГц система утрачивает стабильность. Так что экспериментировать с частотами можно лишь увеличивая процессорный множитель. Соответственно, для опытов необходимы чипы с разблокированным коэффициентом умножения (имеющие в названии суффикс К), стоимость которых вряд ли опустится ниже $200. Впрочем, модели процессоров, не имеющие свободного множителя, также поддаются разгону, но только на 4 ступени (400 МГц). Что самое любопытное, Turbo Boost в данной ситуации продолжит свою работу по заданному алгоритму, считая базовой уже увеличенную частоту чипа, безусловно, в обоих случаях понадобится материнская плата с чипсетом Intel P67.

Однозначно говорить об упрощении процесса разгона можно лишь в том случае, если довольствоваться сравнительно скромными достижениями на этом поприще. А вот выжимать предельные МегаГерцы по-прежнему нелегко. Параметров, влияющих на результат, достаточно много. Да и BIOS/EFI материнских плат в данном отношении на начальном этапе еще далеко не идеальны. Так, совсем недавно производители массово обновляли прошивки, вводя параметр Internal PLL Overvoltage, который заметно увеличивает порог разгона. Наш тестовый экземпляр процессора Core i7-2600K после повышения напряжения питания до 1,4 В стабильно проходил тесты на 4,9 ГГц, но на 5 ГГц загрузить ОС уже не удавалось.

Продуктовая линейка

Intel сразу анонсировала почти три десятка мобильных процессоров и чипов для настольных систем. Однако на рынке они появятся не одновременно. Говоря о десктопных моделях, отметим, что первыми в продажу поступили четырехъядерные чипы средней ценовой категории, чуть позже будут представлены более доступные двухъядерные СРU.

Intel сохранила уже хорошо известные названия семейств процессоров – Core i7/i5/i3. Однако для обозначения модели теперь применяется четырехсимвольный номер. Также в некоторых случаях используется дополнительный буквенный суффикс, который указывает на принадлежность CPU к специальной категории: К – процессоры с разблокированным коэффициентом умножения, S – экономичные устройства (TDP 65 Вт), Т – ультраэкономичные чипы (TDP 35-45 Вт).

Анонсированная на начало 2011 года линейка выглядит вполне сбалансированной. Традиционно старшие в серии Core i7 имеют максимальную тактовую частоту (3,4 ГГц), 8 МБ Кэш-памяти LLC и обладают Hyper-Threading. Чипы Core i5 работают на более низкой частоте (2,8-3,3 ГГц), содержат 6 МБ Кэш-памяти последнего уровня и не поддерживают технологии логической многопоточности. Вскоре в продажу поступят двухъядерные процессоры из новой линейки Core i3, у которых меньшая емкость буфера, отсутствует технология динамического разгона Turbo Boost, зато и стоимость будет заметно ниже уже представленных чипов.

Чипсеты

Еще со времен появления Clarkdale, когда контроллер памяти и графическое ядро переехали под крышку процессора, чипсет фактически выполняет представительские функции, держа на связи CPU и периферийные устройства. Для работы с Sandy Bridge инженеры подготовили целый набор микросхем, однако базовыми для настольных платформ будут Intel P67 и Н67. Во многом новые чипсеты схожи с предшественниками пятой серии, хотя отличий тоже предостаточно. Прежде всего отметим поддержку SATA 6 Гб/с. Два из шести портов теперь могут передавать данные на скоростях до 600 МБ/с. Для жестких дисков, линейные трансферы которых лишь недавно превысили 150 ГБ/с, это не так важно, однако лучшие модели твердотельных накопителей уже сейчас получат преимущества при подключении с помощью более производительного интерфейса. Новые чипсеты позволяют организовать RAID-массивы уровней 0, 1, 0+1 и 5, а также гибридную конфигурацию Matrix RAID.

Процессор с чипсетом связаны по шине DMI, причем ее пропускная способность увеличилась до 2 ГБ/с в каждом направлении. Отдельного внимания заслуживает поддержка до восьми полноскоростных портов PCI Express xl версии 2.0 (у Intel x5 скорость передачи чипсетных линий соответствовала стандарту 1.1). Обеспечивается работа до 14 портов USB 2.0. А вот долгожданного USB 3.0 так и не появилось, хотя устройств, в которых он уже есть, на рынке сейчас достаточно много, и их количество будет только увеличиваться. Отсутствие поддержки компания аргументирует неготовностью экосистемы и небольшим спросом. Однако мы целиком не отбрасывали бы предположение о том, что Intel не хочет укреплять позиции USB 3.0 перед запуском собственного многообещающего интерфейса Light Peak, который формально не должен конкурировать с USB 3.0 и, по словам разработчиков, уже практически готов к внедрению и началу коммерческой эксплуатации. Так или иначе, но подавляющее большинство плат с L6A1155, за исключением самых доступных моделей, будут оснащаться дополнительными контроллерами USB 3.0 от сторонних производителей. Нативную же поддержку прогрессивного стандарта USB в чипсетах Intel обещают реализовать лишь в 2012 году.

Волевым решением Intel отказалась от поддержки шины PCI в новых наборах логики. Производителям материнских плат, которые захотят сохранить соответствующие порты, понадобится устанавливать дополнительные контроллеры, представляющие собой мост PCI Express - PCI.

Что касается функциональных отличий Intel P67 и Н67, то на этот раз Intel существенно разграничила область применения каждого из них. Intel P67 отведена роль чипсета для платформ с дискретной графикой и возможностью устанавливать в системе несколько видеокарт (CrossFire и SLI). Кроме того, он позволяет разгонять процессоры путем увеличения множителя частоты и имеет повышающие коэффициенты для моделей памяти вплоть до режима DDR3-2133. А вот Intel H67 в первую очередь подойдет тем, кто планирует использовать интегрированную графику и их не смутит тот факт, что данный чипсет не предназначен для разгона CPU, а поддержка ОЗУ ограничена DDR3-1333. В то же время он позволяет увеличивать частоту графического ядра.

Что касается практической стороны работы чипсетов, то сами микросхемы нагреваются достаточно слабо, их заявленный уровень энергопотребления составляет порядка 6 Вт.