Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
А_К_5-2.doc
Скачиваний:
5
Добавлен:
18.11.2019
Размер:
1.98 Mб
Скачать

5.10 Особенности архитектуры amd fx-815o – bulldozer

В

Рис. 5.16 – Кристалл AMD FX-815O

основе чипов AMD Bulldozer лежат модули с двумя вычислительными ядрами х86. При этом последние не являются полностью автономными – некоторые ресурсы общие для обоих ядер. В частности, блок предварительной выборки, декодер инструкций, FPU и КЕШ-память второго уровня (L2).

Монолитный двухъядерный модуль обеспечивает одновременное выполнение двух потоков, но с определенными оговорками. По расчетам производителя, такой подход вполне оправдан и позволяет получить порядка 80% эффективности полноценных физических ядер. Однако при этом значительно уменьшается количество транзисторов, а соответственно, площадь кристалла и его энергопотребление.

С учетом новой структуры внутренняя архитектура была очень серьезно переработана, что фактически затронуло все исполнительные блоки. Сходства с К10, которая использовалась для чипов Phenom II и Athlon II, практически нет. AMD внедрила поддержку инструкций AVX, SSE 4.2 и AES-NI и добавила собственные наборы FMA4 и ХОР.

Как и топовые процессоры Phenom, чипы FX получили трехуровневую систему кеширования. Однако ее организация также заметно отличается от той, что была у предшественников. Кеш-данных L1 уменьшился с 64 КБ до 16 КБ, в то же время существенно возросла его пропускная способность. L2 объемом 2 МБ является общим для обоих ядер каждого модуля. В зависимости от количества последних суммарная емкость КЕШ-памяти второго уровня в процессоре AMD FX может составлять от 4 до 8 МБ. Латентность его несколько увеличена – плата за оптимизацию для работы на повышенных частотах. Чипы с архитектурой Bulldozer также оснащены L3-кешем объемом 8 МБ. Учитывая эксклюзивную схему работы, суммарный объем буфера довольно впечатляющий как для десктопных моделей.

Усовершенствованный алгоритм предвыборки данных позволяет надеяться, что скорость подсистемы памяти будет увеличена. Что касается непосредственно ОЗУ, то CPU FX поддерживают модули DDR3-1866 в двухканальном режиме.

Для производства AMD FX используется 32-нанометровый техпроцесс с технологией SOI, аналогичный применяемому при изготовлении APU Llano. Чипы выпускаются на мощностях родственной компании GlobalFoundries. В основе CPU лежит восьмиядерный кристалл площадью 315 мм2. Согласно топологии, большая его часть отводится под КЕШ-память, потому неудивительно, что суммарное количество транзисторов в данном случае составляет впечатляющие 2 млрд.

Для сравнения: шестиядерные Phenom II Х6 (Thuban) включают «всего» 904 млн транзисторов, но из-за 45-нанометрового техпроцесса площадь кристалла равна 346 мм2. Учитывая разницу в площади, можно предположить, что себестоимость чипов FX ниже, чем у предшественников.

Для четырех- и шестиядерных моделей AMD FX будет использоваться тот же кристалл, что позволит эффективнее распорядиться чипами, имеющими определенные дефекты.

Turbo Core

Технология динамического увеличения частоты Turbo Core ранее использовалась компанией AMD для шестиядерных Thuban и APU Llano. Процессоры FX имеют новый механизм и алгоритм работы данной функции. В случае, когда под нагрузкой энергопотребление чипа укладывается в рамки его TDP, а температура не превышает заданного значения, частота может автоматически увеличиваться (100-300 МГц) даже в ситуации, когда активны все ядра (All Core Boost). Если же как минимум половина модулей простаивают, то AMD FX может переходить в режим Max Turbo Boost, повысив напряжение питания и весьма значительно тактовую частоту работающих блоков (до 900 МГц).

AMD также озаботилась улучшением экономичности новых чипов. Учитывая рост количества вычислительных ядер, полагаться только на эффект от использования более тонкого техпроцесса нельзя. При отсутствии нагрузки на оба процессорных ядра в рамках одного модуля и переходе их в состояние энергосбережения силовые транзисторы позволяют отключать питание от данного узла, снижая общее потребление CPU.

Логическая поддержка

Как и у предыдущей десктопной платформы AMD, контроллер шины PCI Express 2.0 остался прерогативой северного моста чипсета, а не перебрался под крышку процессора. Именно количество поддерживаемых линий данного интерфейса, а вследствие и способность построения конфигураций с несколькими видеокартами стали определяющими отличиями новых наборов логики для чипов Zambezi.

В распоряжении топового AMD 990FX находятся 42 линии с возможностью компоновки на графические нужды как 2х16х или 4х8х. AMD 990X имеет 26 линий и позволяет подружить только две видеокарты в режиме CrossFireX или SLI в конфигурации 2х8х. Ну а AMD 970 при таком же числе линий PCI-E предлагает довольствоваться одним адаптером.

Во всех случаях периферию обслуживает южный мост SB950, который не несет каких-либо интересных новшеств: шесть портов SATA 6 Гб/с с возможностью создания RAID (0,1,5,10), до 14 разъемов USB 2.0, работа с PCI. Увы, в отличие от чипсета AMD A75 для платформы FM1 поддержки скоростной шины USB 3.0 здесь нет.

Разгон

Возможность беспрепятственного разгона процессоров является одним из ключевых параметров чипов FX. На этой особенности компания AMD делает отдельный акцент. Свободный множитель доступен всем моделям линейки, а возможность его изменения будет присутствовать на любой плате с АМЗ+.

Архитектура FX изначально создавалась с учетом функционирования на высоких тактовых частотах. Умельцы, вооруженные сосудами с жидким азотом, смогли получить скриншот CPU-Z в ситуации, когда процессор работал почти на 8,5 ГГц. При этом, правда, понадобилось оставить активным лишь один модуль из четырех. Все восемь ядер удалось заставить функционировать на 8,1 ГГц. Ранее подобных частот достигали разве что максимально облегченные версии Intel Celeron для LGA775. Теперь же у энтузиастов появится куда более интересный объект для оверклокерских экспериментов.

В случае с воздушной системой охлаждения придется довольствоваться более скромными результатами. При повышении напряжения питания до 1,45 В CPU стабильно работал на 4,6 ГГц. Может и не столь впечатляюще, но потенциал очевидно лучше, чем у 45-нанометровых чипов Phenom II.

5.11 64-х РАЗРЯДНЫЕ RISC-ПРОЦЕССОРЫ ФИРМЫ INTEL

История ITANIUM начинается с 1993 г., когда было принято решение о совместной разработке фирмами INTEL и HEWLETT-PACKARD нового 64-х разрядного RISC процессора под именем MERCED. Itanium (более позднее название этого процессора) стал первым продуктом, основанным на новой 64-х разрядной архитектуре IA-64 (Intel Architecture 64-bit). Он создавался для использования в высокопроизводительных рабочих станциях и серверах следующих поколений.

Первые образцы Itanium (конец 2000 г.), выполненные по 0,18-мкм технологии, имели тактовую частоту 800МГц. Новый набор инструкций класса VLIW (Very Long Instruction Word), называемый также IA-64, кодирует до 4-х инструкций в 128-ми битовое слово. При этом избыточные биты позволяют адресовать большое количество регистров, которых в новом чипе 128, а не 32, как у большинства современных RISC-процессоров. Кроме того, некоторые из бит, формируемые компилятором, укажут процессору, какие инструкции могут выполняться параллельно.

Этот набор инструкций позволит разработать улучшенную RISC-архитектуру, которая при более высоком уровне распараллеливания будет проще и обеспечит значительный рост производительности.

Процессор может выполнять программы, написанные для архитектуры H-P PA-RISC, однако с помощью транслятора, и имеет режим для выполнения инструкций х86 (IA-32). Однако, непосредственное выполнение кода х86 – невозможно. Необходимы программы перекомпилирования инструкций х86 в коды процессоров IA-64.

Увеличенная разрядность данных и адресов позволяет не только поднять скорость и точность вычислений, но и адресовать сверхбольшие объемы памяти. Новая технология EPIC (Explicitly Parallel Instruction Computing) дает возможность реализовать параллельную обработку нескольких инструкций. Эти возможности могут быть задействованы как явно программистом, так и оптимизирующим компилятором, определяющим группы независимых команд, которые могут выполняться параллельно.

Следующий процессор архитектуры IA-64 – ITANIUM-2 (старое название – McKinley (мак-кинли) – разрабатывался с прицелом на использование в течение 15-20 лет. В отличие от ITANIUM, содержащего 40 млн транзисторов, McKinley будет включать более 220 млн элементов (добавлено 4 Мбайта КЭШ-памяти третьего уровня). Системы на базе McKinley (коммерческое название ITANIUM-2) в 1,5-2 раза производительнее первого поколения ITANIUM. Расширен набор арифметически-логических блоков и портов памяти, обеспечивающих подачу данных в регистровый стек. Значительно возросло количество случаев, в которых за один такт может выполняться до 6 инструкций. Гарантируется полная совместимость программного обеспечения между ITANIUM и ITANIUM-2.

Новые процессоры семейства ITANIUM (кодовое название MADISON) имеют стартовую тактовую частоту 1,5 ГГц, содержат 410 миллионов транзисторов на кристалле (КЭШ-память третьего уровня – 6 МБ) и изготовляться по 0,13 микронной технологии. Прирост быстродействия по сравнению с ITANIUM-2 достигнет примерно 50%.