Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2.Конструкторська частина.doc
Скачиваний:
0
Добавлен:
17.09.2019
Размер:
1.95 Mб
Скачать

2.3 Порівняльна характеристика чіпів amd vliw4 та gf 110

Архітектура і чіп VLIW4 були представлені зовсім недавно, і на їх основі була побудована лише одна лінійка відеокарт.

Проблеми VLIW4: перш за все, через проблеми з 40-нм техпроцесом. Справа дійшла до того, що в VLIW4 не працювали деякі функціональні блоки. Тому перед інженерами AMD під час розробки нового ядра ставилися завдання прискорення роботи за рахунок збільшення кількості цих блоків і підвищення частот, зменшення енергоспоживання та загальної оптимізації роботи чіпа.

NVIDIA GF110, так само як і його попередник, виконаний відповідно до 40 нм нормами і складається з чотирьох кластерів обробки графіки GPC (Graphics Ргосеssiпg Clusters), які містять 4 потокових мультипроцесора (Slreaming Multiprocessors) і один движок растеризації.

Кожен з мультипроцесорів має у своєму складі 32 потокових процесора, по-іншому званих СUDА-ядрами. Крім того, він містить один движок Polymorph, що відповідає за вибірку вершин і тесселяцию. NVIDIA GF110 має шість 64-бітових контролера пам'яті, які в сумі утворюють 384-бітну шину. Кожен з контролерів з'єднаний з кеш-пам'яттю другого рівня об'ємом 768 Кбайт і має 8 блоками ROP, загальне число яких дорівнює 48. Що стосується кеш-пам'яті першого рівня та загальної пам'яті, то їх сумарний обсяг становить 64 Кбайт, причому ділиться він у співвідношенні 16 Кбайт до 48 Кбайт, або ж навпаки. Деякий час в Мережі ходили чутки про збільшеній кількості текстурних блоків у NVIDIA GF110 в порівнянні з VLIW4, проте вони не підтвердилися: у новому ядрі їх як і раніше 48. Тим не менш, архітектура цих блоків піддалася досить значних змін. Тепер вони можуть обробляти текстурні дані всіх типів, включаючи FP16, за один такт (включаючи білінійну фільтрацію).

Дане нововведення вже було випробувано в чіпі NVIDIA GF104, але відсутнє в ядрі VLIW4, яке працювало з текстурами FP16 в два такту. У теорії продуктивність текстурних блоків зростає в два рази.

Відчуття приросту швидкості можна буде в переважно в більшості сучасних ігор. Що стосується додаткових змін, то вони торкнулися також і движка растеризації, який отримав поліпшений блок відбракування невидимих ​​поверхонь Z-cull. Знову-таки, згадуючи AMD VLIW4, можна сказати, що в деяких випадках проізводітельнасть блоку падала. У NVIDIA GF110 були введені допрацьовані алгоритми у функціонал блоку Z-cull, що, крім усього іншого, дозволяє більш ефективно використовувати шину пам'яті.

Чіп NVIDIA GF110 не відзначався за показниками продуктивності, тому зниження енергоспоживання було однією з першочергових завдань при розробці ядра. Комбінування швидких транзисторів з високим рівнем струмів витоків і повільних з малими струмами витоків дозволило знизити тепловий пакет NVIDIA GF110. У порівнянні зі своїм попередником, новий чіп в окремих випадках споживає до 30-40 Вт енергії менше.

NVIDIA GF110, так само як і AMD VLIW4, показує високу швидкість тесселяції, не просідаючи при цьому в режимах з розбивкою на велику кількість трикутників.

До речі, чіпи NVIDIA переважають у цьому компоненті над графічними процесорами AMD - перш за все, за рахунок розпаралелювання робіт між 1 червня системою PolyMorph.

Лист

Зм

Лист

№ документ.

Підпис

Дата

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]