Вторая часть данного материала — Radeon HD 7970. Новогодний флагман AMD. Часть вторая


Трудности с освоением нового 28-нм техпроцесса немного сбавили темпы гонки между AMD и NVIDIA. Год назад были представлены флагманы прошлого поколения, и после довольно длительного периода доминирования AMD на рынке графических ускорителей их конкурент, наконец-то, смог уверенно потеснить «красных», выпустив GeForce GTX 580. И этот акселератор всерьез и надолго занял место лидера среди однопроцессорных решений. Но так было до недавнего момента. С анонсом Radeon HD 7970 компания AMD снова вырывается вперед — новый техпроцесс и новый уровень производительности дают шанс вернуть обратно пальму первенства.


Архитектура GCN и графический процессор Tahiti

Последние несколько лет архитектура графических процессоров AMD серьезно не менялась. Но прогресс диктует свои условия. Функциональность и сфера применения графических процессоров расширяются. Все более актуальными становятся неграфические вычисления, и технология GPGPU становится все более востребованной. Лидером в этой области является NVIDIA, которая всячески популяризовала свою платформу CUDA и с недавнего времени даже открыла доступ к исходному коду компилятора. Архитектура GeForce уже давно идет по пути унификации. И вслед за конкурентом, AMD переходит от VLIW к более гибкой и универсальной архитектуре под названием Graphics Core Next (GCN). Старая архитектура в первую очередь была ориентирована на графические расчеты, новая — на смешанные гетерогенные вычисления для одновременной обработки совместно с CPU. И это является одной из ступенек для дальнейшего развития гибридных процессоров Fusion.

В основе старой архитектуры лежали блоки SIMD Engine по 16 потоковых процессоров, которые выполняли одну VLIW-инструкцию над разными блоками данных. При неграфических вычислениях основной проблемой была полная загрузка SIMD-блока. Новая архитектура построена на более универсальных блоках GCN Compute Unit (CU), которые могут гибко распределять нагрузку.

AMD Tahiti

Каждый CU разбит на четыре векторных модуля по 16 ALU и имеет свой скалярный блок для контроля и управления потоками, а также выполнения отдельных операций, не являющихся частью основного массива обрабатываемых данных. У CU имеется локальная память объемом 64 КБ, кэш L1 на 16 КБ и свои блоки выборки и фильтрации текстур. Наличие внутреннего планировщика у такого GCN-блока позволяет им обрабатывать разные потоки и легко переключаться на другие задачи, обходясь без единого внешнего планировщика.

У каждых четырех модулей CU имеется общее хранилище 32 КБ для данных и кэш 16 КБ для инструкций. Общий объем кэша второго уровня в два раза выше, чем у Cayman, и достигает 768 КБ. Пропускная способность шин кэша L1 и L2 позволяет передавать 64 байта за такт. Общая пропускная способность для кэш-памяти первого уровня достигает 2 ТБ/с, для второго — 700 ГБ/с, что в два раза больше возможностей старого Cayman.

AMD Tahiti

Radeon предыдущих серий сильно уступали конкурентам из линейки GeForce при работе с тесселяцией. Поэтому значительному улучшению подверглись блоки обработки геометрии. Их по-прежнему два. Но производительность блока тесселяции значительно повысилась, а сам он получил принадлежность аж к 9 поколению. В определенных режимах обещано ускорение производительности при тесселяции до четырех раз. Но это в синтетике, в реальных играх разница будет значительно меньше. AMD говорит о приросте от 50 до 130% в сравнении с Radeon HD 6900, что тоже немало.

AMD Tahiti

В неграфических задачах прирост обещают не менее внушительный — от 1,4 до 4 раз в определенных расчетах и задачах.

Появилась поддержка алгоритма Ptex (Per-face texture mapping), который упрощает тесселяцию некоторых объектов. Вместо совмещения целой текстуры с моделью на каждый полигон накладывается отдельная текстура. А технология Partially Resident Textures позволит использовать видеопамять как кэш, в который по мере надобности будут подгружаться текстуры.

Новое поколение графических процессоров AMD совместимо с DirectX 11.1. К числу нововведений также относится поддержка API DirectCompute 11.1, OpenCL 1.2 и C++ AMP.

На базе новой архитектуры планируется в начале следующего года выпустить три линейки видеокарт. Флагманский GPU под кодовым именем Tahiti даст жизнь картам серии Radeon HD 7900, на базе Pitcairn увидят свет Radeon HD 7800, а Verde придет в средний класс с продуктами линейки Radeon HD 7700.

Блок-схема топового Tahiti приведена ниже.

AMD Tahiti

Этот графический процессор включает 32 GCN Compute Unit, каждый из которых насчитывает 64 ALU. А всего получается 2048 штук, что на треть больше, чем у Cayman. Общее количество текстурных блоков достигает 128 штук (96 у предшественника). Не выросло лишь число ROP — их по-прежнему 32. Шесть 64-битных контроллеров обеспечивают связь с памятью по 384-битной шине — прямо как у топового GeForce GTX 580 от NVIDIA. В таком полнофункциональном варианте выпускается Radeon HD 7970. У его младшего брата в лице Radeon HD 7950 часть GCN-блоков будет отключена. GPU у старшей карты работает на 925 МГц, что лишь на 45 МГц выше частоты графического процессора Radeon HD 6970. Память GDDR5 функционирует на 5500 МГц. И тут вообще никакой разницы с предшественником. Правда, у последнего шина 256 бит, так что его пропускная способность памяти заметно ниже. Объем видеобуфера вырос с двух гигабайт до трех.

Видеоадаптер Radeon HD 7970 Radeon HD 6970 Radeon HD 5870
Ядро Tahiti Cayman Cypress
Архитектура GNC VLIW4 VLIW5
Количество транзисторов, млн. шт 4312 2640 2154
Техпроцесс, нм 28 40 40
Площадь ядра, кв. мм 365 389 334
Количество потоковых процессоров 2048 1536 1600
Количество текстурных блоков 128 96 82
Количество блоков рендеринга 32 32 32
Частота ядра, МГц 925 880 850
Шина памяти, бит 384 256 256
Тип памяти GDDR5 GDDR5 GDDR5
Частота памяти, МГц 5500 5500 4800
Объём памяти, МБ 3072 2048 1024
Поддерживаемая версия DirectX 11.1 11 11
Интерфейс PCI-E 3.0 PCI-E 2.1 PCI-E 2.1
Заявленная потребляемая мощность в простое, Вт 3 20 27
Заявленная максимальная потребляемая мощность, Вт 250 250 188

Из-за кардинально переработанной архитектурой новый GPU стал намного сложнее и более громоздким. В итоге он даже обогнал GF110 по количеству транзисторов. Но благодаря более тонкому техпроцессу кристалл Tahiti по размерам не больше Cayman, и даже чуть меньше. Максимальный уровень энергопотребления тоже не вырос. И достигнуть этого помог не только новый технологический процесс производства, но и усовершенствованная технология AMD PowerTune. Процессор обладает еще более гибкой системой управления напряжениями и отключает функциональные блоки при простое видеокарты. По показателям энергопотребления в простое Radeon HD 7970 просто рекордсмен — всего 3 Вт! Технология PowerTune контролирует уровень TDP, регулируя рабочие частоты так, чтобы не превысит лимит. Сверхбыстрое реагирование возможно благодаря датчикам, отслеживающим загрузку всех блоков. Конечно, в реальных играх снижаться частоты не будут, а вот в Furmark такое возможно. Нельзя не вспомнить, что подобного рода «защита» от программ стресс-тестирования реализована и в последних видеокартах GeForce. PowerTune — технология аппаратная, но пользователь может корректировать максимальный уровень мощности с помощью соответствующего параметра в Catalyst Control Center.

В режиме длительного простоя при отключенном дисплее карта может полностью выключить вентилятор. Если в системе несколько видеокарт Radeon, которые объединены в CrossFireX, то в простом 2D-режиме простаивающие карты переводятся в самый экономичный режим и отключают вентилятор.

AMD Tahiti

Radeon HD 7970 и все последующие графические решения AMD обрели поддержку высокопроизводительной шины PCI Express 3.0. Хотя сомнительно, что для игровой карты даже такого уровня нужна быстрая шина. А вот для неграфических расчетов это будет более актуальным. Сохранена аппаратная совместимость со старыми стандартами PCI-E, так что никаких проблем с использованием новых видеоадаптеров на относительно старых системных платах быть не должно.

Получила развитие и технология AMD Eyefinity. Вместе с индексом 2.0 появилась поддержка HD3D для мультимониторных конфигураций. Radeon HD 7970 — первая карта AMD, которая позволяет выводить стереоизображение на три монитора. Специально для этого режима она обзавелась поддержкой интерфейса HDMI 1.4a frame packing, который (в отличие от простого HDMI 1.4a) позволяет передавать картинку в Full HD с частотой 60 Гц на глаз. Добавилась поддержка новых разрешений и конфигураций. Как и ранее, подключить к карте можно шесть мониторов. С помощью специального хаба к одному интерфейсу Display Port 1.2 возможно подключить три устройства. Правда, такие хабы появятся в продаже значительно позже.

Блок UVD в GPU Tahiti обеспечивает аппаратное декодирование данных в форматах MPEG-2/MPEG-4 (DivX), VC-1 и H.264. Для аппаратного кодирования видео появился специальный блок VCE, который может работать как совместно с потоковыми процессорами, так и сам обрабатывать видео. Новая технология AMD Steady Video позволит улучшить видео плохого качества и убрать дрожание камеры.

В числе уникальных достоинств Radeon HD 7970 — поддержка Ultra High Resolution. Тут новинка снова в роли первопроходца, хотя эра UHDTV пока еще кажется очень далекой.