Вторая часть данного материала — Radeon HD 7970. Новогодний флагман AMD. Часть вторая
Трудности с освоением нового 28-нм техпроцесса немного сбавили темпы гонки между AMD и NVIDIA. Год назад были представлены флагманы прошлого поколения, и после довольно длительного периода доминирования AMD на рынке графических ускорителей их конкурент, наконец-то, смог уверенно потеснить «красных», выпустив GeForce GTX 580. И этот акселератор всерьез и надолго занял место лидера среди однопроцессорных решений. Но так было до недавнего момента. С анонсом Radeon HD 7970 компания AMD снова вырывается вперед — новый техпроцесс и новый уровень производительности дают шанс вернуть обратно пальму первенства.
Архитектура GCN и графический процессор Tahiti
Последние несколько лет архитектура графических процессоров AMD серьезно не менялась. Но прогресс диктует свои условия. Функциональность и сфера применения графических процессоров расширяются. Все более актуальными становятся неграфические вычисления, и технология GPGPU становится все более востребованной. Лидером в этой области является NVIDIA, которая всячески популяризовала свою платформу CUDA и с недавнего времени даже открыла доступ к исходному коду компилятора. Архитектура GeForce уже давно идет по пути унификации. И вслед за конкурентом, AMD переходит от VLIW к более гибкой и универсальной архитектуре под названием Graphics Core Next (GCN). Старая архитектура в первую очередь была ориентирована на графические расчеты, новая — на смешанные гетерогенные вычисления для одновременной обработки совместно с CPU. И это является одной из ступенек для дальнейшего развития гибридных процессоров Fusion.
В основе старой архитектуры лежали блоки SIMD Engine по 16 потоковых процессоров, которые выполняли одну VLIW-инструкцию над разными блоками данных. При неграфических вычислениях основной проблемой была полная загрузка SIMD-блока. Новая архитектура построена на более универсальных блоках GCN Compute Unit (CU), которые могут гибко распределять нагрузку.
Каждый CU разбит на четыре векторных модуля по 16 ALU и имеет свой скалярный блок для контроля и управления потоками, а также выполнения отдельных операций, не являющихся частью основного массива обрабатываемых данных. У CU имеется локальная память объемом 64 КБ, кэш L1 на 16 КБ и свои блоки выборки и фильтрации текстур. Наличие внутреннего планировщика у такого GCN-блока позволяет им обрабатывать разные потоки и легко переключаться на другие задачи, обходясь без единого внешнего планировщика.
У каждых четырех модулей CU имеется общее хранилище 32 КБ для данных и кэш 16 КБ для инструкций. Общий объем кэша второго уровня в два раза выше, чем у Cayman, и достигает 768 КБ. Пропускная способность шин кэша L1 и L2 позволяет передавать 64 байта за такт. Общая пропускная способность для кэш-памяти первого уровня достигает 2 ТБ/с, для второго — 700 ГБ/с, что в два раза больше возможностей старого Cayman.
Radeon предыдущих серий сильно уступали конкурентам из линейки GeForce при работе с тесселяцией. Поэтому значительному улучшению подверглись блоки обработки геометрии. Их по-прежнему два. Но производительность блока тесселяции значительно повысилась, а сам он получил принадлежность аж к 9 поколению. В определенных режимах обещано ускорение производительности при тесселяции до четырех раз. Но это в синтетике, в реальных играх разница будет значительно меньше. AMD говорит о приросте от 50 до 130% в сравнении с Radeon HD 6900, что тоже немало.
В неграфических задачах прирост обещают не менее внушительный — от 1,4 до 4 раз в определенных расчетах и задачах.
Появилась поддержка алгоритма Ptex (Per-face texture mapping), который упрощает тесселяцию некоторых объектов. Вместо совмещения целой текстуры с моделью на каждый полигон накладывается отдельная текстура. А технология Partially Resident Textures позволит использовать видеопамять как кэш, в который по мере надобности будут подгружаться текстуры.
Новое поколение графических процессоров AMD совместимо с DirectX 11.1. К числу нововведений также относится поддержка API DirectCompute 11.1, OpenCL 1.2 и C++ AMP.
На базе новой архитектуры планируется в начале следующего года выпустить три линейки видеокарт. Флагманский GPU под кодовым именем Tahiti даст жизнь картам серии Radeon HD 7900, на базе Pitcairn увидят свет Radeon HD 7800, а Verde придет в средний класс с продуктами линейки Radeon HD 7700.
Блок-схема топового Tahiti приведена ниже.
Этот графический процессор включает 32 GCN Compute Unit, каждый из которых насчитывает 64 ALU. А всего получается 2048 штук, что на треть больше, чем у Cayman. Общее количество текстурных блоков достигает 128 штук (96 у предшественника). Не выросло лишь число ROP — их по-прежнему 32. Шесть 64-битных контроллеров обеспечивают связь с памятью по 384-битной шине — прямо как у топового GeForce GTX 580 от NVIDIA. В таком полнофункциональном варианте выпускается Radeon HD 7970. У его младшего брата в лице Radeon HD 7950 часть GCN-блоков будет отключена. GPU у старшей карты работает на 925 МГц, что лишь на 45 МГц выше частоты графического процессора Radeon HD 6970. Память GDDR5 функционирует на 5500 МГц. И тут вообще никакой разницы с предшественником. Правда, у последнего шина 256 бит, так что его пропускная способность памяти заметно ниже. Объем видеобуфера вырос с двух гигабайт до трех.
Видеоадаптер | Radeon HD 7970 | Radeon HD 6970 | Radeon HD 5870 |
Ядро | Tahiti | Cayman | Cypress |
Архитектура | GNC | VLIW4 | VLIW5 |
Количество транзисторов, млн. шт | 4312 | 2640 | 2154 |
Техпроцесс, нм | 28 | 40 | 40 |
Площадь ядра, кв. мм | 365 | 389 | 334 |
Количество потоковых процессоров | 2048 | 1536 | 1600 |
Количество текстурных блоков | 128 | 96 | 82 |
Количество блоков рендеринга | 32 | 32 | 32 |
Частота ядра, МГц | 925 | 880 | 850 |
Шина памяти, бит | 384 | 256 | 256 |
Тип памяти | GDDR5 | GDDR5 | GDDR5 |
Частота памяти, МГц | 5500 | 5500 | 4800 |
Объём памяти, МБ | 3072 | 2048 | 1024 |
Поддерживаемая версия DirectX | 11.1 | 11 | 11 |
Интерфейс | PCI-E 3.0 | PCI-E 2.1 | PCI-E 2.1 |
Заявленная потребляемая мощность в простое, Вт | 3 | 20 | 27 |
Заявленная максимальная потребляемая мощность, Вт | 250 | 250 | 188 |
Из-за кардинально переработанной архитектурой новый GPU стал намного сложнее и более громоздким. В итоге он даже обогнал GF110 по количеству транзисторов. Но благодаря более тонкому техпроцессу кристалл Tahiti по размерам не больше Cayman, и даже чуть меньше. Максимальный уровень энергопотребления тоже не вырос. И достигнуть этого помог не только новый технологический процесс производства, но и усовершенствованная технология AMD PowerTune. Процессор обладает еще более гибкой системой управления напряжениями и отключает функциональные блоки при простое видеокарты. По показателям энергопотребления в простое Radeon HD 7970 просто рекордсмен — всего 3 Вт! Технология PowerTune контролирует уровень TDP, регулируя рабочие частоты так, чтобы не превысит лимит. Сверхбыстрое реагирование возможно благодаря датчикам, отслеживающим загрузку всех блоков. Конечно, в реальных играх снижаться частоты не будут, а вот в Furmark такое возможно. Нельзя не вспомнить, что подобного рода «защита» от программ стресс-тестирования реализована и в последних видеокартах GeForce. PowerTune — технология аппаратная, но пользователь может корректировать максимальный уровень мощности с помощью соответствующего параметра в Catalyst Control Center.
В режиме длительного простоя при отключенном дисплее карта может полностью выключить вентилятор. Если в системе несколько видеокарт Radeon, которые объединены в CrossFireX, то в простом 2D-режиме простаивающие карты переводятся в самый экономичный режим и отключают вентилятор.
Radeon HD 7970 и все последующие графические решения AMD обрели поддержку высокопроизводительной шины PCI Express 3.0. Хотя сомнительно, что для игровой карты даже такого уровня нужна быстрая шина. А вот для неграфических расчетов это будет более актуальным. Сохранена аппаратная совместимость со старыми стандартами PCI-E, так что никаких проблем с использованием новых видеоадаптеров на относительно старых системных платах быть не должно.
Получила развитие и технология AMD Eyefinity. Вместе с индексом 2.0 появилась поддержка HD3D для мультимониторных конфигураций. Radeon HD 7970 — первая карта AMD, которая позволяет выводить стереоизображение на три монитора. Специально для этого режима она обзавелась поддержкой интерфейса HDMI 1.4a frame packing, который (в отличие от простого HDMI 1.4a) позволяет передавать картинку в Full HD с частотой 60 Гц на глаз. Добавилась поддержка новых разрешений и конфигураций. Как и ранее, подключить к карте можно шесть мониторов. С помощью специального хаба к одному интерфейсу Display Port 1.2 возможно подключить три устройства. Правда, такие хабы появятся в продаже значительно позже.
Блок UVD в GPU Tahiti обеспечивает аппаратное декодирование данных в форматах MPEG-2/MPEG-4 (DivX), VC-1 и H.264. Для аппаратного кодирования видео появился специальный блок VCE, который может работать как совместно с потоковыми процессорами, так и сам обрабатывать видео. Новая технология AMD Steady Video позволит улучшить видео плохого качества и убрать дрожание камеры.
В числе уникальных достоинств Radeon HD 7970 — поддержка Ultra High Resolution. Тут новинка снова в роли первопроходца, хотя эра UHDTV пока еще кажется очень далекой.