AMD Radeon R9 290X
В новой линейке Radeon большинство моделей являются переименованными старыми решениями со слегка откорректированными частотами. Но Radeon R9 290X базируется на абсолютно новом графическом чипе Hawaii с обновленной архитектурой Graphics Core Next (GCN). В его основе четыре массива вычислительных блоков Shader Engine по 11 блоков Compute Unit (CU) в каждом. То есть всего получается 44 блока CU против 32 у GPU Tahiti (Radeon HD 7970). Кэш-память L2 выросла с 768 КБ у Tahiti до 1 МБ у Hawaii, повышена его внутренняя пропускная способность. Важные изменения на уровне командной логики призваны улучшить многозадачность и эффективность работы в неграфических вычислениях. Параллельно с командным блоком Graphic Command Processor работают восемь Asynchronous Compute Engines (только два у Tahiti), каждый из которых обеспечивает независимое управление восемью потоками команд.
Каждый Shader Engine содержит свой блок обработки геометрии и блок-растеризатор. У старого флагманского процессора было по два соответствующих блока. Так что производительность Hawaii в обработке сложной геометрии и тесселяции должна возрасти в два раза! Причем кроме удвоения соответствующих блоков сами они были немного улучшены за счет увеличения внутренней кэш-памяти.
Четыре укрупненных блока Render Back-ends содержат по четыре ROP в каждом и позволяют Shader Engine работать с 16 блоками растеризации, а общее их число достигает 64. И снова двукратный рост количества вычислительных блоков относительно предшественника!
Никаких структурных изменений в Compute Unit нет. 64 ALU объединены в четыре векторных модуля с общим локальным хранилищем данных 64 КБ. Количество блоков фильтрации текстур равно четырем. В итоге графический процессор оперирует 2816 вычислительными единицами при 176 текстурных блоках.
Radeon R9 290X избавился от необходимости использования мостиков при объединении в режиме CrossFire и видеокарты теперь обмениваются данными напрямую через шину PCI Express. Синхронизацию обеспечивают DMA Engines.
Восемь 64-битных контроллеров реализуют обмен данных с внешней памятью по шине разрядностью 512 бит. При этом микросхемы GDDR5 работают на эффективной частоте 5 ГГц. Так что если сравнивать со второй версией флагмана прошлого поколения, получившего повышенные частоты и приставку GHz Edition, то реальная разница в пропускной способности будет лишь 10% в пользу новинки. Первоначальная же версия Radeon HD 7970 с более низкими частотами памяти проигрывает уже 21%. При этом площадь, занимаемая контроллерами памяти, у Hawaii меньше относительно Tahiti, что свидетельствует о значительной оптимизации и реорганизации данных блоков инженерами AMD. Объем графической памяти вырос до 4 ГБ.
Оценить преимущество нового видеоадаптера в сравнении с предшественниками и младшим Radeon R9 280X можно по нижней таблице.
Видеоадаптер | Radeon R9 290X | Radeon R9 280X | Radeon HD 7970 GHz Edition | Radeon HD 7970 |
Ядро | Hawaii XT | Tahiti XT2 | Tahiti | Tahiti |
Количество транзисторов, млн. шт | 6020 | 4312 | 4312 | 4312 |
Техпроцесс, нм | 28 | 28 | 28 | 28 |
Площадь ядра, кв. мм | 438 | 365 | 365 | 365 |
Количество потоковых процессоров | 2816 | 2048 | 2048 | 2048 |
Количество текстурных блоков | 176 | 128 | 128 | 128 |
Количество блоков рендеринга | 64 | 32 | 32 | 32 |
Частота ядра, МГц | до 1000 | 1000 | 1000–1050 | 925 |
Шина памяти, бит | 512 | 384 | 384 | 384 |
Тип памяти | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
Частота памяти, МГц | 5000 | 6000 | 6000 | 5500 |
Объём памяти, МБ | 4096 | 3072 | 3072 | 3072 |
Поддерживаемая версия DirectX | 11.2 | 11.2 | 11.2 | 11.2 |
Интерфейс | PCI-E 3.0 | PCI-E 3.0 | PCI-E 3.0 | PCI-E 3.0 |
Мощность, Вт | 290 | 250 | 250 | 250 |
Об уровне общих архитектурных улучшений наглядно говорит следующее сравнение некоторых рабочих параметров Radeon R9 290X и Radeon HD 7970, составленное AMD.
Почти двукратный рост обработки геометрических примитивов, о чем уже говорилось выше. Общий рост вычислительной мощности составил 30%. И при этом имеет рост соотношения производительности на единицу площади кристалла, что очень критично при сохранении старых норм технологического процесса. Тем не менее, новый GPU, разросшийся до 6 миллионов транзисторов, все равно сложнее в производстве, а вопрос его охлаждения еще более критичен. Все это априори предполагает повышение уровня нагрева, шума и энергопотребления нового флагмана. Примечателен даже такой факт, что компания не афиширует данные по мощности нового решения. Согласно сторонним источникам оно близко к 300 Вт, конкуренты из NVIDIA озвучивают значение в 290 Вт.
Официально все Radeon нового поколения имеют некое максимальное значение частоты ядра и более низкое значение базовой частоты, которое AMD обычно тоже игнорирует и нигде не указывает. Например, для Radeon R9 280X значение в 1 ГГц является частотой Boost-режима. Судя по данным с сайтов партнеров разработчика (Sapphire и т.д.) базовое значение частоты равно 850 МГц. Но во всех без исключения играх карта постоянно работает на Boost-частоте, понижая ее только в самых тяжелых стресс-тестах вроде Furmark и MSI Kombustor. Так что мы уверенно говорим о 1 ГГц на Radeon R9 280X в игровом режиме, и это нормально. Алгоритм регулировки частоты у Radeon R9 290X более гибкий. Обновленная технология PowerTune обеспечивает плавную регулировку частоты и рабочих напряжений в случае превышения установленного лимита мощности и ограничений по температуре. Переключение это реализуется очень быстро, у карты множество промежуточных состояний. При таком переключении определенной фиксированной частоты нет, есть некое среднее значение в определенный момент времени. Добавление нового температурного лимита привело к изменению механизма регулировки параметров в меню ATI Overdrive.
На цветовой шкале задается средняя точка, определяющая баланс между частотой процессора, его температурой и энергопотреблением. И вот тут кроется главный нюанс работы нового Radeon. Для удержания ядра в определенных рамках температуры и энергопотребления карта может понижать его рабочую частоту без какого-либо фиксированного минимального значения. А судя по работе видеокарты, основным ограничением у R9 290X выступает именно температура. На стандартном охлаждении процессор прогревается до порогового значения в 94 °C даже в играх, не говоря уже о стресс-тестах. Так что заявленное значение в 1 ГГц карта будет держать лишь при определенных условиях эксплуатации — чем они хуже, тем ниже производительность. Нечто подобное мы уже говорили в отношении GeForce GTX 780, да вот только у конкурента есть гарантированное базовое значение, а Boost рассматривается как дополнительная возможность ускорения.
Зависимость производительности от температуры заставила AMD ввести два рабочих режима, которые выбираются путем переключения между двумя BIOS. Uber Mode обеспечивает высокую скорость вентилятора, что позволяет удерживать частоту ядра на уровне 1 ГГц. В Quiet Mode обороты более низкие, ниже шум, но и справится с охлаждением ядра намного сложнее, что теоретически означает более высокую вероятность снижения частоты и понижения производительности. Интересно, что образец видеокарты, который мы получили на руки, имел два одинаковых BIOS без Quiet Mode. Но мы легко получили соответствующий режим путем простой регулировки скорости вентилятора. Как видно по верхнему скриншоту Catalyst Control Center, в ATI Overdrive теперь задается не прямое значение скорости вращения, а ограничение его максимальной скорости. В режиме Uber вентилятор ограничен значением в 55% от своего максимума (более 2900 об/мин). Для режима Quiet изначально было предусмотрено ограничение в 40% (примерно 2000 об/мин), но с новым драйвером оно повышено до 42% (до 2200 об/мин).
Кроме стандартных для Radeon блоков кодирования и декодирования видео мультимедийные возможности расширены за счет встроенного аудиопроцессора AMD TrueAudio, о котором мы немного рассказывали в первом материале, приуроченном к старту новой серии видеокарт. Физически этот блок представлен несколькими ядрами Tensilica HiFi EP Audio DSP с соответствующей управляющей логикой. Доступ к ресурсам аудиопроцессора реализуется через специальный API. Первой игрой с поддержкой AMD TrueAudio должен стать Thief, выход которого намечен на 2014 год.
Повторно следует упомянуть и графический API Mantle, в котором реализован низкоуровневый доступ к ресурсам графического процессора. Новый API рассчитан на совместную работу со всеми графическими решениями архитектуры GCN и даже на разных платформах, включая новые игровые консоли. Очень перспективное начинание, которое может обеспечить определенные преимущества Radeon относительно конкурента. Хотя в итоге все будет зависеть от того, сможет ли AMD популяризировать свою разработку. Первой игрой с поддержкой Mantle должен стать один из главных хитов этой осени — Battlefield 4. Ввести поддержку API обещают в одном из обновлений до конца года.
В Radeon R9 290X реализована простая поддержка мониторов 4K, которые физически представлены как две совмещенные матрицы и требуют подключения через два порта. Настройка таких мониторов производится автоматически благодаря поддержке стандарта VESA Display ID 1.3. Доработана технология AMD Eyefinity. Теперь она предоставляет более широкие возможности для организации мультимониторных конфигураций. Возможна одновременная работа трех мониторов, подключенных через разные интерфейсы, и поддержка трех мониторов через DVI и HDMI. С использованием DisplayPort можно задействовать до шести дисплеев.
Ну а теперь пора взглянуть на живую видеокарту референсного дизайна.
Внешний вид топового акселератора AMD изменился. От глянцевых поверхностей Radeon HD 7970 отказались. Общая форма кожуха с декоративными красными вставками напоминает завихрение, внутри которого расположен отсек вентилятора. Часть поверхности имеет рельефную ячеистую структуру. На боковую грань нанесен логотип Radeon. Вся конструкция максимально закрытая, чтобы обеспечить выдув горячего воздуха за пределы корпуса через решетку задней панели. Небольшие отверстия для выдува расположены и в боковой части, в самом углу.
С другой стороны карты имеется несколько декоративных воздуховодов.
Radeon R9 290X выглядит оригинально и симпатично.
Длина карты 27,5 сантиметров. Имеется небольшая усилительная крестообразная пластина над чипом с обратной стороны.
Кожух снимается без полного демонтажа охлаждения. Под ним мы видим СО, хорошо знакомую по референсным версиям Radeon HD 7970.
Массивное основание накрывает всю плату, отводя тепло от силовых элементов и микросхем памяти. На это основание напаян радиатор, нижняя часть которого представлена медной испарительной камерой.
К основанию прикручен радиальный 70-мм вентилятор (модель FirstD FD7525U12D), прогоняющий воздух между ребрами радиатора.
Аналогичного размера вентиляторы используются и в «турбинах» от NVIDIA.
Печатная плата мало чем отличается от Radeon R9 280X и Radeon HD 7970. Хотя на одну фазу питания стало меньше.
Графический процессор запитан от пяти фаз под управлением контроллера IR 3567B. Одна фаза идет на питание памяти. В левой части платы реализован стабилизатор напряжения PLL. Везде используются самые прогрессивные «мосфеты» в медном корпусе DirectFET.
Кристалл Hawaii заметно крупнее предшественника. Вся маркировка нанесена на рамку вокруг чипа.
Четыре гигабайта памяти набрано 16 микросхемами SKhynix H5GQ2H24AFR R0C. Точно такие же используются в Radeon R9 280X и отлично работают на частотах свыше 6 ГГц, что предусматривает хороший запас для разгона.
Настало время взглянуть на поведение видеокарты под нагрузкой. Для начала изучим режим Uber, в котором обороты ограничены отметкой в 55%. Шум в таком режиме высокий, но и производительность максимальная. Для мониторинга мы использовали последнюю версию MSI Afterburning. Ниже отображен график нагрузки демо Ambush из Crysis Warhead Benchmarking Tool при максимальных настройках графики и сглаживании MSAA 8x в разрешении 2560x1440 в течение 12 минут. Температура в помещении составляла 23–24 °С, боковая стенка корпуса была открыта. Справа приведен график нагрузки в более тяжелом Unigine Valley benchmark при Ultra-качестве со сглаживанием MSAA 4x в течение 13 минут (четыре повтора теста).
Как видим, в обоих случаях температура ядра удерживается на отметке 94 °С. В Crysis есть редкие просадки, а в Valley benchmark через некоторое время линия частоты превращается в кривую, среднее значение которой на уровне 953 МГц, а самые значительные просадки до 541 МГц. Причем все эти значения могут быть лишь усредненными данными, ведь реальная скорость переключения частоты очень высокая, как уже отмечалось выше.
В большинстве приложений видеокарта вела себя подобно тому, что мы видели в Crysis, т.е. частота не откланялась от 1000 МГц или просадки были очень редкими. Где-то нестабильность частоты более выражена, как в Metro Last Light — четыре прогона встроенного бенчмарка на нижнем левом графике. Кроме Valley benchmark единственным приложением, где среднее значение частоты было стабильно ниже 1000 мегагерц, оказалась игра Sleeping Dogs. Справа отображен график загрузки по итогам прохождения четырех прогонов встроенного теста. Там частота опускалась и до 937 МГц, зато без резких скачков до 500 МГц.
Ну а что же происходит при тихом Quiet-режиме, когда скорость вращения вентиляторов не поднимается выше 42%? Это наглядно демонстрируют следующие иллюстрации загрузки в Crysis Warhead и Unigine Valley benchmark.
Стоит графическому процессору прогреться, как частота сразу снижается чуть ли не до уровня 800 МГц в первом приложении и до 770–800 МГц во втором случае. При этом в Valley benchmark имеют место и более значительные просадки, вплоть до 514 МГц.
Ну и для полного сравнения приведем еще графики загрузки в Metro Last Light и Sleeping Dogs.
Теперь поговорим о разгоне. На фоне всего вышеприведенного понятно, что повышение частоты с родным охлаждением возможно только в самом скоростном и самом шумном режиме родного охлаждения. Впрочем, практический разгон флагманов всегда подразумевал использование альтернативного охлаждения, так что ничего смертельного в этом нет. Поэтому мы сразу вывели обороты на близкое к максимуму значение и принялись за эксперименты. Начнем с описания нюансов работы памяти. Сначала нам удалось достичь эффективного значения частоты в 5800–5900 МГц, но при этом наблюдалась нестабильность в 2D-режиме — мерцание меню и т.п. Часть игр зависала прямо в меню, но те, которые успевали загрузить 3D-среду, работали стабильно. Самое забавное, что быстрее всего приводил к смерти системы запуск Catalyst Control Center. На фоне таких проблем пришлось снижать частоту до момента, пока все заработало без сбоев. Этим значением стали 1425 МГц (5700 МГц). При повышении частоты ядра мы уперлись в артефакты после границы в 1110 МГц и резкому снижению стабильности при частотах свыше 1130 МГц. Если действовать из меню ATI Overdrive, то конечное значение частоты ядра задается в процентном соотношении от номинала и будет зависеть от температуры. Можно регулировать все параметры при ручном перетаскивании точки на цветной шкале. Но по сути порядок действий аналогичен тому, что выполняется при разгоне последних GeForce: повышаете лимит мощности и температуры, потом подбираете стабильные частоты. И если говорить об ограничении мощности, то у Radeon запас больше — соответствующий лимит можно поднять на 50%. Однако повышение этого лимита и снижение рабочей температуры не избавили нас от редкого снижения частоты при разгоне до 1110/5700 МГц. Ниже вы можете увидеть редкие отклонения от максимального значения. Просадки небольшие, но имеют место.