Подобно GeForce GTX Titan X новинка тоже базируется на GPU GM200, который значительно нарастил мощь относительно GM204. В основе нового процессора шесть графических кластеров GPC вместо четырех у младшего чипа. Каждый кластер состоит из четырех крупных мультипроцессорных блоков SMM, внутри которых 128 потоковых процессоров организованы в четыре массива обработки данных. Каждый SMM имеет свой блок обработки геометрии и восемь текстурных модулей. Так что общее количество потоковых CUDA-процессоров достигает 3072 при 192 текстурных блоках, что строго на 50% больше, чем у GM204 (GeForce GTX 980). Еще одно важное улучшение — увеличенная пропускная способность памяти. Работа с внешней памятью организована по шине разрядностью 384 бита. Кэш L3 вырос с 2 МБ до 3 МБ при 96 блоках ROP.
Увеличение всех вычислительных блоков на половину привело к соответствующему росту размеров кристалла. Столь массивный кремниевый чип выдвигает более серьезные требования к организации питания и охлаждения. Но благодаря энергоэффективной архитектуре Maxwell эти параметры вполне сопоставимы с топовыми решениями прошлых поколений. GeForce GTX 980 Ti будет мощнее и горячее GeForce GTX 980, но заявленный TDP в 250 Вт соответствует уровню GeForce GTX 780 Ti.
Полная конфигурация GPU GM200 задействована только в GeForce GTX Titan X. Процессор GeForce GTX 980 Ti лишился двух SMM, т.е. в его активе осталось 2816 потоковых процессоров и 176 текстурных блоков. Кеш, ROP и шина урезанию не подверглись. С самым первым GeForce GTX Titan ситуация была иная. Он вышел со слегка «порезанным» GK110, а потом появился GeForce GTX 780 Ti с большим числом вычислительных блоков и более высокими частотами. Последний GeForce GTX Titan X пока остается вне конкуренции, хотя его рабочие частоты полностью перенял новичок. Базовая частота GPU на уровне 1000 МГц при Boost Clock 1075 МГц. Эффективная частота памяти GDDR5 достигает 7 ГГц.
Видеоадаптер | GeForce GTX Titan X | GeForce GTX 980 Ti | GeForce GTX 980 | GeForce GTX 780 Ti |
Ядро | GM200 | GM200 | GM204 | GK110 |
Количество транзисторов, млн. шт | 8000 | 8000 | 5200 | 7100 |
Техпроцесс, нм | 28 | 28 | 28 | 28 |
Площадь ядра, кв. мм | 601 | 601 | 398 | 561 |
Количество потоковых процессоров | 3072 | 2816 | 2048 | 2880 |
Количество текстурных блоков | 192 | 176 | 128 | 240 |
Количество блоков рендеринга | 96 | 96 | 64 | 48 |
Частота ядра, МГц | 1000–1075 | 1000–1075 | 1126–1216 | 875–926 |
Шина памяти, бит | 386 | 386 | 256 | 384 |
Тип памяти | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
Частота памяти, МГц | 7010 | 7010 | 7010 | 7010 |
Объём памяти, МБ | 12288 | 6144 | 4096 | 3072 |
Поддерживаемая версия DirectX | 12.1 | 12.1 | 12 | 11.1 |
Интерфейс | PCI-E 3.0 | PCI-E 3.0 | PCI-E 3.0 | PCI-E 3.0 |
Мощность, Вт | 250 | 250 | 165 | 250 |
Новые GeForce различаются еще и по объему видеопамяти. У Titan X на борту 12 ГБ памяти, а у GeForce GTX 980 Ti в два раза меньше — 6 ГБ. Это тоже много, но в условиях роста популярности мониторов 4K не лишнее. Топовый продукт должен обеспечивать комфортную производительность и для высокоуровневых мониторов. У GeForce GTX 980 Ti такой потенциал имеется. И именно в разрешении 4K (3840x2160) новинка демонстрирует самый серьезный отрыв от лидеров старых поколений. Наглядно это демонстрирует нижний график, на котором производительность GeForce GTX 980 Ti сравнивается с GeForce GTX 680 и GeForce GTX 780 Ti.
В 4K у новинки почти трехкратное преимущество над GeForce GTX 680. Не менее впечатляюще выглядят цифры при сравнении удельной производительности на ватт мощности. По этому параметру GeForce GTX 980 Ti лучше лидера шестисотой серии в 2,3 раза. Прогресс, как говорится, налицо.
Для работы с высокими разрешениями важен не только объем памяти, но и скорость работы с ней. В Maxwell используется новый алгоритм сжатия данных в кадровом буфере, что обеспечивает дополнительный рост эффективности при одинаковой частоте памяти. Напомним, что 256-битная шина не мешала GeForce GTX 980 демонстрировать производительность выше GeForce GTX 780 Ti с 384-битной шиной (за редкими исключениями).
Видеокарта готова к работе с 4K и по части поддержки современных интерфейсов. В частности стандарта HDMI 2.0 с возможностью передачи изображения 4K при 60 кадрах. Присутствуют разъемы DisplayPort 1.2, поддерживающие передачу 3D-изображения и возможность подключения до нескольких дисплеев 4K через Multi-Stream Transpor.
GeForce GTX 980 Ti обладает полной поддержкой нового DirectX 12. Стоит отметить, что базовые возможности нового API реализованы еще в поколении Fermi. Так что обещанная оптимизация в использовании ресурсов CPU и рост производительности можно ожидать и на старых видеокартах. Новый лидер поддерживает самый полный на данный момент набор инструкций Feature Level 12.1, среди которых conservative raster и raster order views. Все процессоры GM2xx дополнительно поддерживают volume tiled resources, усовершенствованный вариант tiled resources из набора возможностей DirectX 12.0.
Благодаря tiled resources реализуется разбиение двухмерной текстуры на тайлы с возможностью загрузки только необходимых для визуализации тайлов. А в volume tiled resources реализована работа с тайлами на трехмерных объектах.
Благодаря этой функции можно создавать более реалистичные объемные среды, улучшить визуализацию дыма, тумана, жидкости и огня.
Консервативная растеризация более качественная, но и более ресурсоемкая. В качестве наглядного примера приводится сравнительное изображение рендеринга теней в простом режиме и по методу трассировки лучей при сочетании с conservative raster.
Эти и некоторые иные возможности DirectX 12 наглядно показаны в демонстрационном видеоролике:
NVIDIA представлен новый алгоритм реализации глобального освещения VXGI (Voxel Global Illumination). Поддержка этой технологии уже внедрена в Unreal Engine 4, и насладиться возможностями VXGI можно благодаря следующей видеодемонстрации:
Упоминаемые нами в обзоре младшего GeForce GTX 980 новые технологии сглаживания MFAA и DSR поддерживаются и GeForce GTX 980 Ti. Многокадровое сглаживание MFAA является ускоренной вариацией MSAA. Динамическое суперразрешение DSR позволяет осуществлять рендеринг в разрешении выше возможностей рабочего монитора, что обеспечивает повышенную четкость картинки.
Высокая производительность позволит пользователям GeForce GTX 980 Ti насладиться всеми эффектами NVIDIA GameWorks, среди которых продвинутая визуализация динамической шерсти и тканей, интерактивный дым и улучшенная система частиц. Преимущества этих визуальных технологий вы уже могли наблюдать в Far Cry 4, The Witcher 3: Wild Hunt и других игровых хитах. Ближайшей игрой, которая порадует такими дополнительными эффектами, станет Batman: Arkham Knight.
В последнее время наблюдается бум в развитии технологий виртуальной реальности. Первый импульс дали разработчики из компании Oculus VR со своим шлемом Oculus Rift. За ними последовали другие —Sony с Project Morpheus для консоли PlayStation 4 и даже игровая компания Starbreeze со шлемом StarVR. Вывод изображения для системы виртуальной реальности имеет свои особенности. Два дисплея отдельно выводят изображение для каждого глаза. Эффект погружения дополняется специальной оптикой, обеспечивающий необходимый угол зрения. Линза искажает изображение по краям, поэтому картинка должна быть подготовлена и изменена таким образом, чтобы нейтрализовать данный эффект и обеспечить нормальное восприятие изображения глазом.
Изначально изображение выводится в обычном режим, как для простого монитора, но потом ужимается по краям до нужных пропорций. С точки зрения расходования ресурсов — такой вариант не самый эффективный. По краям изображение сжимается очень сильно, по центру остается без изменений, но изначально сцена рендерится с одинаковой четкостью для всех зон. Часть угловых зон первоначального 2D-изображения вообще не попадает в итоговый вариант, и видеокарта просчитывает лишние пиксели.
Поэтому специально для систем виртуальной реальности была разработана технология NVIDIA Multi-Res Shading. Реализована она на базе функции мультипроецирования (multi-projection), которая поддерживается всеми GPU Maxwell GM2xx. Сцена рендерится с учетом разной геометрии при разбиении на несколько проекций. Исходный кадр для VR-режима разбивается на несколько областей с разным качеством рендеринга. В центре сохраняется оригинальное разрешение, в боковых зонах оно уменьшается. В итоге это обеспечивает рост производительности при работе от 1,3 до 2 раз относительно обычного режима формирования изображения.
Программный комплекс GeForce Experience обеспечит простую адаптацию пользователя к VR-режиму благодаря автоматическим настройкам приложений, поддерживающих данную технологию. Программные профили будут появляться в GeForce Experience по мере выхода аппаратных устройств и соответствующих игр. Так что видеокарты GeForce на базе Maxwell станут лучшим выбором для тех, кто готов будет опробовать новое веяние в индустрии развлечений.
Продолжает развитие технология NVIDIA G-Sync. Она обеспечивает полную синхронизацию выводимых кадров с частотой монитора, нейтрализуя эффект подергивания и разрыва кадров для достижения плавной картинки. Теперь такая синхронизация работает и для приложений в оконном режиме. Ряд программных улучшений направлен на компенсацию негативных эффектов при переключении состояния пикселей.
Для работы NVIDIA G-Sync кроме современной видеокарты NVIDIA нужен еще и специальный монитор с соответствующим аппаратным модулем. Ассортимент таких моделей растет. Сейчас уже доступны крупные панели с разрешением до 4K и высокой частотой обновления.
Теперь настало время взглянуть на референсный образец новой видеокарты.
GeForce GTX 980 Ti
Никаких изменений в визуальном стиле новинка не получила. Дизайн идентичен прошлым флагманам.
Видеокарта длиной 27 сантиметров. Кожух серебристого цвета разбавлен черными вставками. Есть прозрачное окошко, через которое виден черный радиатор. Много крупных винтов, которые дополняют общий индустриальный стиль.
Задняя сторона открыта, нет металлической пластины, которая имелась у GeForce GTX 980. Присутствуют два разъема под SLI.
Сбоку имеется большая подсвечиваемая надпись GeForce GTX. Два разъема дополнительного питания размещены в углу — на шесть и восемь контактов.
Задняя панель имеет обильную перфорацию. Интерфейсных разъемов пять: три DisplayPort, один HDMI и один DVI.
Снимем кулер и взглянем на его устройство. На первый взгляд все сопоставимо с референсным охлаждением GeForce GTX 980, отличается только количество и расположение термопрокладок на подошве. Медное основание для контакта с кристаллом GPU имеет никелированное покрытие.
Под кожухом мы тоже не видим ничего нового. Общая конструкция со времен первого Titan не изменилась. Крупное основание накрывает всю плату и отводит тепло от транзисторов и микросхем памяти. Отдельный радиатор устанавливается на GPU.
Над узлом питания на основание напаян дополнительный массив пластин, позволяющий значительно повысить общую площадь рассеивания и эффективность охлаждения силовых элементов. Близкое расположение вентилятора обеспечивает хороший продув этого сегмента радиатора.
Охлаждающий графический процессор радиатор в основании имеет испарительную камеру.
Общая компоновка платы напоминает старые решения, но усилена система питания, больше микросхем памяти.
Ядро запитано от шести фаз на базе интегральных сборок DrMOS, для памяти GDDR5 предусмотрено две фазы. Контроллер питания с дополнительными микросхемами вынесен на небольшую дочернюю плату.
Полная маркировка процессора GM200-310-A1.
Шесть гигабайт памяти набрано 12 микросхемами SKhynix H5GQ4H24MFR R2C.
Стандартная частотная конфигурация GeForce GTX 980 Ti уже была озвучена выше: базовая частота ядра 1000 МГц при Boost Clock 1075 МГц, частота памяти — 7012 МГц.
ASIC Quality данного экземпляра 71,3%.
Пиковое значение Boost у GeForce GTX 980 Ti может достигать 1200 МГц. Итоговая же частота определяется ограничениями, в рамках которых работает GPU Boost 2.0. Есть определенные лимиты по мощности и температуре ядра. При достижении этих значений начинается постепенный сброс частот вплоть до базового уровня, чтобы удержаться в заданных рамках. В случае с топовыми решениями основным ограничителем становится нагрев. Максимальные температуры достигаются быстрее, чем максимальное значение по мощности. Этот фактор обуславливает и определенную зависимость итоговой производительности от температуры окружающей среды. В помещении без кондиционера летним знойным днем можно получить частоту близкую к базовой, а в более щадящих условиях частоты могут превышать заявленный Boost Clock.
Мы тестировали видеокарту в открытом корпусе при 25 °C внутри помещения. При таких условиях наблюдалось постоянное изменение частоты ядра. Во время длительного теста Metro: Last Light основной диапазон частот укладывался в рамки 1075–1151 МГц, хотя не обошлось без просадок до 1000 МГц. Это иллюстрирует нижний левый скриншот. На правом скриншоте вы можете наблюдать кривую частоты в Battlefield 4 и Far Cry 4, причем во втором случае линия ровнее, и просадки не столь существенные. В Far Cry 4 можно говорить о средней частоте в 1,11 ГГц с отклонениями в большую сторону и с очень редкими отклонениями в меньшую. В Battlefield 4 минимальные значения достигали 1013 МГц при максимальном Boost на уровне пиковых значений.
При Temperature Limit 83 °C пиковая температура достигала уровня 84 °C. Вентилятор раскручивался до 2500 об/мин. Шум средний. Для стандартного охлаждения с одним вентилятором — весьма неплохо. Напомним, что более слабое по уровню производительности предложение от AMD в лице Radeon R9 290X греется свыше 90 °C при очень высоких оборотах и шуме.
Результаты разгона не сильно отличаются от показателей младших версий GeForce GTX 980, немного уступая по итоговым частотам ядра. Наш экземпляр смог работать на базовой частоте 1260 МГц при пиковом Boost 1462 МГц. Память стабильно работала на частотах вплоть до 7920 МГц.
Лимит мощности был повышен до предела (+10% к начальному уровню). Этого оказалось мало для стабилизации частоты на максимальном уровне, хотя в большинстве приложений частота ядра была близкой к максимальному уровню. В Metro были снижения вплоть до 1367 МГц. В Battlefield 4 частоты повыше, хотя минимум в 1380–1400 МГц тоже фиксировался. В Far Cry 4 частота держалась на уровне 1462–1450 МГц с редкими отклонениями до 1441 МГц. То есть относительно начального уровня частот прирост может достигать 30% и выше. Рост частоты памяти 13%.
Для поддержания стабильности в таком режиме пришлось существенно поднимать скорость вентилятора. И даже в очень шумном режиме после длительной эксплуатации возникло пару сбоев, которые потребовали небольшого охлаждения и дальнейшего ускорения вентилятора. Так что с родной «турбиной» о серьезном разгоне можно забыть, для него понадобится замена охлаждения. Или сразу стоит подумать о топовых модификациях GeForce GTX 980 Ti с альтернативным охлаждением, которые вскоре последуют на рынок за референсным первопроходцем. Отметим еще, что на видеокарте доступен софтвольтмод. Нами он не использовался по вполне очевидным причинам — недостаточный запас для дальнейшего повышения лимита мощности, высокий нагрев даже при стандартных напряжениях.