Внедрение архитектуры Maxwell компания NVIDIA начала в сегменте бюджетных решений с выпуском GeForce GTX 750 Ti и GeForce GTX 750, которые удачно проявили себя на фоне предшественников. Эти графические решения продемонстрировали отличное сочетание производительности и энергоэффективности без перехода на новый техпроцесс. Такой старт укрепил уверенность в потенциале новых флагманов, на счет которых ранее не было особого оптимизма. Переход на 20-нм техпроцесс производства задержался, а нынешнее поколение графических процессоров уже достигло того предела, когда вопрос охлаждения стал краеугольным камнем. Maxwell изменил все. Представленные сегодня видеокарты GeForce GTX 980 и GeForce GTX 970 вновь это продемонстрировали.

NVIDIA GeForce GTX 970

В соответствии с маркировкой новый GPU GM204 станет заменой GK104, но при этом представленные графические решения призваны сменить GeForce GTX 780 и GeForce GTX 780 Ti, которые базируются на GK110. Так что не исключен вариант появления в будущем и какого-то GM210 в рамках последующей серии. Нынешние решения вызывают еще вопрос по поводу своей принадлежности к девятисотой серии, ведь представителей восьмисотой серии в настольном сегменте не было. Однако такие видеокарты были в сегменте графики для ноутбуков. У нас не так давно как раз был обзор топового решения с GeForce GTX 880M. Очевидно, что переход сразу к серии GTX 900 связан с поддержанием последовательной нумерации мобильных видеокарт.

GM204 напоминает усложненную версию GM107. Процессор насчитывает четыре графических кластера GPC по четыре крупных мультипроцессорных блока SMM в каждом. У GM107 был один кластер на пять SMM. GK104 насчитывал четыре кластера по два мультипроцессора SMX в каждом.

NVIDIA GeForce GTX 970

SMM оперирует 128 потоковыми процессорами (CUDA cores), сгруппированными в четыре массива обработки данных, каждый из которых имеет свою управляющую логику со своими планировщиками, диспетчерами, регистрами и внутренним буфером инструкций. Внутри SMM общими являются текстурные модули (в количестве 8 штук) с выделенным текстурным кэшем. Есть общее хранилище данных на 96 КБ. Обработка геометрии осуществляется движком Polymorph Engine.

NVIDIA GeForce GTX 970

Аналогичные блоки обработки геометрии присутствовали у GPU Kepler. У GK104 их было лишь 8, а у GK110 уже 15. Одно это сравнение говорит о возросшем потенциале в обработке сложной геометрии и тесселяции, которая заметно бьет по итоговой производительности в DirectX 11. По этому критерию обещано преимущество в два-три раза при сравнении вычислительного потенциала GM204 и GK104. Общее количество потоковых процессоров составляет 2048, что меньше количества вычислительных блоков у GeForce GTX 780 и GeForce GTX 780 Ti. Но в данном случае реализована другая организация этих вычислительных единиц внутри GPU с более гибким распределением задач. Текстурных блоков 128, что соответствует их числу у старого GK104, но против 240 блоков у GeForce GTX 780 Ti маловато.

На стороне новинок высокие тактовые частоты. Старший видеоадаптер GeForce GTX 980 работает при базовой частоте 1126 МГц и Boost Clock 1216 МГц. Это рекордные показатели для нынешних видеокарт.

GeForce GTX 970 от старшего брата отличается по частотам и количеству вычислительных блоков. У него отключены три SMM, поэтому потоковых процессоров только 1664, а текстурных блоков 104. Базовая частота понижена до 1051 МГц при Boost Clock 1178 МГц, что тоже заметно выше частот нынешних флагманов. Отметим еще, что указанная частота Boost является средним значением. В зависимости от условий эксплуатации и нагрузки она может быть выше или меньше. Сама технология GPU Boost корректирует частоты так, чтобы не выйти за определенные лимиты по мощности и температуре. С учетом энергоэффективности нового GPU в игровом режиме можно ожидать заметно более высоких значений Boost относительно указанных значений. Так что частотное преимущество относительно старых решений будет даже выше, чем при сравнении официальных данных по базовой частоте.

GM204 оснащен скоростным кэшем L2 объемом в 2 МБ. Количество блоков ROP возросло до 64. А вот работа с внешней памятью реализована через четыре 64-битных контроллера, т.е. общая разрядность шины составляет 256 бит. На фоне существующих флагманов с 384-битной шиной это выглядит узким местом. Частично компенсируется архитектурными улучшениями в подсистеме передачи данных. Используется новый метод сжатия данных в буфере кадра. А эффективная частота памяти GDDR5 установлена на высоком значении в 7010 МГц. По внутренним тестам компании NVIDIA эффективность ПСП у GeForce GTX 980 на 17–28% выше чем у GeForce GTX 680 (в зависимости от приложения). При этом частота памяти у новинки выше лишь на 16,7%.

Компания делает акцент на том, что новые решения проектировались с прицелом на разрешения выше стандарта Full HD. Поэтому новые GeForce GTX 980 и GeForce GTX 970 оснащены внушительным объемом памяти в 4 ГБ. С этой же целью их оснастили интерфейсом HDMI нового стандарта 2.0, который поддерживает передачу данных в разрешении 4K при частоте 60 Гц. При подключении по DisplayPort через Multi-Stream Transport возможен вывод изображения на четыре дисплея 4K. Сам же видеоадаптер умеет работать с еще большим разрешением 5120x3200 при 60 Гц.

Видеоадаптер GeForce GTX 980 GeForce GTX 970 GeForce GTX 780 Ti GeForce GTX 780 GeForce GTX 770
Ядро GM204 GM204 GK110 GK110 GK104
Количество транзисторов, млн. шт 5200 5200 7100 7100 3500
Техпроцесс, нм 28 28 28 28 28
Площадь ядра, кв. мм 398 398 561 561 294
Количество потоковых процессоров 2048 1664 2880 2304 1536
Количество текстурных блоков 128 104 240 192 128
Количество блоков рендеринга 64 64 48 48 32
Базовая частота ядра, МГц 1126 1051 875 863 1045
Boost Clock, МГц 1216 1178 926 900 1085
Шина памяти, бит 256 256 384 384 256
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Частота памяти, МГц 7010 7010 7010 6008 7010
Объём памяти, МБ 4096 4096 3072 3072 2048
Поддерживаемая версия DirectX 12 12 11.1 11.1 11.1
Интерфейс PCI-E 3.0 PCI-E 3.0 PCI-E 3.0 PCI-E 3.0 PCI-E 3.0
Уровень TDP, Вт 165 145 250 250 230

Серьезное преимущество новинок — низкое энергопотребление и нагрев. Заявленные значения в 165 и 145 Вт являются привычными для решений среднего уровня. Топовые графические ускорители с таким TDP выглядят очень привлекательно. По соотношению производительность на единицу мощности NVIDIA обещает для GeForce GTX 980 двукратный рост относительно GeForce GTX 680.

Среди нововведений в Maxwell — поддержка новой технологий просчета освещения и новые методы полноэкранного сглаживания. В играх уже давно используются разные алгоритмы моделирования глобального освещения. Среди них один из последних методов HBAO+, который изначально был разработан тоже NVIDIA. Но все они в той или иной степени лишь симулируют сложное отражение света от объектов. Воссоздать реалистичную картину с взаимным влиянием отраженного света от разных поверхностей, формирующим сложную картину бликов и теней, современным видеокартам пока не по силам. Новый алгоритм VXGI (Voxel Global Illumination) поднимает данную технологию на качественно новый уровень. 3D-сцена разбивается на отдельные воксели, для каждого из которых идет просчет отраженного света с учетом множества параметров. На выходе получается изображение приближенное к кинематографичному уровню.

NVIDIA GeForce GTX 970

NVIDIA GeForce GTX 970

Сцена с простыми геометрическими фигурами может быть еще более наглядной. На нижнем изображении отлично видно сложное взаимовлияние света, отраженного от поверхности цветных фигур.

NVIDIA GeForce GTX 970

VXGI позволяет моделировать сложное преломление и рассеяние света с отражениями в реальном времени при динамическом изменении параметров геометрии и освещения. Очень перспективная технология. На данный момент ее поддержка уже внедрена в движок Unreal Engine 4. Учитывая популярность прошлой версии движка, можно ожидать самого широкого применения VXGI в ближайшем будущем.

Одним из новых представленных методов сглаживания называется DSR (Dynamic Super Resolution). Работает он так — изображение рендерится в более высоком разрешении, а потом выводится с масштабированием до разрешения экрана. По сути ничего нового в этом нет. Уже год, как Battlefield 4 предлагает похожий метод, позволяя регулировать уровень масштабируемости от 100 до 200%. Такой метод в сравнении с обычным просчетом субпикселей очень ресурсоемкий. В упомянутом Battlefield производительность падает кардинально.

Пример сглаживания краев объектов при помощи DSR изображен ниже (правая часть изображения).

NVIDIA GeForce GTX 970

DSR может работать совместно с любым обычным методом сглаживания и в любом игровом приложении. Можно автоматически запускать это сглаживание через приложение GeForce Experience.

Другой метод сглаживания MFAA (Multi-Frame Antialiasing) является новой вариацией MSAA, используя вместо фиксированного гибкий метод выбора сэмплов. Позиции выборок меняются так, чтобы из соседних кадров формировалась итоговая выборка идентичная стандартному 4x MSAA. В итоге 4x MFAA дает изображение максимально близкое к 4x MSAA, но на 30% быстрее.

NVIDIA GeForce GTX 970

Не забыт метод сглаживания TXAA, который поддерживают все ближайшие проекты от Ubisoft. Продолжается развитие технологий симуляции физических эффектов. В играх Batman: Arkham Knight и Project CARS мы увидим привычную систему частиц и симуляцию турбулентности, реализованную с помощью NVIDIA PhysX. В Far Cry 4 будет реалистичная имитация шерсти животных, реализованная при помощи технологии NVIDIA Hairworks.

NVIDIA GeForce GTX 970

В этой же игре будет поддержка HBAO+, TXAA и продвинутая симуляции солнечных лучей. Мягкие тени будут реализованы по технологии PCSS (Percentage-Closer Soft Shadows). Особенностью визуализации таких реалистичных теней являются регулируемые параметры размытия в зависимости от расстояния до них. PCSS еще будет реализовано в Assasin's Creed: Unity.

NVIDIA GeForce GTX 970

Новая часть Assasin's Creed обещает порадовать и широким применением тесселяции, которая будет повсеместно задействована для улучшения геометрии и объема элементов окружения — от брусчатки и черепицы до барельефов и статуй.

NVIDIA GeForce GTX 970

Еще один важный проект, который обещает поразить красивой картинкой — перенесенный на следующий год The Witcher 3: Wild Hunt. В игре будет широкое применение PhysX не только для увеличения количества частиц, но и для симуляции более реалистичных разрушений и визуализации тканей. Отображение пышной шевелюры героя будет осуществляться при помощи технологии HairWorks — ответ на AMD TressFX.

NVIDIA GeForce GTX 970

Некоторые визуальные эффекты PhysX реализованы в Warface. В популярную многопользовательскую игру War Thunder обещают добавить продвинутую систему разрушений самолетов с использованием PhysX и симуляцию воды на базе технологии WaveWorks.

Представлена технология Turf Effect, которая позволяет визуализировать реалистичную динамическую траву с достоверной физикой. Практической реализации пока нет.

Кроме вполне ожидаемой поддержки всех спецификаций DirectX 11.2 новинки получили поддержку новых возможностей DirectX 12.

Что касается технической реализации конечных продуктов, то за основу взят дизайн плат от GeForce GTX 780/780 Ti, но с некоторым упрощением системы питания. Система охлаждения тоже позаимствована у старых флагманов. Если они пристойно справлялись с горячим GK110, то GM204 легко охладят и при более низких оборотах и шуме.

NVIDIA GeForce GTX 970

Наше практическое знакомство с новой серией начнется с младшего GeForce GTX 970 в исполнении MSI. В ближайшее время выйдет обзор и по GeForce GTX 980.