В соответствии с маркировкой новый GPU GM204 станет заменой GK104, но при этом представленные графические решения призваны сменить GeForce GTX 780 и GeForce GTX 780 Ti, которые базируются на GK110. Так что не исключен вариант появления в будущем и какого-то GM210 в рамках последующей серии. Нынешние решения вызывают еще вопрос по поводу своей принадлежности к девятисотой серии, ведь представителей восьмисотой серии в настольном сегменте не было. Однако такие видеокарты были в сегменте графики для ноутбуков. У нас не так давно как раз был обзор топового решения с GeForce GTX 880M. Очевидно, что переход сразу к серии GTX 900 связан с поддержанием последовательной нумерации мобильных видеокарт.
GM204 напоминает усложненную версию GM107. Процессор насчитывает четыре графических кластера GPC по четыре крупных мультипроцессорных блока SMM в каждом. У GM107 был один кластер на пять SMM. GK104 насчитывал четыре кластера по два мультипроцессора SMX в каждом.
SMM оперирует 128 потоковыми процессорами (CUDA cores), сгруппированными в четыре массива обработки данных, каждый из которых имеет свою управляющую логику со своими планировщиками, диспетчерами, регистрами и внутренним буфером инструкций. Внутри SMM общими являются текстурные модули (в количестве 8 штук) с выделенным текстурным кэшем. Есть общее хранилище данных на 96 КБ. Обработка геометрии осуществляется движком Polymorph Engine.
Аналогичные блоки обработки геометрии присутствовали у GPU Kepler. У GK104 их было лишь 8, а у GK110 уже 15. Одно это сравнение говорит о возросшем потенциале в обработке сложной геометрии и тесселяции, которая заметно бьет по итоговой производительности в DirectX 11. По этому критерию обещано преимущество в два-три раза при сравнении вычислительного потенциала GM204 и GK104. Общее количество потоковых процессоров составляет 2048, что меньше количества вычислительных блоков у GeForce GTX 780 и GeForce GTX 780 Ti. Но в данном случае реализована другая организация этих вычислительных единиц внутри GPU с более гибким распределением задач. Текстурных блоков 128, что соответствует их числу у старого GK104, но против 240 блоков у GeForce GTX 780 Ti маловато.
На стороне новинок высокие тактовые частоты. Старший видеоадаптер GeForce GTX 980 работает при базовой частоте 1126 МГц и Boost Clock 1216 МГц. Это рекордные показатели для нынешних видеокарт.
GeForce GTX 970 от старшего брата отличается по частотам и количеству вычислительных блоков. У него отключены три SMM, поэтому потоковых процессоров только 1664, а текстурных блоков 104. Базовая частота понижена до 1051 МГц при Boost Clock 1178 МГц, что тоже заметно выше частот нынешних флагманов. Отметим еще, что указанная частота Boost является средним значением. В зависимости от условий эксплуатации и нагрузки она может быть выше или меньше. Сама технология GPU Boost корректирует частоты так, чтобы не выйти за определенные лимиты по мощности и температуре. С учетом энергоэффективности нового GPU в игровом режиме можно ожидать заметно более высоких значений Boost относительно указанных значений. Так что частотное преимущество относительно старых решений будет даже выше, чем при сравнении официальных данных по базовой частоте.
GM204 оснащен скоростным кэшем L2 объемом в 2 МБ. Количество блоков ROP возросло до 64. А вот работа с внешней памятью реализована через четыре 64-битных контроллера, т.е. общая разрядность шины составляет 256 бит. На фоне существующих флагманов с 384-битной шиной это выглядит узким местом. Частично компенсируется архитектурными улучшениями в подсистеме передачи данных. Используется новый метод сжатия данных в буфере кадра. А эффективная частота памяти GDDR5 установлена на высоком значении в 7010 МГц. По внутренним тестам компании NVIDIA эффективность ПСП у GeForce GTX 980 на 17–28% выше чем у GeForce GTX 680 (в зависимости от приложения). При этом частота памяти у новинки выше лишь на 16,7%.
Компания делает акцент на том, что новые решения проектировались с прицелом на разрешения выше стандарта Full HD. Поэтому новые GeForce GTX 980 и GeForce GTX 970 оснащены внушительным объемом памяти в 4 ГБ. С этой же целью их оснастили интерфейсом HDMI нового стандарта 2.0, который поддерживает передачу данных в разрешении 4K при частоте 60 Гц. При подключении по DisplayPort через Multi-Stream Transport возможен вывод изображения на четыре дисплея 4K. Сам же видеоадаптер умеет работать с еще большим разрешением 5120x3200 при 60 Гц.
Видеоадаптер | GeForce GTX 980 | GeForce GTX 970 | GeForce GTX 780 Ti | GeForce GTX 780 | GeForce GTX 770 |
Ядро | GM204 | GM204 | GK110 | GK110 | GK104 |
Количество транзисторов, млн. шт | 5200 | 5200 | 7100 | 7100 | 3500 |
Техпроцесс, нм | 28 | 28 | 28 | 28 | 28 |
Площадь ядра, кв. мм | 398 | 398 | 561 | 561 | 294 |
Количество потоковых процессоров | 2048 | 1664 | 2880 | 2304 | 1536 |
Количество текстурных блоков | 128 | 104 | 240 | 192 | 128 |
Количество блоков рендеринга | 64 | 64 | 48 | 48 | 32 |
Базовая частота ядра, МГц | 1126 | 1051 | 875 | 863 | 1045 |
Boost Clock, МГц | 1216 | 1178 | 926 | 900 | 1085 |
Шина памяти, бит | 256 | 256 | 384 | 384 | 256 |
Тип памяти | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
Частота памяти, МГц | 7010 | 7010 | 7010 | 6008 | 7010 |
Объём памяти, МБ | 4096 | 4096 | 3072 | 3072 | 2048 |
Поддерживаемая версия DirectX | 12 | 12 | 11.1 | 11.1 | 11.1 |
Интерфейс | PCI-E 3.0 | PCI-E 3.0 | PCI-E 3.0 | PCI-E 3.0 | PCI-E 3.0 |
Уровень TDP, Вт | 165 | 145 | 250 | 250 | 230 |
Серьезное преимущество новинок — низкое энергопотребление и нагрев. Заявленные значения в 165 и 145 Вт являются привычными для решений среднего уровня. Топовые графические ускорители с таким TDP выглядят очень привлекательно. По соотношению производительность на единицу мощности NVIDIA обещает для GeForce GTX 980 двукратный рост относительно GeForce GTX 680.
Среди нововведений в Maxwell — поддержка новой технологий просчета освещения и новые методы полноэкранного сглаживания. В играх уже давно используются разные алгоритмы моделирования глобального освещения. Среди них один из последних методов HBAO+, который изначально был разработан тоже NVIDIA. Но все они в той или иной степени лишь симулируют сложное отражение света от объектов. Воссоздать реалистичную картину с взаимным влиянием отраженного света от разных поверхностей, формирующим сложную картину бликов и теней, современным видеокартам пока не по силам. Новый алгоритм VXGI (Voxel Global Illumination) поднимает данную технологию на качественно новый уровень. 3D-сцена разбивается на отдельные воксели, для каждого из которых идет просчет отраженного света с учетом множества параметров. На выходе получается изображение приближенное к кинематографичному уровню.
Сцена с простыми геометрическими фигурами может быть еще более наглядной. На нижнем изображении отлично видно сложное взаимовлияние света, отраженного от поверхности цветных фигур.
VXGI позволяет моделировать сложное преломление и рассеяние света с отражениями в реальном времени при динамическом изменении параметров геометрии и освещения. Очень перспективная технология. На данный момент ее поддержка уже внедрена в движок Unreal Engine 4. Учитывая популярность прошлой версии движка, можно ожидать самого широкого применения VXGI в ближайшем будущем.
Одним из новых представленных методов сглаживания называется DSR (Dynamic Super Resolution). Работает он так — изображение рендерится в более высоком разрешении, а потом выводится с масштабированием до разрешения экрана. По сути ничего нового в этом нет. Уже год, как Battlefield 4 предлагает похожий метод, позволяя регулировать уровень масштабируемости от 100 до 200%. Такой метод в сравнении с обычным просчетом субпикселей очень ресурсоемкий. В упомянутом Battlefield производительность падает кардинально.
Пример сглаживания краев объектов при помощи DSR изображен ниже (правая часть изображения).
DSR может работать совместно с любым обычным методом сглаживания и в любом игровом приложении. Можно автоматически запускать это сглаживание через приложение GeForce Experience.
Другой метод сглаживания MFAA (Multi-Frame Antialiasing) является новой вариацией MSAA, используя вместо фиксированного гибкий метод выбора сэмплов. Позиции выборок меняются так, чтобы из соседних кадров формировалась итоговая выборка идентичная стандартному 4x MSAA. В итоге 4x MFAA дает изображение максимально близкое к 4x MSAA, но на 30% быстрее.
Не забыт метод сглаживания TXAA, который поддерживают все ближайшие проекты от Ubisoft. Продолжается развитие технологий симуляции физических эффектов. В играх Batman: Arkham Knight и Project CARS мы увидим привычную систему частиц и симуляцию турбулентности, реализованную с помощью NVIDIA PhysX. В Far Cry 4 будет реалистичная имитация шерсти животных, реализованная при помощи технологии NVIDIA Hairworks.
В этой же игре будет поддержка HBAO+, TXAA и продвинутая симуляции солнечных лучей. Мягкие тени будут реализованы по технологии PCSS (Percentage-Closer Soft Shadows). Особенностью визуализации таких реалистичных теней являются регулируемые параметры размытия в зависимости от расстояния до них. PCSS еще будет реализовано в Assasin's Creed: Unity.
Новая часть Assasin's Creed обещает порадовать и широким применением тесселяции, которая будет повсеместно задействована для улучшения геометрии и объема элементов окружения — от брусчатки и черепицы до барельефов и статуй.
Еще один важный проект, который обещает поразить красивой картинкой — перенесенный на следующий год The Witcher 3: Wild Hunt. В игре будет широкое применение PhysX не только для увеличения количества частиц, но и для симуляции более реалистичных разрушений и визуализации тканей. Отображение пышной шевелюры героя будет осуществляться при помощи технологии HairWorks — ответ на AMD TressFX.
Некоторые визуальные эффекты PhysX реализованы в Warface. В популярную многопользовательскую игру War Thunder обещают добавить продвинутую систему разрушений самолетов с использованием PhysX и симуляцию воды на базе технологии WaveWorks.
Представлена технология Turf Effect, которая позволяет визуализировать реалистичную динамическую траву с достоверной физикой. Практической реализации пока нет.
Кроме вполне ожидаемой поддержки всех спецификаций DirectX 11.2 новинки получили поддержку новых возможностей DirectX 12.
Что касается технической реализации конечных продуктов, то за основу взят дизайн плат от GeForce GTX 780/780 Ti, но с некоторым упрощением системы питания. Система охлаждения тоже позаимствована у старых флагманов. Если они пристойно справлялись с горячим GK110, то GM204 легко охладят и при более низких оборотах и шуме.
Наше практическое знакомство с новой серией начнется с младшего GeForce GTX 970 в исполнении MSI. В ближайшее время выйдет обзор и по GeForce GTX 980.