Компания NVIDIA продолжает покорять новые вершины графической производительности. AMD все никак не созреет с выпуском Radeon Vega для сегмента старших решений, которые могли бы составить конкуренцию прошлогодним «зеленым» флагманам, а тут уже новые видеоадаптеры NVIDIA спешат опустошить кошельки энтузиастов. Последними громкими премьерами стали видеоускорители GeForce GTX 1080 Ti и Titan Xp. Второй является эксклюзивным продуктом с малым тиражом и крайне высокой ценой. А вот GeForce GTX 1080 Ti станет новым флагманом массовых серийных моделей, который значительно поднимает планку производительности. О нем и поговорим в данной статье.
GeForce GTX 1080 Ti базируется на графическом процессоре GP102, построенном на архитектуре Pascal. Этот чип ранее стал основой для сверхмощного решения Titan X (Pascal), а недавно вышел еще более быстрый Titan Xp. Процессор GP102 насчитывает шесть графических кластеров по пять мультипроцессоров SM вместо четырех кластеров у GP104 (GeForce GTX 1080). Внутренняя структура кластеров абсолютно идентична, подробно она разобрана в отдельном обзоре архитектуры Pascal.
В полной конфигурации GP102 насчитывает 3840 потоковых процессоров CUDA и 240 текстурных блоков. Пропускная способность памяти увеличена до 384 бит благодаря 12 контроллерам памяти. Кристалл производится базе 16-нм техпроцесса и насчитывает 12 миллиардов транзисторов. Возможно, из-за столь сложной структуры первые Titan X на базе GP102 получили неполную конфигурацию с 3584 ядрами и 224 текстурными блоками. Аналогичная конфигурация и у нового серийного флагмана GeForce GTX 1080 Ti. Также в активе новичка 88 блоков ROP при 2,8 МБ кэш-памяти L2 (у GP104 лишь 2 МБ). Гибкая структура новой системы памяти позволила достичь необычной конфигурации шины общей разрядностью в 352 бита, из-за чего объем памяти у видеокарты 11 ГБ. Таким образом, сохраняется некое преимущество Titan X, в активе которого 12 ГБ. Впрочем, для рядового игрока даже 11 ГБ хватит с головой для самых современных игр. При этом память у GeForce GTX 1080 Ti работает на рекордной частоте в 11 ГГц.
После выпуска GeForce GTX 1080 Ti компания NVIDIA представила и полный вариант GP102 в лице Titan Xp. GeForce GTX 1080 Ti идентичен Titan Xp по конфигурации рабочих частот. Базовое значение GPU в 1480 МГц обеспечивается даже в самых экстремальных условиях эксплуатации. Технология GPU Boost повышает частоту ядра, пока не превышены лимиты по мощности и температуре. Среднее значение Boost 1582 МГц, но максимум традиционно выше.
Сравнить все актуальные решения на базе GP102 с их предшественниками можно по нижней таблице.
Видеоадаптер | Titan Xp | Titan X | GeForce GTX 1080 Ti | GeForce GTX 1080 | GeForce GTX 980 Ti |
---|---|---|---|---|---|
Ядро | GP102 | GP102 | GP102 | GP104 | GM200 |
Количество транзисторов, млн. шт | 12000 | 12000 | 12000 | 7200 | 8000 |
Техпроцесс, нм | 16 | 16 | 16 | 16 | 28 |
Площадь ядра, кв. мм | 471 | 471 | 471 | 314 | 601 |
Количество потоковых процессоров | 3840 | 3584 | 3584 | 2560 | 2816 |
Количество текстурных блоков | 240 | 224 | 224 | 160 | 176 |
Количество блоков рендеринга | 96 | 96 | 88 | 64 | 96 |
Частота ядра, МГц | 1480–1582 | 1417–1531 | 1480–1582 | 1607–1733 | 1000–1075 |
Шина памяти, бит | 384 | 384 | 352 | 256 | 386 |
Тип памяти | GDDR5X | GDDR5X | GDDR5X | GDDR5X | GDDR5 |
Частота памяти, МГц | 11008 | 10008 | 11008 | 10010 | 7010 |
Объём памяти, МБ | 12288 | 12288 | 11264 | 8192 | 6144 |
Поддерживаемая версия DirectX | 12.1 | 12.1 | 12.1 | 12.1 | 12 |
Интерфейс | PCI-E 3.0 | PCI-E 3.0 | PCI-E 3.0 | PCI-E 3.0 | PCI-E 3.0 |
Мощность, Вт | 250 | 250 | 250 | 180 | 250 |
GeForce GTX 1080 Ti сочетает все преимущества архитектуры Pascal и поддерживает технологии, которые актуальны и для GeForce GTX 1080. Среди них высокая эффективность ПСП благодаря прогрессивным методам сжатия данных в буфере кадра. Также определенное преимущество дает тайловое кеширование, когда изображение разбивается на фрагменты (тайлы), что позволяет оптимизировать обработку геометрии и пикселей для каждого тайла. Этот метод позволяет эффективнее использовать ресурсы кэша L2, снижая нагрузку на внешнюю память.
И все это сочетается с 352-битной шиной и рекордной частотой микросхем GDDR5X. При физической пропускной способности 484 ГБ/с теоретическая пиковая может достигать 1,2 ТБ/с. Впрочем, эффективность дополнительных улучшений серьезно зависит от каждого конкретного приложения.
Решения NVIDIA хорошо оптимизированы для работы в среде DirectX 11, что обеспечивается многолетней поддержкой со стороны инженеров и программистов. Благодаря наличию удобного инструментария этот API еще остается основным для многих игровых разработчиков. DirectX 12 дает больше возможностей для контроля ресурсов GPU, позволяет лучше использовать многопоточные возможности процессоров и более эффективно выполнять комбинированные операции, сочетая графические и другие вычисления, в том числе благодаря Async Compute. Решения NVIDIA поколения Pascal в полной мере поддерживают все возможности нового API на аппаратном уровне, включая перспективные асинхронные вычисления. Но внедрение DirectX 12 требует больше затрат со стороны разработчиков, а польза от этого пока небольшая. Многие игры получают какое-то преимущество в производительности от DirectX 12 лишь спустя несколько месяцев с момента релиза после серии обновлений. Примером этому являются Rise of The Tomb Raider, Deus Ex: Mankind Divided и сезонный Hitman. И это удачные примеры, ведь иногда DirectX 12 привносит лишь падение fps и ничего более.
NVIDIA старается улучшить ситуацию, обеспечивая программную поддержку своих продуктов и внедряя новые инструменты разработчиков для отладки кода. Недавно компания Microsoft представила утилиту PIX для отладки под DirectX 12, а NVIDIA предлагает nSight Visual Studio Edition 5.3 и NVIDIA Aftermat. Эти программы помогут разработчикам в работе с DirectX 12 при поиске и устранении ошибок.
Ситуация с программной поддержкой тоже постоянно улучшается. Вместе со стартом GeForce GTX 1080 Ti выпущен новый драйвер, который серьезно ускоряет ряд игр под DirectX 12. И доработка драйверов позволила добиться заметного ускорения в упомянутых уже Rise of The Tomb Raider, Hitman и других играх.
Также компания расширяет возможности применения эффектов GameWorks, внедряя и для них поддержку нового DirectX 12. Данная инициатива основа на инструментарии готовых графических технологий и эффектов, которые просты в интеграции и позволяют улучшить визуальное исполнение игры. Поддержка NVIDIA GameWorks присутствует во многих современных играх, отдельные технологии поддерживаются в последних версиях движков Unreal Engine, Unity и Amazon Lumberyard.
Широкое применение нашла технология фонового затенения HBAO+, которая дает более качественную и проработанную картинку относительно SSAO и других алгоритмов. Отлично показала себя технология симуляции объемного освещения Volumetric Lighting. Именно такое освещение вы наблюдали в Fallout 4, также в эту игру уже интегрирована поддержка HBAO+ и физические эффекты с осколками на базе Flex.
Еще одним примером GameWorks является технология HairWorks, которая позволяет симулировать сложный волосяной покров и шерсть. Технология активно применялась в The Witcher 3: Wild Hunt. Теперь HairWorks работает под DirectX 12, и вскоре мы можем увидеть новые игры с аналогичными эффектами.
Среди новых эффектов нужно выделить Turf Effects для симуляции сложной травы с раздельной геометрией травинок.
Технология применяется в Tom Clancy's Ghost Recon: Wildlands. Сама игра демонстрирует отличную картинку и поддерживает много других технологий NVIDIA. Подробнее о технологических возможностях Ghost Recon: Wildlands с демонстрацией эффектов GameWorks в специальном видео:
Симуляция различных динамических сред является сложной задачей, которую позволяют решить разные инструменты GameWorks. Динамически изменяющуюся в реальном времени воду можно реализовать на базе WaveWorks, технология Flex позволяет моделировать поведение рассыпчатых твердых тел, Flow симулирует потоки и газы, Blast можно использовать для разрушаемых объектов, NvCloth позволит реализовать реалистичные ткани.
Большинство техник работает под DirectX 12, включая перспективные Flex и Flow. В качестве примера реализации Flow приведем небольшое техническое видео с демонстрацией новой технологии.
Оптимизация под новый API включает поддержку асинхронных вычислений, что позволяет GPU более эффективно просчитывать такие эффекты и получить реальное ускорение на новых видеокартах. И по оценке специалистов NVIDIA поддержка Async Compute обеспечивает двукратное ускорение просчета эффектов Flex на том же GeForce GTX 1080.
Новые GameWorks поддерживают DirectCompute и работают на любых графических устройствах. Так что вы можете играть с новыми эффектами и на видеокартах от AMD. Впрочем, и на нынешний момент почти все эффекты работают на Radeon.
Новой сферой применения GPU стали нейронные сети в системах искусственного интеллекта. В частности, NVIDIA активно работает в сфере устройств искусственного интеллекта для беспилотных автомобилей. Но есть определенная практическая польза и для обычных пользователей ПК. На базе самообучающихся нейронных сетей реализованы технологии распознавания лиц и прогрессивные методы масштабирования изображения.
Обрастает новыми возможностями программный комплекс GeForce Experience, который позволяет автоматически оптимизировать настройки игр под вашу видеокарту, обновлять драйверы и использовать дополнительные функции.
Частью этих функций является захват видео при помощи ShadowPlay. Кодировкой занимается встроенный видеоблок в GPU, падения производительности в игре практически отсутствует, качество видео на выходе очень высокое, поддерживается разрешение 4K. А новое расширение ShadowPlay Highlights упростит захват ярких моментов. Программа автоматически отслеживает активность игрока и записывает самые насыщенные игровые эпизоды.
Невероятные возможности дает игрокам Ansel. Приложение позволяет создавать скриншоты с необычных ракурсов благодаря свободной камере, применять цветовые фильтры, создавать панорамные картинки и увеличивать разрешение конечного изображения.
Возможности Ansel понравились игрокам. Отмечается, что пользователи сделали уже более 200 тысяч скриншотов в The Witcher 3 при помощи Ansel.
Кроме указанной игры Ansel поддерживается в War Thunder, Wathc Dogs 2, Dishonored 2, Mass Effect: Andromeda и многих других играх. SDK доступен в публичном доступе, так что интегрировать Ansel в свой проект может каждый разработчик.
Виртуальная реальность VR является одним из интенсивно развивающихся направлений. Системы VR нашли применение не только в развлекательной индустрии, но и в специализированных задачах. В статье по технологиям Pascal мы писали, что особые техники проецирования изображения позволяют экономить ресурсы GPU и ускорять обработку VR. Технологии NVIDIA VRWorks обеспечивают ускорение рендеринга в режиме виртуальной реальности от 20% до 60% и выше.
Сочетание максимальной производительности и технологической поддержки делает GeForce GTX 1080 Ti лучшим выбором для тех, кто хочет прикоснуться к миру виртуальной реальности.
После изучения общих архитектурных особенностей и технологических инноваций пора взглянуть на видеокарту референсного дизайна.