Кроме традиционного повышения быстродействия переход на Maxwell должен ознаменовать кардинальное улучшение параметра производительности на ватт. Для компании развитие энергоэффективных графических решений является очень важной задачей, ведь кроме ускорителей для платформы PC она давно занимается разработкой Tegra для мобильных устройств. Причем последний их процессор Tegra K1 уже использует графическое ядро на базе Kepler. Даже в сфере PC-гейминга компания видит будущее в компактных системах, с чем нельзя не согласиться. И не будем забывать о портативной приставке NVIDIA Shield, которая тоже будет обновляться и наращивать мощности в будущем. Процесс слияния технологий, ориентированных под разные потребительские устройства, уже пошел. Поэтому разработка универсальной энергоэффективной архитектуры является правильным вектором эволюционного развития.
Новые видеокарты построены на базе процессора GM107. Его структура напоминает предыдущие процессоры такого уровня. Имеется один графический кластер GPC, но вместо двух крупных мультипроцессорных блоков теперь их пять. Вне кластера находится общий L2-кэш, связанные с ним блоки ROP и два 64-битных контроллера. Объем кэша увеличен до 2048 КБ, в то время как у GK107 было лишь 256 КБ и даже у GK106 только 384 КБ (GeForce GTX 660).
Внутренняя структура мультипроцессорных блоков (SMM) заметно реорганизована. Вычислительные блоки сгруппированы в четыре массива обработки данных со своей контролирующей логикой и отдельным буфером инструкций. При этом общее количество Warp Scheduler и Dispatch Unit у старого SMX и нового SMM идентично. Но новая организация мультипроцессорного блока и улучшение планировщиков оказывается значительно более эффективным для распределения задач между вычислительными ядрами и уменьшения простоев.
Каждый массив работает с 32 отдельными вычислительными ядрами, то есть в активе SMM всего 128 ядер. Это меньше единого массива из 192 ядер у SMX. Разделение ядер на массивы позволяет упростить структуру управляющей логики, что в сочетании с гибким управлением вычислительными ресурсами делает Maxwell более производительным при понижении общего энергопотребления. Согласно данным NVIDIA пиковая производительность одного мультипроцессорного блока Maxwell на 35% выше потенциала Kepler, а по соотношению производительности на ватт и вовсе выходит двукратное превосходство!
Последняя впечатляющая цифра вполне актуальна при сравнении GeForce GTX 750 Ti и предшественника в лице GeForce GTX 650 Ti. Относительно старичка GeForce GTX 550 Ti нам и вовсе обещают четырехкратное превосходство в производительности на единицу потребляемой мощности.
Общие улучшения дизайна GPU не обошли стороной и подсистему памяти. В частности, конфигурация с большим кэшем второго уровня позволяет уменьшить необходимость в обращении к внешней памяти и немного снизить влияние ее пропускной способности на общую производительность.
Что касается рабочих частот, то они одинаковы для GeForce GTX 750 и GeForce GTX 750 Ti. Процессор поддерживает технологию Boost, которая регулирует его частоту в зависимости от нагрузки и температуры, не давая GPU превысит определенные лимиты. Базовая частота в 1020 МГц актуальная для любой нагрузки в 3D-режиме, ниже этого значения GPU не опустится даже в самых тяжелых стресс-тестах. Заявлен Boost Clock на уровне 1085 МГц, но пиковые частоты еще выше. То есть кроме архитектурных изменений мы имеем и привычное наращивание рабочих частот относительно предшественников. А вот частоты памяти поднимать не стали. Микросхемы GDDR5 работают при эффективном значении в 5400 МГц, что соответствует характеристикам памяти GeForce GTX 650 Ti. Впрочем, не стоит забывать об обещанных улучшениях в работе подсистемы памяти и возможности разгона.
Видеоадаптер | GeForce GTX 750 Ti | GeForce GTX 750 | GeForce GTX 650 Ti Boost | GeForce GTX 650 Ti | GeForce GTX 650 |
Ядро | GM107 | GM107 | GK106 | GK106 | GK107 |
Количество транзисторов, млн. шт | 1870 | 1870 | 2540 | 2540 | 1300 |
Техпроцесс, нм | 28 | 28 | 28 | 28 | 28 |
Площадь ядра, кв. мм | 148 | 148 | 221 | 221 | 118 |
Количество потоковых процессоров | 640 | 512 | 768 | 768 | 384 |
Количество текстурных блоков | 40 | 32 | 64 | 64 | 32 |
Количество блоков рендеринга | 16 | 16 | 24 | 16 | 16 |
Частота ядра, МГц | 1020 | 1020 | 980 | 928 | 1058 |
Boost Clock, МГц | 1085 | 1085 | 1033 | – | – |
Шина памяти, бит | 128 | 128 | 192 | 128 | 128 |
Тип памяти | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
Частота памяти, МГц | 5400 | 5000 | 6008 | 5400 | 5000 |
Объём памяти, МБ | 2048 | 1024 | 2048 | 1024 | 1024 |
Поддерживаемая версия DirectX | 11.2 | 11.2 | 11.1 | 11.1 | 11.1 |
Интерфейс | PCI-E 3.0 | PCI-E 3.0 | PCI-E 3.0 | PCI-E 3.0 | PCI-E 3.0 |
Заявленный уровень мощности, Вт | 60 | 55 | 134 | 110 | 64 |
В активе GeForce GTX 750 Ti полноценный процессор GM107 с 640 ядрами, 40 текстурными блоками и 16 ROP. У GeForce GTX 750 отключен один SMM, поэтому доступно 512 потоковых процессоров и 32 текстурных блока. По площади кристалла GM107 обгоняет GK107, на котором базируется GeForce GTX 650, но компактнее GK106 у GeForce GTX 650 Ti. При этом нужно учитывать, что у последнего урезанная версия GPU от GeForce GTX 660. Заявленный уровень TDP у GeForce GTX 750 Ti беспрецедентно низкий и практически в два раза меньше, чем у GeForce GTX 650 Ti, которого новичок должен сменить. А вот между GeForce GTX 750 и GeForce GTX 650 разница намного меньше.
Когда мы говорим о том, кто кого должен сменить, нужно учитывать и некоторый прирост производительности относительно предшественников. Более точное представление о позиционировании новых графических решений дает нижняя иллюстрация.
GeForce GTX 750 Ti предполагается как промежуточное решение между GeForce GTX 650 Ti GeForce GTX 660, то есть он должен быть максимально близким по производительности к GeForce GTX 650 Ti Boost. Младший GeForce GTX 750 должен занять нишу между GeForce GTX 650 Ti и GeForce GTX 650.
Нельзя обойти стороной и тему сравнения новинок с еще более старыми графическими ускорителями. В частности, NVIDIA приводит очень интересный график сравнения производительности GeForce GTX 750 Ti с седовласым GeForce GTX 480. На удивление эти видеоадаптеры демонстрируют небольшую разницу в результатах и кое-где бюджетный новичок даже оказывается лучше. Хотя в половине случаев преимущество все еще остается за старым «монстром», доходя порою до 20%.
Нас же в первую очередь интересует ситуация в противостоянии с современными конкурентами AMD, среди которых новый GeForce GTX 750 Ti грозит безоговорочно обойти Radeon R7 260X. Насколько новичок лучше, станет ясно по итогам нашего обширного тестирования в 21 тестовом приложении.
По техническому исполнению обе новинки повторяют GeForce GTX 650 — максимально компактная плата, двухфазное питание GPU и кулер, напоминающий «боксовый» охладитель процессоров Intel.
В заключении хотелось бы еще раз вернуться к вопросам развития гейминга в будущем. Озвученное выше движение в сторону компактности и мобильности игровых устройств хорошо демонстрирует нижняя картинка. С одной стороны NVIDIA видит увеличение спроса на миниатюрные настольные решения, при этом сам десктоп может работать как станция, которая передает потоковое изображение на мобильные устройства вроде NVIDIA Shield.
Сделан акцент и на мониторах с поддержкой технологии NVIDIA G-Sync. Данное начинание связано с аппаратной синхронизацией кадров видеокарты и монитора, что реализуется благодаря специальной плате в конечном устройстве вывода изображения. В итоге пользователь получает плавное изображение без разрывов кадров. Со слов небезызвестного Джона Кармака: «Однажды поиграв на мониторе с G-Sync, вы не захотите возвращаться назад». Звучит претенциозно, но все равно технология не тянет на роль важного фактора будущего развития индустрии. Просто это эксклюзив, поэтому и такое внимание со стороны NVIDIA.
Еще одна модная тенденция — трансляция прохождения игр в сети и создание различного видеоконтента. Весь этот функционал пользователям GeForce доступен через программное приложение NVIDIA Shadowplay с максимально простым и интуитивно понятным интерфейсом. Программа позволяет записывать видео высокого качества при кодировании его силами GPU с мизерным падением общей производительности и при небольшом объеме итогового файла. Запись осуществляться по команде с горячих клавиш. Есть и более интересная возможность фоновой записи без принудительной команды на запуск. Если с вами внезапно приключилось что-то интересное и вы решили запечатлеть этот момент, достаточно нажать кнопку и Shadowplay сохранит последние 3–10 минут геймплея. Присутствует возможность трансляции видео на Twitch.tv.
Запись видео на лету реализовано благодаря наличию специального аппаратного блока NVENC для кодирования в H.264. Инновационного в этом ничего нет, такой блок впервые был реализован в Kepler. Зато у Maxwell подняли его производительность, что сэкономит время при конвертации видео в программах, которые умеют использовать NVENC. Из приятных мелочей стоит отметить и сверхнизкое энергопотребление в режиме проигрывания видео. Для настольных систем это представляет минимальную ценность, но будет весьма кстати для ноутбуков на базе нового GPU.