Объекты данного материала самые яркие представители этой категории. Мы познакомим вас с абсолютно новым High-End видеоадаптером GeForce GTX 280, и его предшественником в лице GeForce 9800 GX2. Обе эти карты сейчас самые дорогие на рынке, но при этом и самые быстрые. Старая карта демонстрирует такую мощь благодаря двум графическим чипам G92, а в основе новой - GPU последнего поколения GT200. Но обе отличаются огромными габаритами, "горячим нравом" и высоким энергопотреблением. Кто же быстрее и мощнее из этих двух монстров, мы и выясним ниже.
Особенности архитектуры GT200
После G80 NVIDIA не торопилась с кардинальными изменениями в архитектуре своих графических процессоров. Популярный G92 практически повторял предшественника, лишь ROP и текстурные блоки были немного улучшены. Новый же чип представляет собой следующее поколение универсальной шейдерной архитектуры, хотя, на самом деле, в основе его все так же лежит базовая архитектура G80.
Ядро GT200 состоит из десяти больших кластеров TPC (Texture Processing Clusters), что на два кластера больше, чем у представителей прошлого поколения. Строение этих вычислительных блоков аналогично предшественникам, но потоковых процессоров (SP) стало больше. На каждый TPC приходится по три потоковых мультипроцессорных юнита (SM), каждый из которых состоит из трех стрим-процессоров. Итого, в общем, получаем 240 универсальных потоковых процессоров. Для каждого SM-юнита выделена своя память объемом 16 КБ.
Основные изменения в шейдерных блоках коснулись модернизации локального регистрового файла, что дало прирост производительности при выполнении сложных программ-шейдеров. Также новый чип обладает возможностью выполнения двух инструкций за такт в одном шейдере. Точность вычислений с плавающей запятой увеличено до 64 бит.
Блоки TMU и ROP остались такими же, как и G92, но их количество было увеличено: до 80 текстурных блоков (по восемь на каждый TPC) и до 32 блоков растеризации, по восемь на каждый широкий ROP. Благодаря улучшениям текстурных блоков, NVIDIA говорит о 22% превосходстве в текстурировании относительно предшественника. Эффективность блоков ROP увеличена в возможности вывода до 32 пикселей с блендингом за такт, тогда как тот же G80 мог выводить только 24 пикселя и 12 с блендингом. Все вышесказанное касается старшего представителя на базе GT200 - GeForce GTX 280. Более доступное решение GeForce GTX 260 отличается чуть меньших числом функциональных блоков.
Но не только возможности по обработке графических задач были улучшены в новом чипе. Благодаря технологии CUDA, GT200 теперь может похвастаться поддержкой и других вычислительных задач. В таком режиме он работает как мультипроцессор с 240 вычислительными ядрами. Это позволит использовать эти видеокарты в специализированных расчетах. Справедливости ради, стоит отметить, что акселераторы Radeon уже давно обладают такой возможностью.
Большие вычислительные возможности чипа подтолкнули компанию на организацию расчетов физики в играх силами GPU. Эта технология является развитием технологии PhysX компании Ageia, которую недавно купила NVIDIA. Хотя тот факт, что энтузиастам удалось "взломать" драйверы NVIDIA и ввести поддержку аппаратного расчета физической модели в видеокарты Radeon, говорит о том, что PhysX не относится к каким-либо аппаратным особенностям графического чипа GT200, а является лишь соответствующей адаптацией программного API PhysX под универсальную щейдерную архитектуру.
Теперь, что касается еще одного нововведения. Шина памяти 512 бит (восемь 64-битных контроллеров памяти) при использовании GDDR3 позволила достичь пропускной способности в 141,67 Гб/с, и по этому критерию решение NVIDIA является лидером на рынке графических акселераторов. Но тут стоит отметить, что AMD пошла другим путем, и в своем новой графическом чипе RV770 ввела поддержку сверхбыстрой памяти GDDR5. Возможно, с выпуском новых GPU калифорнийцы также перейдут на использование прогрессивного типа памяти. Объем памяти у видеокарт GeForce GTX 280 составляет 1 ГБ, что для Hi-end решений становится уже нормой, учитывая аппетиты современных игровых приложений при выборе качественной графики. GeForce GTX 260 довольствуется лишь 896 мегабайтами памяти, при этом шина памяти составляет 448 бит.
GT200 выполняется по нормам 65-нм техпроцесса. В этом плане AMD пока лидирует - их новые чипы выполнены по 55–нм техпроцессу. Обладая огромных количеством транзисторов (1,4 млрд.) новый чип NVIDIA имеет громадную площадь в 576 кв. мм., а ширина кристалла достигает 2,4 см! С таким огромным ядром добиться выхода большого процента исправных чипов довольно тяжело, поэтому производство GT200 достаточно дорогое, что выливается в высокую окончательную стоимость готового продукта. Ниже приведено фото кристалла со схемой размещения его главных вычислительных блоков.
При таких размерах остро встает вопрос отведения тепла от кристалла. Да и энергопотребление у GT200 самое большое среди всех существующих чипов. Плата на базе GT200 в 3D потребляет до 236 Вт, а в 2D около 25 Вт: в зависимости от загрузки драйвер изменяет рабочую частоту чипа в большую или меньшую сторону. Опять же, подобные технологии уже давно прижились в продуктах ATI/AMD.
Также большой размер кристалла вынудил вынести блоки, отвечающие за интерфейсы (два RAMDAC, два Dual DVI, HDMI, DisplayPort, HDTV) в отдельный чип NVIO, что когда-то уже было с картами на базе G80. Из остальных интерфейсов отметим поддержку PCI Express 2.0 и двух разъемов для объединений видеокарт в режиме SLI и 3-way SLI.
Поддерживается технология HybridPower. При использовании материнской платы с данной технологией и встроенной видеокартой, внешняя в простое может быть отключена, а функции вывода изображения ложатся на плечи интегрированного графического ядра.
Никуда не делись возможности по аппаратному ускорению видео высокого разрешения, но и изменений нет. Все тот же PureVideo HD второго поколения, как и в предыдущих продуктах. Поддерживается вывод изображения через HDMI и DisplayPort.
А вот чего действительно не хватает в новом продукте, так это поддержки DirectX 10.1 и ShaderModel 4.1 - остался лишь "старый" DirectX 10.0. Конечно, программные преимущества обновленного API пока еще не используются разработчиками игр, но пора бы уже ввести поддержку соответствующих инструкций, тем более в новый топовый чип.
Подводя общие итоги по архитектуре, стоит отметить, что ничего кардинально со времен G92/G80 не поменялось, а все вычислительные блоки в среднем были увеличены в два раза. Остальные изменения коснулись лишь доработки функциональности этих самых блоков.
В таблицу, представленную ниже, занесены данные всех основных одночиповых решений различных поколений.
Видеокарта | GeForce GTX 280 | GeForce GTX 260 | GeForce 9800 GTX | GeForce 8800 GTS | GeForce 8800 GTX |
Ядро | GT200 | GT200 | G92 | G92 | G80 |
Число транзисторов, млн. | 1400 | 1400 | 754 | 754 | 681 |
Техпроцесс, нм | 65 | 65 | 65 | 65 | 90 |
Число процессоров | 240 | 192 | 128 | 128 | 128 |
Число TMU | 80 | 64 | 64 | 64 | 32 |
Число ROP | 32 | 28 | 16 | 16 | 24 |
Частота ядра, МГц | 602 | 576 | 675 | 650 | 575 |
Частота процессоров, МГц | 1296 | 1242 | 1688 | 1625 | 1350 |
Частота памяти, МГц | 2214 | 2000 | 2200 | 1940 | 1800 |
Шина памяти, бит | 512 | 448 | 256 | 256 | 384 |
Тип памяти | GDDR3 | GDDR3 | GDDR3 | GDDR3 | GDDR3 |
Объем памяти, МБ | 1024 | 896 | 512 | 512 | 768 |
Пропускная способность памяти, ГБ/с | 142 | 112 | 70,4 | 62 | 86,4 |
Интерфейс | PCI Express 2.0 | PCI Express 2.0 | PCI Express 2.0 | PCI Express 2.0 | PCI Express 1.1 |
Поддерживаемая версия DirectX | 10 | 10 | 10 | 10 | 10 |
Энергопотребление, Вт | 236 | 182 | 168 | 140 | 177 |
XpertVision GeForce GTX 280
Новый видеоадаптер от NVIDIA мы рассмотрим на примере продукта компании XpertVision, хотя на самом деле все карты, выпускаемые на данный момент, являются референсными, производимыми на "одном заводе". Делая свой выбор в пользу того или иного бренда, вы платите лишь за имя и комплектацию.
Видеокарта, которая попала к нам, как раз и отличалась весьма скудной комплектацией, что для такого дорого продукта очень непривычно:
- Переходник DVI/D-Sub;
- Переходник DVI/ HDMI;
- Диск с драйверами;
- Инструкция по установке.
Модель от XpertVision в качестве отличительных знаков имеет лишь наклейку на вентиляторе. Строгий черный кожух двуслотового кулера с наклонным вентилятором закрывает всю плату размером 270x100 мм. Задняя сторона тоже полностью закрыта металлической пластиной, которая служит и радиатором для чипов памяти и усиливает жесткость конструкции, предотвращая изгиб.
Вся информация о видеокарте нанесена на боковую стенку. Кстати, наклейки со штрих-кодом нанесены на место стыка верхней и нижней части кулера, так что снятие его чревато повреждением их и, соответственно, потерей гарантии.
С внешней боковой стороны расположены два разъема питания (6-pin и 8-pin). Разъемы SLI и S/PDIF (для подключения звука) закрыты резиновыми заглушками.
Сняв систему охлаждения, вряд ли можно будет увидеть что-то новое. Кулер по конструкции полностью повторяет аналоги на картах GeForce 8800GTS/9800GTX: медный сердечник посредством тепловых трубок передает тепло от ядра к тонким алюминиевым ребрам, которые продуваются турбиной. После чего отработанный воздух выходит наружу системного блока.
Да и сам дизайн платы недалеко ушел от дизайна PCB карт на базе G80, только защитной рамки вокруг чипа нет:
Ядро GT200, в связи со своими размерами обзавелось теплораспределительной крышкой, позволяющей также избежать сколов кристалла.
В качестве памяти используются микросхемы Hynix со временем доступа 0,8 мс (H5RS5223CFR-N2C) с номинальной частотой 2200 МГц и общим объемом 1024 МБ.
Мониторинг и разгон
Чип работает на частоте 602 МГц, при этом шейдерные блоки на 1296 МГц. Память GDDR3 функционирует на эффективных 2214 МГц (1107 МГц физических). Но такие частоты включаются лишь при загрузке GPU. В простое эти значения составляют лишь 300/100/200 МГц (ядро/шейдерный домен/память). При увеличении нагрузки ядро может быть установлено на частоту 400 МГц, память 594 МГц. А вот шейдерные блоки, судя по наблюдению, принимают лишь два дискретных значения.
Так же есть инерционность при переключении из высокочастотного режима в низкочастотный. При уменьшении нагрузки изменение частот происходит с запазданием в несколько секунд, вначале принимая средние значения, а потом уже опускаясь до минимальных.
RivaTuner 2.09 работает с новыми видеокартами, но скорость оборотов вентилятора не определяет. Эти данные можно просмотреть в утилите GPU-Z. Хотя управлять оборотами из меню RivaTuner можно, причем здесь положение ползунка соответствует активному на данный момент скоростному режиму в процентах.
Для измерения температуры мы традиционно использовали 10-минутный тест ATITool. Стоит отметить, что если вначале карта не нагрелась выше 81°C, то после двухчасового тестирования в играх, "волосатый куб" ATITool уже легко разогревал ядро до 85°C. При этом обороты поднимались до 92% от номинала. Это практически предел возможностей кулера, что свидетельствует о его низкой эффективности для охлаждения такой горячей карты.
Отдельно стоит отметить шумовые характеристики. GeForce GTX 280 можно смело назвать чемпионом по создаваемому шуму. Гул турбины слышен даже при работе в 2D. В 3D-режиме уровень шума достигает и превышает все мыслимые комфортные пороги. Сидеть за компьютером, в котором работает такая карта, не только неприятно, но и искренне становится жаль того, кто это "чудо" себе купит. В общем если вам не по душе постоянный гул от компьютера как от пылесоса, то готовьтесь в придачу к такой видеокарте купить сразу мощный альтернативный кулер.
Что касается разгона, то он оказался минимальный. Судя по артефактам, все упирается в охлаждение. Также нет возможности гнать отдельно растровый и шейдерный домены. Эта возможность в RivaTuner включается, но пока не работает. Частоты все равно изменяются синхронно, или даже могут сброситься до минимального порога. Видеокарту удалось разогнать до 633/1350/2520 МГц. По ядру это лишь на 5% выше номинала (что и разгоном то не назовешь), по памяти - 13% выше номинала. Учитывая изначально высокую ПСП этой видеокарты, можно предположить, что разгон памяти роли на итоговой производительности не играет.
Для разгона обороты вентилятора были подняты до 100% что позволило добиться даже более низкой температуры чем та, до которой карта прогревалась при 92% оборотах.