Так ли это на самом деле, мы как раз и попытаемся разобраться в данном материале. Ну и, естественно, сравним данные решения с их главным конкурентом из стана AMD.
Сравнение архитектуры
GeForce GTX 465 стал третьим видеоадаптером, основанным на мощном графическом чипе GF100, рассмотренном нами ранее. Он состоит из четырех кластеров GPC (Graphics Processing Cluster) по четыре потоковых мультипроцессорных блока (Streaming Multiprocessors), каждый из которых включает 32 CUDA-ядра. Соответственно, всего GF100 может похвастать 512 стрим-процессорами. Но из-за высокой сложности этого чипа, состоящего из более чем трех миллиардов транзисторов, на данный момент пока что еще нет видеокарт, которые бы включали именно такой полноценный GPU. Чтобы достигнуть приемлемого процента выхода готовых кристаллов NVIDIA была вынуждена пойти на компромисс, и выпустила топовый GeForce GTX 480 с одним отключенным мультипроцессорным блоком. Флагманское решение может похвастать 384-битным интерфейсом памяти, реализованном благодаря шести 64-битным контроллерам. GTX 470 уже лишился одного из них (шина — 320 бит), а число активных SM-блоков уменьшилось до 14 (всего 448 потоковых процессоров).
Для GeForce GTX 465 графический чип обрезали еще сильнее. Разрядность интерфейса, по которому он сообщается с памятью, теперь лишь 256 бит (отключены два контроллера). Количество вычислительных блоков на треть меньше «возможностей» GF100 — 352 потоковых процессора (не задействован один графический кластер и еще один мультипроцессорный блок). Соответственно, уменьшилось и число текстурных блоков — 44 (по четыре на один мультипроцессорный блок). Из шести разделов ROP по восемь блоков в каждом у GeForce GTX 465 осталось четыре блока на 32 блока. Объем кэш-памяти L2 уменьшен с 768 до 512 КБ.
GF100 (GTX 465)
Серия видеокарт GeForce GTX 460 базируется на совершенно другом чипе GF104. Это изначально продукт для более массового рынка. Благодаря меньшему числу вычислительных блоков кристалл стал компактнее — площадь его уменьшилась примерно на 40%, а количество транзисторов более чем на 60% (с 3200 миллионов у GF100 до 1950 миллионов у GF104). Графическое ядро стало более холодным, экономичным и дешевым в производстве, в отличие от полноценного GPU.
Ну а что же с производительностью? GF104 включает два кластера по четыре мультипроцессора, каждый из которых содержит уже 48 CUDA-ядра. Четыре 64-битных контроллера обеспечивают связь с внешней памятью по 256-битному интерфейсу. Объем кэша L2 исчисляется 512 КБ (как и урезанного GF100 на GeForce GTX 465). Четыре раздела ROP включают 32 соответствующих вычислительных блока.
NVIDIA не просто подошла к вопросу проектировки нового GPU с точки зрения обычного «урезания» старшего чипа, но и немного переработала внутреннюю структуру мультипроцессорных блоков. Кроме увеличения количества потоковых процессоров, у мультипроцессоров увеличено и количество блоков специальных функций — с четырех до восьми. Для более эффективного распределения данных между всеми вычислительными блоками удвоено число управляющих диспетчеров (Dispatch Unit). Объем кэш-памяти L1 остался тем же — 64 КБ на SM-блок. Вместо четырех текстурных блоков на мультипроцессор теперь имеем восемь, т.е. их количество не меньше чем у полноценного GF100 с 16 Streaming Multiprocessors.
В итоге получился довольно мощный GPU c 384 потоковыми процессорами и 64 текстурными блоками. Но дебют GF104 состоялся в немного другом исполнении, с одним отключенным мультипроцессором. Данный ход продиктован скорее тем, чтобы новые видеокарты не создавали конкуренцию GeForce GTX 470, а лишь заменили GeForce GTX 465. Ну а потом, по мере того, как распродадутся остатки карт на GF100, мы, скорее всего, увидим в продаже видеокарты на базе GF104 со всеми активными вычислительными блоками, но под другим именем (возможно, GeForce GTX 475).
GF104 (GTX 460 1GB)
Пока же остается довольствоваться видеокартами с 336 стрим-процессорами. Их число даже чуть ниже чем у GeForce GTX 465, зато по числу текстурных блоков преимущество уже у нового GeForce GTX 460. Как видим, различий между этими двумя продуктами на самом деле не так уж и много, и даже небольшая разница в числе потоковых процессоров компенсируется более высокими рабочими частотами у GF104. Если ядро GeForce GTX 465 функционирует на тех же невысоких частотах, что и GeForce GTX 470, — 608/1215 МГц, а память GDDR5 на 3206 МГц, то у GeForce GTX 460 ядро работает на 675/1350 МГц, а память на 3600 МГц.
Для насыщения рынка NVIDIA выпустила еще упрощенную версию GeForce GTX 460 с 192-битным интерфейсом памяти. С отключением одного 64-битного контроллера остаются неактивными и восемь блоков ROP. Вместо стандартных 1024 МБ данная версия оснащается 768 МБ видеопамяти. Рабочие частоты младшей и старшей GeForce GTX 460 не отличаются.
Производительность 192-битной версии естественно будет немного ниже, а одно и то же название видеокарт немного запутает покупателей, которым не всегда будет понятно, чем кроме цены и объема памяти отличаются данные модели.
Весьма значительное преимущество у обоих версий GeForce GTX 460 над GeForce GTX 465 — это уменьшенное энергопотребление. Последняя не особо отличается по этому критерию от GeForce GTX 470, потребляя 200 Вт вместо 215 Вт. А вот у 256-битной версии GeForce GTX 460 «аппетиты» ограничиваются отметкой в 160 Вт, а у 192-битной версии — 150 Вт.
Характеристики видеокарт на базе GF104 и GF100
Видеоадаптер | GeForce GTX 460 768MB | GeForce GTX 460 1024MB | GeForce GTX 465 | GeForce GTX 470 | GeForce GTX 480 |
Ядро | GF104 | GF104 | GF100 | GF100 | GF100 |
Количество транзисторов, млн. шт | 1950 | 1950 | 3200 | 3200 | 3200 |
Техпроцесс, нм | 40 | 40 | 40 | 40 | 40 |
Площадь ядра, кв. мм | 367 | 367 | 526 | 526 | 526 |
Количество потоковых процессоров | 336 | 336 | 352 | 448 | 480 |
Количество текстурных блоков | 56 | 56 | 44 | 56 | 60 |
Количество блоков рендеринга | 24 | 32 | 32 | 40 | 48 |
Частота ядра, МГц | 675 | 675 | 608 | 608 | 701 |
Частота шейдерного домена, МГц | 1350 | 1350 | 1215 | 1215 | 1401 |
Шина памяти, бит | 192 | 256 | 256 | 320 | 384 |
Тип памяти | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
Частота памяти, МГц | 3600 | 3600 | 3206 | 3348 | 3696 |
Объём памяти, МБ | 768 | 1024 | 1024 | 1280 | 1536 |
Поддерживаемая версия DirectX | 11 | 11 | 11 | 11 | 11 |
Интерфейс | PCI-E 2.0 | PCI-E 2.0 | PCI-E 2.0 | PCI-E 2.0 | PCI-E 2.0 |
Заявленная максимальная потребляемая мощность, Вт | 150 | 160 | 200 | 215 | 250 |
Объектом сравнения в данной статье непосредственно станут GeForce GTX 465 и 256-битная версия GeForce GTX 460; 192-битной карте мы посвятим отдельный обзор.