Накануне вечером Nvidia в рамках мероприятия GPU Technology Conference (GTC) анонсировала выход графических решений на базе ядра Pascal GP100, о котором в последние два года не говорил только ленивый. Событие действительно нерядовое, и вот почему:

  • GP100 — первый GPU, выпуск которого будет осуществляться по 16-нм FinFET-техпроцессу;
  • 15,3 млрд транзисторов на площади 610 кв. мм;
  • первый чип с буферной памятью HBM второго поколения;
  • поддержка двунаправленного (160 ГБ/с) интерфейса NVLink;
  • новые алгоритмы Unified Memory и Compute Preemption;
  • многократный прирост производительности в FP64-операциях относительно GK110 (Kepler) и GM200 (Maxwell).

Ядро GP100 физически включает 60 потоковых мультипроцессоров по 64 шейдера и по 4 текстурных блока в каждом — всего 3840 потоковых процессоров и 240 TMU. Соотношение блоков FP32 и FP64 — 2:1. Объем памяти HBM2 составляет 16 ГБ, интерфейс памяти — 4096-битный (восемь 512-битных контроллеров). Пропускная способность подсистемы ОЗУ равна 720 ГБ/с, что примерно соответствует тактовой частоте микросхем памяти в 700 (1400) МГц.


Схема ядра GP100


Схема потокового мультипроцессора (SM)

Nvidia GP100, прежде всего, является решением для высокопроизводительных серверов. Первый продукт на его основе — ускоритель Tesla P100 — использует конфигурацию с 3584 потоковыми процессорами и впервые появится в составе системы глубокого обучения Nvidia DGX-1 в июне. Подробнее о нем читайте в следующей заметке.

Источники:
Nvidia
VideoCardz