Корпорация Nvidia подготовила альтернативную модификацию ускорителя A100 в формате карты расширения PCI Express 4.0 x16. Модель не уступает в пиковой производительности варианту SXM4 со скоростным интерфейсом NVLink 3.0, но при этом характеризуется 250-ваттным TDP, тогда как у выпущенной ранее версии он составляет 400 Вт.

Nvidia A100

Из-за этого вычислительная мощность PCI-E варианта Nvidia A100 в постоянных нагрузках может проседать на 10-50% относительно модификации в форм-факторе SXM4. Кроме того, новинка допускает работу в NVLink-связках только из двух GPU. В комплексных решениях на базе модулей SXM4 способны взаимодействовать четыре или восемь ускорителей Nvidia A100.

Nvidia A100

По техническим характеристикам новый вариант Nvidia A100 не отличается от выпущенного ранее. В арсенале ускорителей значатся 6912 ядер CUDA для операций FP32 и 3456 ядер для вычислений двойной точности (FP64), а также 432 ядра Tensor 3-го поколения с поддержкой формата Tensor Float (TF32). Буфер представлен 40 ГБ памяти Samsung HBM2 с пропускной способностью 1,6 Тбайт/с.

Nvidia A100

PCI-E версия ускорителя Nvidia A100 занимает пространство двух слотов расширения и оборудована крупным радиатором. Обдувать его будут мощные вентиляторы серверных стоек. О цене новой модификации Nvidia A100 никакой информации не поступало. Системы на её основе будут доступны у широкого круга поставщиков серверов.

Nvidia A100

Источник:
Nvidia