Сегодня корпорация Nvidia представила первый графический процессор на архитектуре Ampere — A100. Он выпускается на мощностях TSMC по 7-нм техпроцессу и предназначен для ускорения задач, связанных с искусственным интеллектом, анализом данных и ресурсоёмкими вычислениями. В кристалле площадью 824 мм² «зелёные» разместили впечатляющие 54,2 миллиарда транзисторов.
Итак, в арсенале Nvidia A100 имеются 6912 ядер CUDA для операций одинарной точности и 3456 ядер для вычислений двойной точности (FP64). Кроме того, имеется 432 ядра Tensor 3-го поколения с поддержкой формата Tensor Float (TF32).
«Теперь они [GPU] поддерживают TF32 для ИИ, что поднимает скорость ИИ-вычислений до 20 раз для FP32 без каких-либо изменений кода. Также, тензорные ядра теперь поддерживают FP64, что повышает скорость работы в HPC-приложениях до 2,5 раз по сравнению с предыдущим поколением», — рассказывает пресс-служба Nvidia.
Вокруг GPU расположены шесть микросхем памяти HBM2 производства Samsung. Судя по тому, что шина памяти насчитывает 5120 разрядов, а суммарный объём равен 40 ГБ — активны пять 8-гигабайтных чипов из шести. Пропускная способность буфера составляет 1,6 Тбайт/с. Имеется поддержка интерфейсов PCI Express 4.0 и NVLink. Краткие характеристики и данные о быстродействии ускорителя Nvidia A100 приведены в таблице ниже.
Высокопроизводительные серверы на базе ускорителей Nvidia A100 предложат многие крупные производители, включая Atos, Dell, Fujitsu, Gigabyte и Supermicro. Впрочем, первой такой системой является DGX A100 от самой «зелёной» команды. Она включает восемь GPU A100, связанных посредством шины NVLink, пару 64-ядерных чипов AMD EPYC, терабайт оперативной памяти и 15-терабайтное твердотельное хранилище. Цена суперкомпьютера Nvidia DGX A100 составляет 200 тысяч долларов.