В ходе мероприятия GPU Technology Conference, проходящем в настоящее время в Сан-Хосе, компания Nvidia представила первый ускоритель на базе архитектуры Volta — Tesla V100. Данное устройство предназначено для систем машинного обучения и располагает невиданным уровнем вычислительной мощности (как для ускорителя с одним GPU), составляющим около 15 Тфлопс в операциях одинарной точности и 7,5 Tфлопс в двойной.
Основой для ускорителя Tesla V100 служит графический процессор Nvidia GV100. Данный GPU изготавливается согласно 12-нанометровым технологическим нормам FinFET на мощностях TSMC и насчитывает свыше 21 млрд транзисторов. Площадь кристалла составляет 815 кв. мм.
Новый GPU физически включает 84 потоковых мультипроцессора (Streaming Multiprocessor, SM), при этом ускоритель Tesla V100 оперирует 80 такими блоками. Каждый SM насчитывает 64 ядра CUDA (соотношение блоков FP64 и FP32 — 2:1), а также по восемь ядер Tensor, разработанных специально для задач машинного обучения.
Всего же чип включает в себя 5376 ядер CUDA, из которых у Tesla V100 активно 5120 единиц, и 640 ядер Tensor. Как отмечают представители Nvidia, благодаря использованию специализированных ядер Tensor «процессор V100 обеспечивает производительность 120 Тфлопс в глубоком обучении, что эквивалентно производительности 100 CPU».
Схема потокового мультипроцессора (SM)
Максимальная рабочая частота графического процессора Nvidia GV100 составляет 1455 МГц. Подсистема памяти представлена 16 гигабайтами HBM2 производства Samsung с 4096-разрядным интерфейсом, обеспечивающим пропускную способность на уровне 900 Гбайт/с.
Ускоритель Nvidia Tesla V100 оснащается двунаправленным интерфейсом NVLink второго поколения с пропускной способностью 300 ГБ/с. Также будет выпущена версия с интерфейсом PCI Express. Максимальное энергопотребление устройства составляет 300 Вт. Продажи нового ускорителя начнутся в третьем квартале этого года.