Nvidia Tesla V100 — первый ускоритель на базе архитектуры Volta

В ходе мероприятия GPU Technology Conference, проходящем в настоящее время в Сан-Хосе, компания Nvidia представила первый ускоритель на базе архитектуры Volta — Tesla V100. Данное устройство предназначено для систем машинного обучения и располагает невиданным уровнем вычислительной мощности (как для ускорителя с одним GPU), составляющим около 15 Тфлопс в операциях одинарной точности и 7,5 Tфлопс в двойной.

Nvidia Volta GV100

Основой для ускорителя Tesla V100 служит графический процессор Nvidia GV100. Данный GPU изготавливается согласно 12-нанометровым технологическим нормам FinFET на мощностях TSMC и насчитывает свыше 21 млрд транзисторов. Площадь кристалла составляет 815 кв. мм.

Новый GPU физически включает 84 потоковых мультипроцессора (Streaming Multiprocessor, SM), при этом ускоритель Tesla V100 оперирует 80 такими блоками. Каждый SM насчитывает 64 ядра CUDA (соотношение блоков FP64 и FP32 — 2:1), а также по восемь ядер Tensor, разработанных специально для задач машинного обучения.

Схема ядра Nvidia GV100

Всего же чип включает в себя 5376 ядер CUDA, из которых у Tesla V100 активно 5120 единиц, и 640 ядер Tensor. Как отмечают представители Nvidia, благодаря использованию специализированных ядер Tensor «процессор V100 обеспечивает производительность 120 Тфлопс в глубоком обучении, что эквивалентно производительности 100 CPU».

Схема потокового мультипроцессора (SM)

Максимальная рабочая частота графического процессора Nvidia GV100 составляет 1455 МГц. Подсистема памяти представлена 16 гигабайтами HBM2 производства Samsung с 4096-разрядным интерфейсом, обеспечивающим пропускную способность на уровне 900 Гбайт/с.

Nvidia Volta GV100

Ускоритель Nvidia Tesla V100 оснащается двунаправленным интерфейсом NVLink второго поколения с пропускной способностью 300 ГБ/с. Также будет выпущена версия с интерфейсом PCI Express. Максимальное энергопотребление устройства составляет 300 Вт. Продажи нового ускорителя начнутся в третьем квартале этого года.

Еще новости:

Arctic принимает заказы на мини-холодильник

Замечена GeForce RTX 5090 с большим количеством блоков ROP, чем указано в спецификациях

На подходе серия NVMe-накопителей Kingston Fury Renegade G5 с поддержкой PCIe 5.0

Последние обзоры:

Обзор и тестирование видеокарты ASUS TUF Gaming GeForce RTX 5090 32GB OC Edition. Сравнение с GeForce RTX 4090 и другими оппонентами

Обзор и тестирование процессора Intel Core Ultra 7 265K и платформы LGA 1851. Очередной «плиточный» представитель

Обзор 14″ хромбука-трансформера Acer Chromebook Plus Spin 514