Спустя полтора месяца после анонса ускорителя Tesla V100, созданного на базе архитектуры Volta, корпорация Nvidia представила его альтернативный вариант с интерфейсом PCI Express 3.0. Основой устройства служит 16-нанометровый графический процессор GV100 с площадью кристалла 815 мм², а его уровень вычислительной мощности достигает 14 Тфлопс в операциях одинарной точности (FP32) и 7 Тфлопс в FP64.
Ускоритель Nvidia Tesla V100 оперирует 5120 ядрами CUDA и 640 ядрами Tensor, разработанными для нужд машинного обучения. По сравнению с версией, оснащённой интерфейсом NVLink, новинка получила более скромную частоту boost-режима: 1370 МГц против 1455 МГц. Судя по всему, главной причиной снижения рабочих частот стало высокое энергопотребление ускорителя, которое удалось уменьшить с 300 до 250 Вт.
Подсистема памяти по-прежнему представлена 16 гигабайтами HBM2 с 4096-разрядной шиной, набранными четырьмя 4-гигабайтными стеками. Пропускная способность памяти составляет рекордные 900 ГБ/с.
Относительно стоимости PCI-E версии ускорителя Nvidia Tesla V100 на данный момент никакой информации не поступило. Партнёры Nvidia получат доступ к данным устройствам ближе к концу года.