Intel раскрыла новые подробности о графическом процессоре Ponte Vecchio для центров обработки данных и серверов. Он построен на архитектуре Intel Xe-HPC (High Performance Computing) и имеет многочиповый дизайн с кристаллами Compute, Rambo, HBM, EMIB общим количеством 47 штук.
У Intel уже есть прототип A0 (ранний образец, еще не готовый к выпуску) с производительностью более 45 Тфлопс в вычислениях одинарной точности FP32 и пропускной способностью HBM2e свыше 5 Тбайт/с. Скорость интерфейса подключения превышает 2 Тбайт/с.
Как и в игровой архитектуре Xe HPG, базовый блок для Xe-HPC именуется ядром Xe. Он включает 8 векторных модулей и 8 матричных модулей. По сравнению с Xe-HPG процессор Ponte Vecchio получит меньше модулей, но они работают на более широких шинах (512 бит и 4096 бит соответственно), имеют больше кэша, лучшую пропускную способность и поддерживают дополнительные типы данных.
Xe-HPC Slice представляет собой основной строительный блок, который объединяет 16 ядер Xe. Что интересно, архитектура Xe HPC включает блоки трассировки лучей (RTU). Мы не знаем, насколько быстры RTU относительно решений Nvidia и AMD, но они наверняка обеспечат хороший прирост производительности для профессиональных приложений трассировки лучей.
Intel пока не раскрывает тактовые частоты, но предполагается что образец A0 работает на частоте до 2 ГГц. Вычислительные плитки в основе Ponte Vecchio будут созданы с использованием техпроцесса TSMC N5. Они расположены на базовой плитке Intel Foveros (производится по 10-нм процессу Intel 7), на которой также находятся кэш Rambo, память HBM2e и интерфейс PCIe Gen 5.
Тем временем плитка Xe Link использует TSMC N7. Всего графический процессор Intel Ponte Vecchio включает 5 различных технологических узлов, что делает его одним из самых сложных ускорителей высокопроизводительных вычислений на рынке. Ожидается, что официальный дебют графического процессора состоится в следующем году.
Источник:
Tom's Hardware