Уже несколько поколений игровых и специализированных GPU NVIDIA имеют специальные тензорные блоки для работы с матричными данными. Эти блоки позволяют ускорить вычисления, связанные с глубоким обучением, что расширяет возможности решений NVIDIA в специализированных задачах. Нашлось применение этим блокам и в игровом сегменте, поскольку технология интеллектуального масштабирования Deep Learning Super Sampling (DLSS) использует вычисления с применением тензорных блоков. Теперь подобные блоки могут получить графические процессоры AMD нового поколения. На это указывают данные в обновленных библиотеках LLVM драйвера AMDGPU.
Для архитектуры с кодовым названием GFX11 (RDNA3) добавлена технология Wave Matrix Multiply-Accumulate (WMMA) с поддержкой специальных инструкций для матричных вычислений. WMMA поддерживает матрицы 16x16x16 и может выводить данные в форматах FP16 и BF16. Это не первая архитектура с поддержкой матричных операций. В архитектуре CDNA для ускорителей вычислений Instinct MI200 уже реализована поддержка инструкций Matrix-Fused-Multiply-Add (MFMA). Но ускорители Instinct являются продуктом для центров обработки данных, а в случае RDNA3 речь идет о массовых решениях. С таким аппаратным апгрейдом может получить развитие технология FidelityFX Super Resolution, которая станет прямым аналогом NVIDIA DLSS.
Источник:
Videocardz.com