Під час презентації Advancing AI компанія AMD офіційно анонсувала новий прискорювач обчислень штучного інтелекту Instinct MI325X. Він забезпечить якісне зростання продуктивності та отримає рекордний об'єм пам'яті HBM3e для роботи з великими обсягами даних.
Instinct MI325X є розвитком наявної серії MI300X і використовує процесор на актуальній архітектурі CDNA 3. Основні зміни пов'язані з апгрейдом підсистеми пам'яті. Новий графічний чип отримає 256 ГБ швидкої пам'яті HBM3e з пропускною здатністю 6 ТБ/с. Усе це упаковано в продукт, який налічує 153 мільярди транзисторів. Заявлена пікова продуктивність 2,6 PFLOPS в обчисленнях формату FP8 та 1,3 PFLOPS в обчисленнях FP16. Енергоспоживання одного такого прискорювача понад 750 Вт.
Сервери AI Instinct підтримують конфігурації до 8 пристроїв MI325X зі спільною пам'яттю HBM3e об'ємом 2 ТБ за пропускної здатності 48 ТБ/с. Обмін даними буде проводитися по шині Infinity Fabric 896 ГБ/с. Пікова продуктивність такого сервера складе 20,8 PFLOPS у FP8 і 10,4 PFLOPS у FP16. Постачання серверних рішень з Instinct MI325X розпочнеться в четвертому кварталі поточного року.
У компанії AMD зазначають, що актуальні прискорювачі MI300X уже демонструють перевагу відносно рішень Nvidia в певних навантаженнях. Нові прискорювачі Instinct MI325X AI GPU мають бути на 40% швидшими за Nvidia H200 в роботі з мовною моделлю Mixtral 8x7B, на 30% швидшими в Mistral 7B та на 20% швидшими в Meta Llama 3.1 70B LLM.
Наступного року компанія виведе на ринок ще більш продуктивний продукт для обчислень ШІ. Це прискорювач Instinct MI355X, який отримає неймовірні 288 ГБ пам'яті HBM3e. В основі його буде графічний чип на новій архітектурі CDNA 4, яка запропонує суттєвий стрибок у продуктивності.
У CDNA 4 з'явиться підтримка обчислень у форматах FP4/FP6, зростання місткості та пропускної здатності пам'яті складе 50%. Обіцяно зростання продуктивності в окремих навантаженнях ШІ до 7 разів. Instinct MI355X отримає 288 ГБ пам'яті HBM3e з пропускною здатністю 8 ТБ/с. Потенціал у FP8 оцінюють у 4,6 PFLOPS, а в FP16 до 2,3 PFLOPS. Відносно Instinct MI325X це зростання швидкодії до 80%. Чип вироблятиметься за технологією 3 нм. Енергоспоживання одного пристрою буде на рівні кіловата.
Серверні системи з восьми Instinct MI355X запропонують 2,3 ТБ пам'яті з пропускною здатністю 64 ТБ/с за пікової продуктивності 37 PFLOPS у FP8, 18,5 PFLOPS у FP16 та 74 PFLOPS у нових форматах FP4/FP6.
У 2026 році прискорювачі Instinct MI355X змінять нові графічні процесори сімейства MI400.
Джерела:
Wccftech
Videocardz