Прискорювачі AMD Instinct MI300X успішно конкурують з Nvidia H100 у нових тестах MLPerf v4.1

З'явилися дані тестування прискорювачів штучного інтелекту AMD у новому наборі бенчмарків MLPerf Inference v4.1 від MLCommons. Цей тест симулює різні робочі навантаження, характерні для роботи з ШІ. За їх результатами, рішення AMD Instinct MI300X гідно конкурують з популярними прискорювачами Nvidia H100.

Протестовано серверні системи на базі нових процесорів AMD EPYC Turin, які використовують ядра на новій архітектурі Zen 5. Для оцінки продуктивності AMD представила результати прискорювачів Instinct MI300X, що працювали в складі системи Supermicro AS-8125GS-TNMR2. Графічні процесори працюють на відкритій програмній платформі AMD ROCm.

Бенчмарк здебільшого зосереджений на використанні моделі ШІ LLaMA2-70B із 70 мільярдами параметрів. Тести проведені в автономному режимі, який сфокусований на максимальній пропускній здатності токенів на секунду, та в серверних сценаріях, де імітуються запити в реальному часі з обмеженою затримкою.

Прискорювачі AMD Instinct MI300X успішно конкурують з Nvidia H100 у нових тестах MLPerf v4.1

Сервер із процесором EPYC 9374F Genoa і вісьмома прискорювачами Instinct MI300X показав результат 21028 токенів/сек у серверних сценаріях, що максимально близько до результату 21605 токенів/сек серверної системи Nvidia DGX100 із процесором Xeon. А система на базі нового процесора EPYC Turin показала найкращий результат у 22021 токенів/сек.

Прискорювачі AMD Instinct MI300X успішно конкурують з Nvidia H100 у нових тестах MLPerf v4.1

В офлайнових тестах Nvidia DGX100 утримує лідерство, хоча різниця з конфігурацією Turin + MI300X мінімальна. Це показує, що рішення AMD для ШІ не поступаються надпопулярним Nvidia H100.

Прискорювачі AMD Instinct MI300X успішно конкурують з Nvidia H100 у нових тестах MLPerf v4.1

Instinct MI300X використовує чип на архітектурі CDNA 3 та оснащується 192 ГБ пам'яті HBM3. Швидкісна шина Infinity Fabric дає змогу ефективно об'єднувати ці пристрої в обчислювальні кластери. AMD говорить про майже лінійне масштабування продуктивності при переході від одного прискорювача до восьми MI300X. Завдяки великому обсягу пам'яті платформа AMD має хороший потенціал для підтримки нових великих мовних моделей. Це вже сприяло партнерству AMD і Meta для підтримки LLaMa 3.1 405B.

Джерело:
TechPowerUp

Ще новини:

Arctic приймає замовлення на міні-холодильник

Помічена GeForce RTX 5090 з більшою кількістю блоків ROP, ніж зазначено в специфікаціях

На підході серія NVMe-накопичувачів Kingston Fury Renegade G5 з підтримкою PCIe 5.0

Останні огляди:

Огляд та тестування відеокарти ASUS TUF Gaming GeForce RTX 5090 32GB OC Edition. Порівняння з GeForce RTX 4090 та іншими опонентами

Огляд та тестування процесора Intel Core Ultra 7 265K та платформи LGA 1851. Черговий «плиточний» представник

Огляд 14″ хромбука-трансформера Acer Chromebook Plus Spin 514