Компанія IBM офіційно анонсувала власні чипи для роботи зі штучним інтелектом. Це процесор Telum II та прискорювачі штучного інтелекту Spyre для мейнфреймів серії IBM Z. Дані чипи прискорять традиційні навантаження ШІ разом із великими мовними моделями LLM на серверних системах IBM.
Процесор Telum II отримав вісім високопродуктивних ядер, що працюють на частоті 5,5 ГГц. На кожне ядро припадає 36 МБ кеш-пам'яті L2, а загальний обсяг вбудованої кеш-пам'яті становить 360 МБ. Кеш-пам'ять віртуального четвертого рівня підтримує об'єм 2,88 ГБ на кожен процесорний блок, що на 40% більше відносно першого покоління Telum. Нові ядра мають поліпшене передбачення розгалужень і 160 регістрів при зменшенні енергоспоживання на 15%.
Процесор отримав вбудований прискорювач штучного інтелекту для швидких операцій виведення ШІ з малими затримками та високою пропускною здатністю. Такий прискорювач забезпечує продуктивність 24 TOPS на один процесор, 192 TOPS на блок і 768 TOPS на систему. Також у процесор вбудовано новий блок прискорення введення-виведення DPU, який збільшує щільність передачі даних на 50%.
Telum II виробляється за технологією Samsung 5HPP та містить 43 мільярди транзисторів на кристалі площею 600 мм2.
Прискорювачі Spyre є рішенням корпоративного рівня. Вони забезпечують продуктивність у завданнях ШІ понад 300 TOPS з обсягом пам'яті LPDDR5 128 ГБ. У конфігурації з 8 таких прискорювачів у системі IBM загальна пам'ять сягає 1 ТБ. Кожен прискорювач Spyre AI має 32 обчислювальних ядра, які підтримують типи даних INT4, INT8, FP8 і FP16. TDP такого пристрою становить скромні 75 Вт.
IBM планує постачати готові рішення з процесорами Telum II корпоративним клієнтам уже у 2025 році. Прискорювач Spyre ще перебуває у статусі ранньої технічної версії, але його постачання теж мають почати наступного року.
Джерело:
Wccftech