Компания IBM официально анонсировала собственные чипы для работы с искусственным интеллектом. Это процессор Telum II и ускорители искусственного интеллекта Spyre для мэйнфреймов серии IBM Z. Данные чипы ускорят традиционные нагрузки ИИ вместе с большими языковыми моделями LLM на серверных системах IBM.

Процессор Telum II получил восемь высокопроизводительных ядер, работающих на частоте 5,5 ГГц. На каждое ядро приходится 36 МБ кэш-памяти L2, а общий объем встроенной кэш-памяти составляет 360 МБ. Кэш-память виртуального четвертого уровня поддерживает объем 2,88 ГБ на каждый процессорный блок, что на 40% больше относительно первого поколения Telum. Новые ядра имеют улучшенное предсказание ветвлений и 160 регистров при уменьшении энергопотребления на 15%.

Процессор получил встроенный ускоритель искусственного интеллекта для быстрых операций вывода ИИ с малыми задержками и высокой пропускной способностью. Такой ускоритель обеспечивает производительность 24 TOPS на один процессор, 192 TOPS на блок и 768 TOPS на систему. Также в процессор встроен новый блок ускорения ввода-вывода DPU, который увеличивает плотность передачи данных на 50%.

Telum II производится по технологии Samsung 5HPP и содержит 43 миллиарда транзисторов на кристалле площадью 600 мм2.

Ускорители Spyre являются решением корпоративного уровня. Они обеспечивают производительность в задачах ИИ более 300 TOPS при объеме памяти LPDDR5 128 ГБ. В конфигурации из 8 таких ускорителей в системе IBM общая память достигает 1 ТБ. Каждый ускоритель Spyre AI имеет 32 вычислительных ядра, которые поддерживают типы данных INT4, INT8, FP8 и FP16. TDP такого устройства составляет скромные 75 Вт.

IBM планирует поставлять готовые решения с процессорами Telum II корпоративным клиентам уже в 2025 году. Ускоритель Spyre еще находится в статусе ранней технической версии, но его поставки тоже должны начать в следующем году.

Источник:
Wccftech