Известный китайский производитель видеокарт выпустил собственный графический процессор для искусственного интеллекта. Компания Moore Threads известна благодаря потребительским видеокартам для китайского рынка. Эти устройства обладают неплохими техническими характеристиками, но сомнительной реальной производительностью в играх, хотя компания постоянно улучшает программную поддержку.
Теперь компания предлагает свой ускоритель для ИИ на базе собственного мощного GPU архитектуры MUSA 3-го поколения. Moore Threads MTT S4000 обладает производительностью 25 Тфлопс в вычислениях FP32 и 200 TOPS в тензорных вычислениях INT8. Устройство оснащено 48 гигабайтами памяти GDDR6 16 Гбит/с при общей способности 768 ГБ/с. Ускоритель поддерживает скоростной интерфейс MTLink 1.0 и PCIe Gen5. Прошлая версия ускорителя MTT для ИИ демонстрировала пиковую производительность FP32 до 15,2 Тфлопс и была оснащена 32 ГБ. То есть для компании Moore Threads скачок производительности существенный. Новый продукт ориентирован для установки в серверные системы и выполнен в двухслотовом формате с пассивным охлаждением.
Также MTT S4000 может работать в качестве видеокарты для многопотокового вывода изображения на 96 дисплеев 1080p или на 4 дисплея 8K. Ускоритель поставляется с набором программных инструментов USIFY, которые обеспечивают совместимость с платформой NVIDIA CUDA. Графический процессор MTT S4000 используется в вычислительных решениях KUAE, аналогичных системам NVIDIA DGX. Одна система KUAE MCCX D800 задействует 8 ускорителей MTT S4000, поддерживает масштабирование и возможность плавного расширения рабочих систем. MTT S4000 и системы KUAE поддерживают новейшие модели LLM, такие как LLaMA, GLM, Aquila, Baichuan, GPT, Bloom, Yuyan, и могут обрабатывать до 130 миллиардов параметров.
Первые 1000 графических процессоров MTT S4000 будут размещены в первом крупном вычислительном кластере Китая для поддержки рабочих нагрузок ИИ.
Источник:
Wccftech