Китайская компания DeepSeek, которая занимается разработками в сфере искусственного интеллекта, выпустила открытую версию своей модели ИИ DeepSeek-R1. Этот ИИ силен в рассуждениях, как и недавно запущенный o1 от OpenAI. Главным преимуществом DeepSeek-R1 является бесплатный доступ, поскольку модель построена на открытой платформе Hugging Face. OpenAI предоставляет доступ к передовой модели o1 по платной подписке, и специально для нее даже ввели дорогой тариф ChatGPT Pro за $200 в месяц.

У ИИ o1 от OpenAI появился конкурент от китайской компании DeepSeek

Китайские разработчики утверждают, что их модель R1 в ряде специализированных тестов обходит o1. В частности, она показывает более высокие результаты в AIME, MATH-500 и SWE-bench Verified. Тест AIME использует для тестирования разные модели ИИ, MATH-500 сконцентрирован на математических задачах, а SWE-bench Verified на задачах программирования. В представленном техническом отчете упоминается, что модель R1 содержит 671 миллиард параметров, что очень много. И чем больше параметров, тем эффективнее ИИ решает задачи. Но кроме такой полной версии DeepSeek выпустила облегченные версии на 1,5 миллиарда параметров и 70 миллиардов параметров. Самая простая модель может автономно работать даже на ноутбуке, а самая большая модель может функционировать только на вычислительных мощностях крупного вычислительного центра. Эта полная модель доступна через API DeepSeek в платном режиме, но цены на 90%-95% ниже, чем o1 от OpenAI.

Специалисты отмечают, что модель обучалась на данных, которые подверглись фильтрации со стороны регуляторных органов Китая. Поэтому мнение R1 относительно некоторых фактов, например о статусе Тайваня, может не совпадать с принятой точкой зрения в западных странах.

Источник:
TechCrunch