Китайська компанія DeepSeek, яка займається розробками у сфері штучного інтелекту, випустила відкриту версію своєї моделі ШІ DeepSeek-R1. Цей ШІ сильний у міркуваннях, як і нещодавно запущений o1 від OpenAI. Головною перевагою DeepSeek-R1 є безплатний доступ, оскільки модель побудована на відкритій платформі Hugging Face. OpenAI надає доступ до передової моделі o1 за платною підпискою, і спеціально для неї навіть ввели дорогий тариф ChatGPT Pro за $200 на місяць.
Китайські розробники стверджують, що їхня модель R1 у низці спеціалізованих тестів обходить o1. Зокрема, вона показує вищі результати в AIME, MATH-500 та SWE-bench Verified. Тест AIME використовує для тестування різні моделі ШІ, MATH-500 сконцентрований на математичних завданнях, а SWE-bench Verified на завданнях програмування. У представленому технічному звіті згадується, що модель R1 містить 671 мільярд параметрів, що дуже багато. І чим більше параметрів, тим ефективніше ШІ вирішує завдання.
Але крім такої повної версії DeepSeek випустила полегшені версії на 1,5 мільярда та 70 мільярдів параметрів. Найпростіша модель може автономно працювати навіть на ноутбуці, а найбільша модель може функціонувати тільки на обчислювальних потужностях великого обчислювального центру. Ця повна модель доступна через API DeepSeek у платному режимі, але ціни на 90%-95% нижчі за o1 від OpenAI.
Фахівці зазначають, що модель навчалася на даних, які зазнали фільтрації з боку регуляторних органів Китаю. Тому думка R1 щодо деяких фактів, наприклад про статус Тайваню, може не збігатися з прийнятою думкою в західних країнах.
Джерело:
TechCrunch